Project Deal es el nuevo experimento con el que Anthropic puso a agentes de IA a comprar, vender y negociar en nombre de personas reales dentro de un mercado interno de su oficina. El resultado fue mucho más concreto que una simple demo: 69 participantes cerraron 186 acuerdos por más de 4.000 dólares en bienes reales, desde una bicicleta hasta una bolsa con pelotas de ping pong, y el estudio dejó una señal relevante para el mercado de la IA.

La parte más llamativa no fue solo que el sistema funcionara, sino que los participantes representados por modelos más avanzados obtuvieron resultados objetivamente mejores. Según Anthropic, esos agentes lograron cerrar más operaciones y negociar precios más favorables. Aun así, los usuarios con modelos menos capaces casi no percibieron esa desventaja. Para una industria que está empujando con fuerza la automatización de tareas complejas, esa diferencia importa bastante.

La noticia encaja con una discusión más amplia sobre cómo llevar estos sistemas al trabajo real. Si tu empresa está mirando la adopción de IA en empresas, Project Deal ofrece una pista útil: no basta con tener un agente, también importa mucho qué modelo lo respalda y bajo qué reglas opera.

Qué mostró Project Deal sobre negociación, compras y ventas con IA

Anthropic montó un mercado tipo clasificados dentro de Slack y dejó que cada participante fuera representado por un agente personalizado de Claude. Antes de empezar, cada persona indicó qué quería vender, qué quería comprar, cuánto estaba dispuesta a pagar y qué estilo de negociación prefería. Con esa base, los agentes publicaron ofertas, hicieron contraofertas y cerraron acuerdos sin intervención humana durante la ejecución.

En la prueba principal, todos los participantes estuvieron representados por Claude Opus 4.5. En corridas paralelas para análisis interno, Anthropic mezcló Opus 4.5 con Claude Haiku 4.5 para comparar resultados. Ahí apareció el hallazgo más importante de Project Deal: los agentes basados en Opus lograron mejores precios. La compañía afirma que, en promedio, un vendedor representado por Opus obtuvo 2,68 dólares más por el mismo producto y un comprador representado por Opus pagó 2,45 dólares menos.

Anthropic también detectó que las instrucciones de estilo, como pedir una negociación agresiva o amistosa, tuvieron menos efecto que la calidad del modelo. En otras palabras, el peso principal no estuvo en el tono del agente, sino en su capacidad para manejar contexto, contraofertas y decisiones durante toda la transacción.

Project Deal no se presenta como evidencia definitiva de un mercado abierto lleno de agentes autónomos. La propia empresa lo describe como un piloto con una muestra limitada y autoseleccionada. Pero justamente por eso el trabajo resulta interesante: no se trata de una simulación abstracta con objetos ficticios, sino de intercambios reales entre personas y bienes reales.

Por qué Project Deal importa para empresas, plataformas y usuarios

La relevancia de Project Deal va más allá de una curiosidad de laboratorio. Si los agentes de IA empiezan a reservar servicios, negociar compras, comparar proveedores o mover presupuestos en nombre de usuarios y equipos, la diferencia entre un modelo fuerte y uno más débil puede traducirse en costos, márgenes y resultados desiguales. Y el dato más incómodo del experimento es que esa desigualdad puede pasar desapercibida.

Eso abre varias preguntas prácticas. La primera es de producto: si una plataforma promete automatizar compras o negociaciones, tendrá que explicar mejor qué puede hacer el agente, cuándo conviene supervisarlo y qué riesgos existen si dos partes usan modelos con distinto nivel de desempeño. La segunda es de mercado: la calidad del modelo puede convertirse en una ventaja comercial directa, no solo en una mejora técnica. La tercera es de gobernanza: si los usuarios no detectan con facilidad cuándo están obteniendo peores tratos, habrá más presión para medir resultados y no quedarse solo con la experiencia aparente.

Project Deal también llega en un momento en que varias tecnológicas están empujando agentes para tareas cada vez más largas y operativas. En ese contexto, Anthropic no solo mostró una función nueva, sino una idea concreta de hacia dónde podría moverse parte del trabajo digital: sistemas que no se limitan a responder, sino que ejecutan procesos y negocian en nombre del usuario.

Queda mucho por probar antes de ver algo así a gran escala fuera de un entorno controlado. Pero Project Deal ya entrega una conclusión útil y difícil de ignorar: cuando la IA entra en una negociación real, la calidad del modelo no es un detalle técnico, sino un factor económico.

Fuentes

Recommended Posts
0
DeepSeek V4 con 1 millón de contexto y foco en agentes de IAGemini Enterprise de Google como plataforma para agentes de IA