Plataforma de RAG agentivos llega a Gemini Enterprise

Google presentó se nueva plataforma de RAG agentivos para Gemini Enterprise, una arquitectura de recuperación y generación pensada para preguntas empresariales que no se resuelven con una sola búsqueda.

En vez de tomar una consulta, recuperar unos pocos fragmentos y responder de inmediato, el sistema divide la tarea en pasos, decide qué fuentes revisar, comprueba si el contexto alcanzó y, si falta algo, vuelve a buscar antes de generar la respuesta.

RAG (retrieval augmented generation), en términos simples, es una forma de usar un modelo con documentos recuperados en el momento de responder. El problema es que el RAG clásico suele funcionar bien en preguntas directas, pero se queda corto cuando la respuesta depende de unir datos dispersos.

Google Research lo explica con ejemplos donde una consulta obliga a pasar por varias fuentes: un proyecto puede mencionar solo un identificador de servidor y otro sistema guardar las especificaciones; un expediente médico puede tener medicamentos en un documento, dieta en otro y reacciones adversas en un tercero. En esos casos, una sola recuperación inicial no basta.

RAG clásico vs la nueva plataforma de RAG agentivos

Según Google Research, su plataforma de RAG agentivos usa varios componentes coordinados. Un orquestador recibe la consulta, un planificador decide qué corpus (conjunto de datos para búsqueda) conviene revisar, un reescritor convierte la pregunta en búsquedas más precisas y un agente de recuperación reúne contexto. La diferencia central está en un verificador de “contexto suficiente”: revisa si los fragmentos encontrados realmente alcanzan para contestar todo lo pedido. Si detecta un vacío, devuelve una señal para que el sistema siga buscando en vez de completar con una respuesta incompleta.

Esa parte es la que Google destaca como novedad práctica. En la documentación de RAG Cross Corpus Retrieval, Google Cloud describe un enfoque agentivo para orquestar búsquedas entre varios corpus gestionados por RAG Engine. La plataforma de RAG agentivos mantiene un mapa de corpus disponibles con sus descripciones técnicas, compara la consulta con esas descripciones y enruta cada parte de la pregunta a la base más adecuada, en lugar de buscar de forma indiscriminada en todas.

Google afirma que este esquema mejoró la precisión hasta en 34% frente al RAG estándar en conjuntos de evaluación de factualidad. En una prueba sobre FramesQA, citada en la entrada de Research, el sistema alcanzó 90,1% de acierto en un escenario de recuperación entre cuatro corpus, con una latencia similar a la del caso de corpus único. Esa cifra no equivale automáticamente a cualquier implementación empresarial, pero sí da una señal concreta de hacia dónde quiere empujar Google su plataforma de RAG agentivos: menos respuestas cortadas cuando la información correcta está repartida en equipos, repositorios y bases distintas.

El movimiento encaja con una necesidad muy concreta en IA empresarial: responder con base documental cuando la evidencia no vive en un solo repositorio. Para una empresa, eso puede significar consultar contratos, manuales técnicos, tickets, políticas internas y bases operativas sin obligar a un empleado a enlazar cada fuente a mano. En la práctica, la ventaja no es solo “más búsqueda”, sino una plataforma de RAG agentivos que intenta justificar de dónde salió cada parte de la respuesta y cuándo todavía falta contexto.

Ahí entra también la trazabilidad. La documentación de observabilidad de la plataforma de RAG agentivos de Gemini Enterprise muestra una vista de trazas para inspeccionar la ejecución paso a paso del agente, incluidos entradas del modelo, respuestas y llamadas a herramientas. Google describe esa traza como un registro factual e inmutable del comportamiento del agente. Además, separa metadatos operativos de los contenidos sensibles y permite correlacionar registros y almacenamiento configurado por la organización.

También hay límites prácticos. La función de RAG Cross Corpus Retrieval aparece disponible solo en us-central1, y Google advierte que la descripción de cada corpus es clave para que el sistema elija bien a qué base enviar la consulta. Esa descripción, además, no se puede editar después de crear el corpus. En otras palabras, el rendimiento no depende solo del modelo: también depende de cómo una empresa describa, separe y gobierne sus fuentes de información.

La novedad consolida el rumbo de Gemini Enterprise: llevar el foco desde el chatbot general hacia una plataforma de RAG agentivos donde importa cada vez más cómo conectar varias fuentes, detectar lo que falta y dejar rastro de cómo se obtuvo la respuesta. En el mercado de agentes empresariales, ese tipo de detalle pesa más que una simple promesa de “razonamiento más rápido”.

Fuentes

Roberto Meza Ferrari