Ineffable Intelligence busca otros caminos para la IA

Ineffable Intelligence, la nueva startup de David Silver, levantó US$1.100 millones en una ronda semilla que la valora en US$5.100 millones. La cifra es inusual incluso para el mercado actual de inteligencia artificial, pero el punto más llamativo está en la tesis técnica: la compañía quiere construir sistemas que aprendan desde la experiencia, no solo desde grandes cantidades de texto, código, imágenes y otros datos humanos.

Silver no es un fundador cualquiera dentro de la IA. Fue una de las figuras centrales del trabajo de Google DeepMind en aprendizaje por refuerzo y aparece asociado a hitos como AlphaGo y AlphaZero. Ahora, desde Londres, propone llevar esa línea de investigación a un objetivo mucho más amplio: crear lo que Ineffable llama un “superlearner” (súper aprendiz), un sistema capaz de descubrir conocimientos y habilidades a partir de su interacción con un entorno.

La apuesta llega en un momento en que los grandes modelos de lenguaje, o LLM, dominan la conversación pública sobre IA. ChatGPT, Gemini, Claude y otros sistemas han demostrado el valor de entrenar modelos con enormes colecciones de datos humanos.

Pero Ineffable Intelligence parte de una crítica clara: si una IA aprende principalmente de lo que ya produjeron las personas, también puede quedar limitada por ese marco. Es una discusión conectada con los límites actuales de la IA ante tareas reales.

Ineffable Intelligence quiere entrenar agentes desde la experiencia

La página oficial de Ineffable Intelligence define su misión como la creación de “superlearners”, sistemas que descubren conocimiento desde su propia experiencia. La idea central no es hacer un chatbot más grande ni una interfaz más fluida, sino escalar el aprendizaje por refuerzo: una familia de técnicas donde un agente aprende mediante acciones, resultados y retroalimentación.

En simple, no se trata de mostrarle al sistema millones de ejemplos humanos para que imite patrones. Se trata de ponerlo en un entorno donde pueda probar, fallar, ajustar y mejorar. En los LLM, gran parte del aprendizaje inicial viene de observar lo que ya existe. En el enfoque que defiende Silver, el sistema debería adquirir habilidades explorando consecuencias, del mismo modo en que AlphaZero aprendió juegos como ajedrez, shogi y Go desde reglas básicas y autojuego.

Sequoia, uno de los inversionistas de la ronda, presentó la empresa como una apuesta por una “era de la experiencia”. Según esa visión, un agente entrenado sin preentrenamiento masivo en datos humanos podría desarrollar estrategias menos parecidas a las nuestras. Ese argumento se apoya en precedentes conocidos: AlphaGo sorprendió al mundo con la famosa jugada 37 contra Lee Sedol, y AlphaZero mostró que un sistema podía alcanzar niveles superhumanos en varios juegos sin partir de partidas humanas como guía directa.

Aun así, el salto desde juegos cerrados a problemas abiertos es enorme. En un tablero de Go, ajedrez o shogi, las reglas son claras y el objetivo está definido. En ciencia, robótica, software, diseño de materiales o planificación económica, el entorno es más ruidoso, las metas pueden cambiar y los errores pueden ser costosos. Por eso conviene leer la propuesta de Ineffable Intelligence como una ambición de investigación muy financiada, no como una prueba de que el problema ya esté resuelto.

El respaldo de Nvidia, Google y Reino Unido convierte la tesis en una señal de mercado

La ronda de US$1.100 millones no solo le da recursos a Ineffable Intelligence. También funciona como una señal sobre hacia dónde miran algunos de los inversionistas más influyentes del sector. TechCrunch informó que la compañía alcanzó una valoración de US$5.100 millones, mientras que Sovereign AI, el fondo británico dedicado a escalar empresas de IA del Reino Unido, confirmó su respaldo junto al British Business Bank.

El apoyo público británico muestra una dimensión estratégica. Reino Unido no solo quiere consumir modelos creados en otros países; quiere mantener laboratorios capaces de competir en investigación de frontera. Sovereign AI describe a Ineffable como una empresa anclada en el país, con acceso a capital, capacidad estatal y recursos de cómputo.

Para Nvidia y Google, el interés también es comprensible. Si el futuro de la IA requiere agentes que aprendan en entornos simulados, con ciclos intensivos de prueba y mejora, la demanda de cómputo podría seguir creciendo. Y para Google, la trayectoria de Silver conecta directamente con una de las líneas históricas más fuertes de DeepMind: usar aprendizaje por refuerzo para producir conductas que no dependen solo de copiar ejemplos humanos.

La parte ética y filantrópica también forma parte del relato. Silver ha dicho que las ganancias personales que obtenga de Ineffable serán destinadas a organizaciones benéficas de alto impacto, según reportó TechCrunch citando una entrevista previa. Es una declaración relevante, aunque no elimina las preguntas de fondo: quién controla sistemas más autónomos, cómo se evalúan sus riesgos y qué gobernanza se necesita si estos agentes llegan a operar en ámbitos sensibles.

Por ahora, Ineffable Intelligence representa una de las apuestas más claras contra la idea de que el avance de la IA depende únicamente de hacer crecer modelos de lenguaje. Su promesa es difícil de demostrar, pero radical: sistemas que no solo reproduzcan lo que ya escribimos, sino que aprendan a descubrir caminos propios.

La pregunta abierta es si esa ambición puede salir del terreno controlado de los juegos y convertirse en una tecnología útil, verificable y segura para problemas reales.

Fuentes

Mario Cuche