Andrej Karpathy se incorporó a Anthropic para trabajar en el preentrenamiento de Claude, una de las áreas más sensibles y costosas en la creación de modelos de IA. El movimiento fue confirmado por el propio investigador.

En términos simples, el preentrenamiento es la etapa en la que un modelo procesa enormes volúmenes de información para construir su base de conocimiento y sus capacidades iniciales. Después vienen otras fases de ajuste, seguridad y producto, pero esa primera capa sigue siendo decisiva. También es una de las más caras por el uso de datos, infraestructura y capacidad de cómputo.

La noticia tiene peso por dos razones. La primera es el perfil de Karpathy: fue miembro fundador de OpenAI, trabajó en Tesla entre 2017 y 2022 en tareas ligadas a IA, visión por computador y Autopilot, y después se convirtió en una de las voces técnicas más seguidas para aprender cómo funcionan estos sistemas.

La segunda es el lugar al que llega dentro de Anthropic: no va a una capa comercial ni a un producto periférico, sino al trabajo base que alimenta a Claude.

Andrej Karpathy entra al núcleo técnico de Claude

andrej-karpathy
Andrej Karpathy

Anthropic ubicó a Andrej Karpathy en su equipo de preentrenamiento, responsable de las grandes corridas de entrenamiento que dan a Claude su conocimiento y capacidades fundamentales. Según informó la empresa, Karpathy ayudará a lanzar un nuevo equipo enfocado en usar Claude para acelerar la investigación de preentrenamiento. Ese detalle importa porque sugiere que Anthropic no solo quiere más potencia bruta, sino también más velocidad y mejores métodos para desarrollar su próxima generación de modelos.

Karpathy encaja bien en ese frente. En OpenAI trabajó en aprendizaje profundo y visión por computador. En Tesla lideró equipos vinculados al sistema Autopilot, donde el reto no era solo diseñar modelos, sino hacerlos funcionar a gran escala con restricciones reales. Más tarde, fuera de las grandes empresas, dedicó tiempo a educación técnica y publicó explicaciones que ayudaron a miles de personas a entender redes neuronales, modelos de lenguaje y entrenamiento desde cero.

Esa combinación entre investigación, ingeniería aplicada y capacidad para explicar procesos complejos vuelve más fácil entender por qué Anthropic lo quiere justo en esta etapa. El preentrenamiento no es una función vistosa para el usuario final, pero sí define buena parte de lo que después se ve en calidad, estabilidad y alcance del producto.

Para Anthropic, la llegada de Andrej Karpathy es una señal de prioridades. En vez de presentar una función nueva de consumo, la empresa muestra que sigue invirtiendo en la base técnica de Claude. Eso tiene efecto interno y externo: por un lado, suma experiencia en uno de los cuellos de botella más complejos de la IA; por otro, refuerza la imagen de Anthropic como destino atractivo para investigadores de primer nivel.

El movimiento además encaja con una fase de consolidación dentro del sector. Las empresas ya no compiten solo por chips, clientes o alianzas empresariales, sino también por investigadores capaces de mejorar el proceso completo de desarrollo. En ese contexto, la incorporación de Karpathy tiene valor técnico y simbólico. No prueba una “victoria” definitiva de Anthropic, pero sí muestra que la empresa sigue atrayendo perfiles con peso real en la historia reciente de la IA.

No es el único indicio de esa estrategia. Anthropic viene reforzando distintas capas de su plataforma, algo que ya habíamos visto con la compra Stainless para reforzar los cimientos de sus agentes de IA. La diferencia ahora es que el foco no está en herramientas externas, sino en el corazón mismo del entrenamiento de modelos.

Andrej Karpathy señaló en su anuncio público que quería volver a investigación y desarrollo, y que mantiene su interés por la educación para retomarlo más adelante. Esa mezcla entre laboratorio y divulgación ha sido parte de su perfil durante años. Ahora vuelve al frente donde se define buena parte del futuro inmediato de Claude.

Fuentes:

Recommended Posts
0
IBM refuerza su seguridad con Project Glasswing de AnthropicCodex se acerca a los datos empresariales con la alianza entre OpenAI y Dell