Google y Thinking Machines Lab sellan acuerdo de IA

La startup de inteligencia artificial Thinking Machines Lab, fundada por la ex directiva de OpenAI Mira Murati, ha firmado un acuerdo de infraestructura multimillonario con Google Cloud para acelerar el desarrollo de sus modelos fundacionales. El acuerdo garantiza a la compañía acceso prioritario a clústeres de computación de alto rendimiento, fundamentales para el entrenamiento de sistemas de inteligencia artificial de próxima generación que superen las capacidades de los modelos actuales del mercado.

La infraestructura técnica de Thinking Machines Lab

El núcleo de esta alianza comercial radica en la provisión masiva de capacidad de cómputo. La nueva empresa utilizará la arquitectura avanzada de Google Cloud, que incluye miles de aceleradores de última generación. Según los detalles técnicos revelados sobre la operación, el despliegue no se limitará únicamente a las unidades de procesamiento tensorial (TPU) propietarias de Alphabet, sino que integrará sistemas equipados con las arquitecturas más recientes de Nvidia, proporcionando un entorno de hardware híbrido.

El entrenamiento de modelos de lenguaje a gran escala requiere un ancho de banda de red extraordinario y una latencia mínima entre nodos. La red óptica de topología de hipercubo de Google proporciona exactamente esta capacidad, permitiendo que miles de GPUs operen en sincronía como un único superordenador. Este nivel de infraestructura es el principal cuello de botella actual en la industria, donde la escasez de silicio avanzado dicta el ritmo de la investigación y el desarrollo.

Independencia y computación por acciones

La decisión de apoyarse en Google Cloud marca una estrategia clara por parte del equipo directivo. Tras su salida de OpenAI, Murati y su equipo técnico buscaron asegurar recursos computacionales sin depender del ecosistema de Microsoft Azure, que actualmente monopoliza la infraestructura de su antiguo empleador. Este movimiento diversifica el panorama del hardware empresarial y valida la competitividad de la nube de Google frente a sus rivales directos en el sector.

Además, este tipo de contratos suelen estructurarse bajo modelos de computación por acciones (compute-for-equity), donde el proveedor de la nube invierte capacidad de procesamiento a cambio de participaciones en la empresa emergente. Esto permite a los desarrolladores esquivar las rondas de financiación de capital riesgo puras, mitigando la dilución accionarial en las fases tempranas del proyecto y asegurando al mismo tiempo el recurso más crítico: los teraflops continuos.

Capacidades de los futuros modelos

El ecosistema de alianzas en la industria está mutando rápidamente. Mientras que otras figuras clave han abandonado proyectos consolidados, como se vio cuando la directora de robótica de OpenAI dimitió recientemente, la creación de nuevas entidades requiere capital intensivo casi de inmediato. Los modelos fundacionales exigen presupuestos de miles de millones de dólares solo para cubrir los costes eléctricos y de refrigeración de los centros de datos durante las fases de preentrenamiento.

El objetivo principal del equipo de investigación es desarrollar sistemas de inteligencia general artificial enfocados en el razonamiento lógico complejo y la planificación a largo plazo. A diferencia de las arquitecturas tradicionales basadas exclusivamente en la predicción del siguiente token, los nuevos modelos requerirán un tiempo de inferencia dinámico. Esto significa que el modelo dedicará más ciclos de computación antes de emitir una respuesta, simulando un proceso cognitivo deliberativo que exige una infraestructura aún más robusta durante la fase de despliegue comercial para mantener latencias operativas aceptables.

Los requerimientos energéticos para estos nuevos clústeres son colosales. Un centro de datos moderno diseñado específicamente para estos cálculos puede consumir por encima de los 100 megavatios, requiriendo sistemas de refrigeración líquida directa al chip para mantener las temperaturas operativas estables. La elección de Google Cloud responde también a la eficiencia de su infraestructura, que reporta uno de los índices de eficiencia energética más bajos de la industria, optimizando el rendimiento por cada vatio consumido durante los cálculos de punto flotante de baja precisión.

Impacto en el mercado de la IA

La inyección de capacidad de cómputo en una nueva startup independiente altera las proyecciones de mercado para el cierre de la década. Los desarrolladores de código abierto han logrado hitos reduciendo el tamaño de los modelos para ejecución local, pero la frontera del rendimiento sigue dominada por aquellos con acceso a centros de datos masivos. La apuesta de Google funciona como una cobertura estratégica frente a la alianza consolidada entre Microsoft y OpenAI, y complementa sus propios esfuerzos de investigación interna que culminaron recientemente con tecnologías como el modelo Nano Banana para procesamiento visual rápido.

La fecha exacta para la presentación del primer modelo fundacional no ha sido divulgada oficialmente. Los ciclos de entrenamiento para arquitecturas de billones de parámetros oscilan actualmente entre los tres y los seis meses, asumiendo que no se produzcan fallos de hardware críticos en las unidades de procesamiento tensorial que obliguen a reiniciar los puntos de control del sistema en la red de comunicaciones. Los analistas del sector estiman que los costes operativos de la startup superarán los 500 millones de dólares anuales únicamente en ancho de banda de memoria y procesamiento.

Fuente: TechCrunch