GPT-5.5 Cyber
El modelo GPT-5.5 Cyber demostró oficialmente su rendimiento ofensivo ante el Instituto de Seguridad de la Inteligencia Artificial británico. El análisis técnico confirma que la plataforma de OpenAI tiene capacidad verificada para ejecutar simulaciones de intrusión informática autónomamente. Esta validación posiciona a la herramienta junto a la arquitectura Mythos de Anthropic como los únicos dos desarrollos capaces de resolver cadenas de ataque complejas de principio a fin.
Evaluación técnica de GPT-5.5 Cyber en entornos controlados
La agencia gubernamental sometió el sistema a una batería compuesta por 95 tareas de ciberseguridad con formato Capture The Flag. Los ingenieros dividieron las pruebas en cuatro niveles para medir la progresión del razonamiento. El modelo resolvió problemas específicos que incluían ingeniería inversa de código, explotación de vulnerabilidades web críticas y ruptura de protocolos de criptografía empresarial.
Las pruebas básicas fueron resueltas sin esfuerzo computacional relevante. El rendimiento crítico apareció en la evaluación diseñada junto a Irregular y Crystal Peak. Los analistas plantearon escenarios que requerían la explotación de desbordamientos de memoria en sistemas emulados. El programa analizó bases de firmware sin acceso al código fuente original, detectando brechas de seguridad ocultas.
En pruebas de nivel experto, la arquitectura registró una tasa de éxito del 71.4 por ciento. Esta métrica supera los registros de la generación anterior. La mejora refleja una optimización en la capacidad de programación a largo plazo de las redes de OpenAI, superando los resultados documentados previamente con GPT-5.4.
Ejecución autónoma en la simulación The Last Ones
El vector más exigente documentado fue el entorno The Last Ones. Esta red cerrada simula una infraestructura corporativa real. El perímetro cuenta con veinte hosts distribuidos en cuatro subredes aisladas. El agente inicia su ejecución desde un terminal externo, sin credenciales previas ni privilegios.
El modelo ejecutó una cadena de intrusión de 32 pasos diferentes. Los registros muestran que el sistema comenzó realizando reconocimiento pasivo de la red. Posteriormente procedió a la explotación de credenciales mediante fuerza bruta optimizada. El agente ejecutó desplazamiento lateral entre máquinas evadiendo contramedidas de red.
La acción más compleja consistió en realizar un pivote estratégico aprovechando una vulnerabilidad insertada en la cadena de suministro de integración y despliegue continuo. La simulación terminó cuando el modelo exfiltró una base de datos interna emulada. Los auditores de seguridad estiman que un experto en pruebas de penetración requiere 20 horas de trabajo ininterrumpido para completar este flujo de ataque.
Comparativa de rendimiento en ciberataques
La agencia comparó los registros de éxito obtenidos por los modelos más avanzados disponibles actualmente bajo las mismas restricciones de tiempo y hardware computacional.
| Modelo evaluado | Éxito en nivel experto | Tasa en The Last Ones | Empresa creadora |
|---|---|---|---|
| GPT-5.5 Cyber | 71.4 % | 2 de 10 intentos | OpenAI |
| Mythos Preview | 68.6 % | 3 de 10 intentos | Anthropic |
| GPT-5.4 | 52.4 % | 0 de 10 intentos | OpenAI |
| Opus 4.7 | 48.6 % | 0 de 10 intentos | Anthropic |
Implicaciones del nivel de razonamiento ofensivo
Las pruebas del AISI miden exclusivamente capacidades técnicas puras en entornos de aislamiento y no reflejan el comportamiento de las herramientas comerciales abiertas al público general. OpenAI mantiene el acceso restringido a investigadores autorizados. Los expertos indican que estas capacidades ofensivas emergen naturalmente por las mejoras matemáticas en la retención de contexto.
La autonomía de estos agentes plantea desafíos técnicos profundos. El desarrollo de herramientas con capacidad de planificación ha provocado ajustes internos en las empresas. Análisis recientes muestran que modelos como ChatGPT pueden alterar sus respuestas durante pruebas de evaluación, subrayando la importancia del escrutinio en agentes de alta capacidad. Las iteraciones actuales de los modelos de lenguaje apuntan firmemente a la resolución de problemas lógicos aplicados a entornos de producción cibernética.
Fuente: WIRED en Español – Reporte del Instituto de Seguridad de la IA del Reino Unido