
Claude Mythos Preview ya está aquí y es tan bueno que asusta. Literalmente. Anthropic acaba de presentarlo en público, pero lo ha hecho con tanta cautela que ni siquiera podremos probarlo y solo estará disponible para ciertos socios tecnológicos. Eso es frustrante e inquietante al mismo tiempo, pero también razonable.
Tan potente que asusta. El 24 de febrero de 2026 los ingenieros de Anthropic pudieron probar por primera vez su nuevo modelo de inteligencia artificial, al que han llamado Claude Mythos Preview. Nada más hacerlo se dieron cuenta de una cosa:
"demostró un salto espectacular en sus cibercapacidades con respecto a modelos previos, incluida la capacidad de descubrir y explotar de forma autónoma vulnerabilidades zero-day en los principales sistemas operativos y navegadores web del mercado".
Amenaza para la cibersguridad mundial. Este hallazgo dejó claro a los responsables de Anthropic que aunque dicha capacidad lo hacen muy valioso para propósitos defensivos, también plantea riesgos claros si el modelo se ofreciera de forma global. Así, un ciberdelinccuente podría aprovecharlo para encontrar vulnerabilidades en todo tipo de sistemas y explotarlas. La compañía desarrollaba hace unas horas ese análisis de Mythos como amenaza para la ciberseguridad en un post en su blog, y por ejemplo destacaba cómo Mythos encontró una vulnerabilidad (ahora corregida) que llevaba 27 años presente en OpenBSD, un sistema operativo precisamente reconocido por su fortísima seguridad. Había más ejemplos, y todos ellos dejaban clara la conclusión:
Mythos es demasiado potente para que lo use el común de los mortales.
Superior en todos los benchmarks, y en algunos casos como en USAMO (matemáticas), el salto es sencillamente increíble. Fuente: Anthropic.
El mejor de la historia según los benchmarks. Anthropic ha publicado un profundísimo informe sobre este modelo con su "tarjeta de sistema". Entre los datos presentes está por ejemplo su rendimiento en benchmarks, donde ha barrido a GPT 5.4, a Gemini 3.1 Pro y también a Claude Ous 4.6, que hasta ahora era el mejor modelo del mundo en casi todas las pruebas de rendimiento. Aunque en algunos casos el salto no es espectacular, en otros como USAMO —resolución de problemas matemáticos— Mythos alcanza prácticamente la perfección.
Apenas alucina... En esa tarjeta de sistema también se habla en detalle de como Claude Mythos Preview presenta una tasa de alucinaciones drásticamente inferior a la de Claude Opus 4.6 y modelos anteriores. Es además capaz de decir "no lo sé" si no tiene información suficiente para contestar, algo que reduce las alucinaciones por exceso de confianza.
... pero cuando lo hace, cuidado. El documento advierte sobre un nuevo fenómeno: cuando el modelo falla en algunas tareas complejas, las "alucinaciones" no son erroers obvios, sino fallos técnicos extremadamente sutiles y bien argumentados. Esto es peligroso porque la respuesta parece totalmente correcta para expertos, lo que requiere una verificación muy profunda.
Proyecto Glasswing. Esa potencia y capacidad ha hecho que el modelo solo vaya a estar disponible a través de un programa "defensivo" al que han llamado Proyecto Glasswing y que será exclusivo para algunos socios tecnológicos de Anthropic. En concreto AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Fundación Linux, Microsoft, NVIDIA y Palo Alto Networks. Todas ellas tendrán el privilegio (y la responsabilidad) de tener acceso a Claude Mythos Preview para identificar vulnerabilidades y exploits y corregirlos antes de que actores nocivos puedan hacerlo.
Mythos Preview "es solo el principio". Aunque este modelo es el más capaz que se ha visto hasta ahora, al menos según los benchmarks y datos presentados por Anthropic, la empresa asegura que "no vemos razones para pensar que Mythos Preview es el punto en el que las capacidades de ciberseguridad de los modelos de lenguaje alcancen su cima". Aseguran que esperan que los modelos sigan mejorando en los próximos meses y años, aunque ciertamente este nuevo modelo esté en otro nivel.
En Xataka | OpenAI y Anthropic se han propuesto lo imposible: perder 85.000 millones de dólares en un año y sobrevivir
-
La noticia Claude Mythos es un modelo de IA tan potente que da miedo. Así que Anthropic ha decidido que no vas a poder usarlo fue publicada originalmente en Xataka por Javier Pastor .
☞ El artículo completo original de Javier Pastor lo puedes ver aquí

No hay comentarios.:
Publicar un comentario