sábado, 13 junio, 2026

Anthropic desarrolla una IA con capacidades avanzadas de ciberseguridad y decide no lanzarla al público

La empresa de inteligencia artificial Anthropic confirmó la creación de un modelo experimental, Claude Mythos, que demostró una habilidad excepcional para identificar vulnerabilidades críticas. Debido al riesgo potencial, la compañía optó por no liberarlo y limitar su uso a un entorno controlado.

La compañía de inteligencia artificial Anthropic informó sobre el desarrollo de un nuevo modelo experimental, denominado Claude Mythos, cuyas capacidades en el ámbito de la ciberseguridad han generado un amplio debate en la industria tecnológica. Según la empresa, durante pruebas internas, el sistema demostró una habilidad excepcional para detectar, explotar y encadenar vulnerabilidades informáticas de alta gravedad, incluso en sistemas ampliamente auditados.

Anthropic señaló que, en las evaluaciones, Claude Mythos encontró miles de fallas de seguridad, incluidas algunas en todos los principales sistemas operativos y navegadores web. Varias de estas vulnerabilidades habían pasado inadvertidas durante años, a pesar de haber sido analizadas por expertos y herramientas automatizadas. En un caso concreto, el modelo identificó una vulnerabilidad de 27 años en el sistema OpenBSD, reconocido por su enfoque en la seguridad.

La compañía reconoció que, en manos equivocadas, un sistema con estas capacidades podría facilitar ciberataques contra infraestructuras críticas, como hospitales o redes eléctricas, con consecuencias potencialmente graves. Frente a este escenario, Anthropic decidió no liberar el modelo al público general, calificando el riesgo como inaceptable.

En su lugar, Claude Mythos será utilizado de manera restringida por más de 40 empresas dentro del marco del Proyecto Glasswing, una iniciativa orientada a reforzar defensas. Entre las compañías seleccionadas figuran Amazon, Google, Apple, Nvidia, CrowdStrike y JPMorgan Chase. El objetivo es que estas organizaciones utilicen la herramienta para detectar fallos en sus propios sistemas antes de que capacidades similares estén disponibles de forma abierta.

Newton Cheng, líder del equipo Frontier Red Team de Anthropic, explicó: «No tenemos previsto que la versión preliminar de Claude Mythos esté disponible para el público en general debido a sus capacidades de ciberseguridad». La empresa aclaró que busca aprender cómo podría implementar modelos de esta clase a gran escala una vez que existan marcos de seguridad adecuados.

En un informe interno, Anthropic detalló que versiones tempranas del modelo mostraron comportamientos preocupantes, como acciones destructivas imprudentes e intentos de escapar de su entorno de pruebas. La decisión de mantenerlo en reserva responde, según la compañía, directamente a la magnitud de lo que el sistema es capaz de hacer, describiéndolo como un salto cualitativo en habilidades cibernéticas.

Más Noticias

Noticias
Relacionadas

Gobierno de Ghana confirmó diálogos con Canadá tras negar la entrada de Thomas Partey para disputar el Mundial 2026

El gobierno de Ghana mantiene conversaciones con Canadá para revertir la negativa de visado que impide a Thomas Partey ingresar al país y jugar el Mundial 2026.

El mapa geopolítico del Mundial 2026: por qué la Premier League revalida su título de “la mejor liga del mundo”

Más del 16% de los futbolistas del Mundial 2026 juegan en la Premier League; la liga inglesa duplica a la Bundesliga y La Liga. El contraste con las ligas americanas y el caso de la Selección Argentina.

Así le fue a Brasil en sus últimos cinco debuts en Mundiales

Brasil se enfrenta a Marruecos en su debut del Mundial 2026. El equipo acumula 17 triunfos y tres empates en sus últimos 20 debuts mundialistas.

Pulp se presentó en Buenos Aires en el marco de su gira latinoamericana

La banda británica Pulp, liderada por Jarvis Cocker, se presentó en el Movistar Arena de Buenos Aires el 12 de junio de 2025, en el marco de su gira latinoamericana.