Anthropic limita el acceso a Mythos: solo grandes tecnológicas podrán usar su IA ante riesgos de ciberataques

La compañía quiere que gigantes del sector como Amazon, Apple, Microsoft y Cisco puedan probar el modelo con sus propios productos

Google icon
Anthropic ha puesto en marcha el Proyecto Glasswing, una iniciativa que reúne a importantes actores tecnológicos. (Europa Press)

La startup Anthropic PBC ha tomado la decisión de restringir la disponibilidad de su más reciente modelo de inteligencia artificial, Mythos, a un grupo selecto de grandes empresas tecnológicas. El motivo principal es la preocupación de que este sistema, por su nivel de sofisticación, podría ser utilizado para facilitar ciberataques.

Antes de abrir el acceso al público, Anthropic quiere que gigantes del sector como Amazon, Apple, Microsoft y Cisco puedan probar el modelo con sus propios productos, identificar vulnerabilidades y compartir las conclusiones para reforzar la seguridad digital global. Así lo dio a conocer Bloomberg.

Proyecto Glasswing: colaboración para reforzar la ciberseguridad con IA

Anthropic ha puesto en marcha el Proyecto Glasswing, una iniciativa que reúne a importantes actores tecnológicos con el objetivo de testear Mythos en entornos reales y detectar posibles fallos de seguridad.

PUBLICIDAD

Claude Mythos es una IA que puede detectas fallos informáticos.

Según la compañía, las organizaciones participantes tendrán acceso anticipado al modelo y podrán emplearlo para analizar sus productos y sistemas, buscando vulnerabilidades que pudieran ser explotadas por agentes maliciosos. Los hallazgos se compartirán de manera colectiva, generando una red de defensa colaborativa frente a los riesgos emergentes de la inteligencia artificial avanzada.

La decisión de limitar el acceso responde a la creciente inquietud entre empresas y gobiernos sobre el potencial uso indebido de modelos de IA de última generación. Actualmente, la tecnología de inteligencia artificial ya se emplea en la ejecución de ciberataques sofisticados.

Anthropic cita como ejemplo un caso en el que un hacker utilizó herramientas de IA para vulnerar sistemas del gobierno mexicano. OpenAI, principal rival de Anthropic, también ha enfatizado recientemente los riesgos cibernéticos asociados a sus modelos y ha lanzado programas piloto enfocados en proteger primero a los defensores y no a los atacantes.

PUBLICIDAD

Según la compañía, las organizaciones participantes tendrán acceso anticipado al modelo y podrán emplearlo para analizar sus productos y sistemas. REUTERS/Dado Ruvic

Capacidades y riesgos identificados en el modelo Mythos

Durante sus pruebas internas, el equipo de seguridad de Anthropic descubrió que Mythos Preview era capaz de identificar y explotar vulnerabilidades en todos los principales sistemas operativos y navegadores web cuando el usuario lo solicitaba.

Según una entrada publicada en el blog de la empresa, los exploits generados no eran simples ni triviales; en una ocasión, el modelo escribió un exploit para un navegador que encadenaba cuatro vulnerabilidades diferentes.

Newton Cheng, responsable del esfuerzo cibernético en el Equipo Rojo Fronterizo de Anthropic, explicó que el desafío no solo afecta a una empresa, sino a toda la industria tecnológica y requiere la colaboración entre sector privado y gobiernos. “Lo que intentamos hacer con Glasswing es dar a los defensores una ventaja”, subrayó Cheng.

La tecnología de inteligencia artificial ya se emplea en la ejecución de ciberataques sofisticados. (Imagen Ilustrativa Infobae)

Colaboración con agencias y hallazgos relevantes

Anthropic ha mantenido conversaciones con funcionarios estadounidenses sobre las capacidades de Mythos en materia de seguridad, aunque no ha concretado con qué agencias específicas. Cheng confirmó que la compañía colabora con la Agencia de Ciberseguridad y Seguridad de las Infraestructuras y el Instituto Nacional de Normas y Tecnología para abordar estos retos.

Aunque Mythos fue concebido como un modelo de uso general y no específicamente para ciberseguridad, ya ha demostrado ser capaz de encontrar problemas críticos.

Entre los hallazgos, según Anthropic, se incluyen una vulnerabilidad de software con 27 años de antigüedad presente en aplicaciones clave de Internet, así como un fallo de 16 años en un popular programa de video que otras herramientas automatizadas habían pasado por alto tras millones de pruebas.

El acuerdo entre Anthropic y las grandes tecnológicas representa un cambio en la forma de gestionar la seguridad de modelos de IA cada vez más potentes. Antes de ofrecer Mythos al público, la empresa quiere utilizar los resultados del Proyecto Glasswing para definir los límites y medidas de protección necesarios para evitar usos maliciosos.

Más Noticias

WhatsApp estrena Archivo de Estados: así puedes guardar tus actualizaciones caducadas en Android

La función en fase beta guarda automáticamente las actualizaciones una vez que caducan y las reúne en un archivo privado accesible solo por el dueño de la cuenta

La apuesta de Warner Music en tecnología: compra Sureel AI para vigilar uso y monetización del contenido musical

La discográfica anunció la compra de Sureel AI, una startup especializada en rastrear cómo los modelos de IA utilizan música y otros activos creativos

Anthropic lanzó Claude Fable 5, el modelo de IA más poderoso: gratis hasta el 22 de junio y con un freno automático ante riesgos de ciberseguridad

La compañía abre por primera vez al público su familia Mythos, el escalón más alto de su arquitectura, con salvaguardas que redirigen las consultas sensibles a Claude Opus 4.8 y una nueva política de retención de datos que aplica incluso a los contratos de “retención cero”

Cómo activar el modo Messi en WhatsApp durante la Copa Mundial 2026

Los usuarios pueden liberar espacio de la aplicación móvil para que funcione de forma ágil y rápida, así como el jugador argentino en la cancha

La mitad de los estadounidenses teme que la IA pueda dejar sin trabajo a algún miembro de su familia

Una encuesta nacional revela que el 53% de la población observa como probable que los avances tecnológicos afecten la estabilidad laboral en su entorno cercano, mientras que el 73% expresa preocupación ante la rápida integración de sistemas automatizados en la vida diaria