Anthropic investiga un posible acceso no autorizado a Mythos, su IA más potente y peligrosa

service
Compartir

Comparte este artículo

o copie el enlace

Un grupo de usuarios no autorizados habría accedido a Claude Mythos, el potente modelo de Anthropic que, hace unas semanas, encendió las alertas de la industria por su potencial para ser utilizado contra infraestructuras digitales críticas para la economía, la seguridad pública y la seguridad nacional.

De acuerdo con un reporte de Bloomberg, integrantes de un foro privado en línea obtuvieron acceso al sistema mediante la combinación de distintas técnicas, apoyándose en datos de un contratista externo de Anthropic y en “herramientas de análisis de internet de uso común”.


Claude Mythos Anthropic

Según Anthropic, Claude Mythos es capaz de identificar y explotar vulnerabilidades de día cero en los principales sistemas operativos y navegadores web, incluso a petición de usuarios sin conocimientos técnicos.


La empresa de inteligencia artificial (IA) señaló en un comunicado que ya investiga el caso. Sin embargo, hasta ahora no cuenta con evidencia que confirme un acceso indebido ni de que esta posible actividad haya provocado afectaciones en sus operaciones o sistemas.

El informe de Bloomberg detalla, con base en el testimonio de una fuente anónima, que quienes lograron ingresar sin autorización a Mythos participan en un canal de Discord enfocado en explorar información sobre modelos de IA aún no publicados.

El grupo habría conseguido acceso al sistema el mismo día de su presentación, tras deducir su ubicación en línea a partir de información filtrada luego de una brecha de seguridad sufrida por la firma de análisis de datos Mercor.

Desde entonces, los integrantes han utilizado Mythos de manera recurrente, aunque no con fines de ciberseguridad, según la persona citada por Bloomberg. Esta versión fue respaldada con capturas de pantalla y un video en vivo que muestran el uso del sistema presuntamente por usuarios del canal de Discord.

El potencial dañino de Mythos

Aunque el reporte sostiene que el grupo que accedió sin autorización “está interesado en experimentar con nuevos modelos, no en causar daños”, la situación despierta inquietudes frente a las advertencias emitidas por el propio equipo de Anthropic.

Claude Mythos es un modelo de propósito general con capacidades avanzadas de razonamiento, autonomía y programación, que supera a otros sistemas desarrollados por la compañía. En pruebas internas, mostró mejoras significativas en estas áreas, así como en la generación y gestión de código en comparación con su antecesor. No obstante, estas capacidades derivaron en un efecto inesperado, es decir, el sistema demostró una notable eficacia para identificar fallas y vulnerabilidades de software.

De acuerdo con documentos técnicos de Anthropic, Claude Mythos no solo puede detectar fallas con más de dos décadas de antigüedad, sino también identificar y explotar vulnerabilidades de día cero en sistemas operativos y navegadores web, además de generar exploits incluso de forma autónoma.

La empresa advierte que, debido a estas capacidades, personas sin conocimientos técnicos avanzados pueden llegar a emplear el sistema para descubrir y explotar vulnerabilidades complejas.

Anthropic investiga un posible acceso no autorizado a Mythos, su IA más potente y peligrosa
wpChatIcon
    wpChatIcon