Un grupo anónimo de usuarios de Discord dijo que hackeó una manera de acceder a la vista previa de Cloud Mythos, el nuevo modelo de IA que Anthropic afirma es demasiado poderoso para revelarlo.
Anthropic dice que Claude Mithos es “capaz de identificar y luego explotar vulnerabilidades de día cero en todos los principales sistemas operativos y navegadores web” y ha dado acceso al modelo a un grupo selecto de socios a través de una iniciativa llamada Proyecto Glasswing.
La compañía de inteligencia artificial dice que este enfoque solo por invitación permitirá a los líderes tecnológicos “proteger el software más crítico del mundo”. Pero necesita prestar más atención a la seguridad de su propio software.
como Bloomberg Según el informe, los usuarios de Discord no obtuvieron acceso a través de un hack sofisticado, sino que adivinaron la ubicación en línea del modelo basándose en convenciones de nombres antropomórficos anteriores, como se encontró. La reciente filtración de datos en Mercor, Una startup de IA, a principios de este mes.
¿Es Claude Mythos de Anthropic un gran truco o una verdadera amenaza a la seguridad? Lo que dicen los expertos.
Después de identificar dónde acceder a Claude Mythos, el grupo tuvo que aplicar estrategias adicionales. Un miembro del grupo ya recibió beneficios especiales como empleado de un contratista externo de Anthropic, informó Bloomberg.
Velocidad de la luz triturable
El grupo era parte de un canal privado de Discord. que se centra en encontrar información sobre modelos inéditos.
Un miembro del grupo le dijo a Bloomberg que no estaban usando Claude Mythos para propósitos nefastos, sino para tareas como crear sitios web simples. Sin embargo, afirman tener acceso a más modelos antropomórficos inéditos.
El equipo proporcionó a Bloomberg pruebas suficientes para confirmar que efectivamente habían violado la seguridad de Anthropic. Anthropic confirmó en un comunicado a Bloomberg que estaba al tanto de las afirmaciones y de la investigación.
En este momento, no hay indicios de que Claude Mythos haya sido infringido por otras partes no autorizadas. Aún así, Anthropic describe a Claude Mithos como una amenaza de seguridad que cambia el paradigma y que podría “remodelar la ciberseguridad” tal como la conocemos, en lo que respecta a cualquier acceso no autorizado, por decir lo menos.
¿Quiere obtener más información sobre cómo aprovechar al máximo su tecnología? Suscríbase al boletín informativo sobre las mejores historias y ofertas de Mashable hoy
sujeto
La inteligencia artificial es antropomórfica











