Anthropologie avisó a todo el mundo tecnológico la semana pasada con un anuncio sin precedentes: había desarrollado un modelo de inteligencia artificial tan avanzado que era demasiado peligroso divulgarlo al público. Anthropic dice que el nuevo modelo de lenguaje de frontera, Cloud Myths Preview, “remodelará la ciberseguridad”.
Anthropic también anunció Estructura del Proyecto GlasswingUn grupo de organizaciones al que solo se podía acceder mediante invitación, incluidos algunos de los mayores competidores de Anthropic, probaron la vista previa de Cloud Mythos y aseguraron su infraestructura.
Antropólogo Dr. Vista previa de Claude Mythos “Se han encontrado miles de vulnerabilidades de alta gravedad, incluidas algunas Todos los principales sistemas operativos y navegadores web.(Énfasis en el original.) La compañía dijo que el Proyecto Glasswing era necesario “para ayudar a proteger el software más importante del mundo”.
Para el viernes, CNBC informó Que el presidente de la Reserva Federal, Jerome Powell, y el secretario del Tesoro, Scott Besant, convocaron a los sumos sacerdotes de las finanzas (también conocidos como directores ejecutivos bancarios) a una reunión de emergencia sobre el nuevo modelo. New York Times El autor Thomas Friedman se preocupaba por un futuro “aterrador” en el que cualquier adolescente armado con un terrón podría piratear la red eléctrica local.
La reacción al avance de Claude Mythos se dividió rápidamente en líneas predecibles. Los impulsores de la IA elogiaron el nuevo modelo como prueba de que la inteligencia artificial general (AGI) se está acercando y elogiaron a Anthropic por implementarlo de manera tan responsable.
Los críticos y los escépticos de la IA han calificado el Proyecto Glasswing como un gran truco publicitario.
Entonces, ¿cuál es?
Para averiguarlo, Mashable revisó las afirmaciones de Anthropic y habló con expertos en inteligencia artificial y ciberseguridad.
¿Qué es la vista previa de Claude Mythos?
Claude Mythos es un nuevo modelo de lenguaje grande que, según Anthropic, funciona significativamente mejor que Claude Opus 4.6, que es en gran medida un El mejor modelo de IA del mundo.Especialmente en ciberseguridad.
“En nuestras pruebas, Cloud Mythos Preview muestra un salto impresionante en las capacidades cibernéticas con respecto a los modelos anteriores, incluida la capacidad de descubrir y explotar de forma autónoma vulnerabilidades de día cero en los principales sistemas operativos y navegadores web”, se lee. Tarjeta del sistema Claude Mythos.
¿Son los mitos de Claude un síntoma de AGI?
La Inteligencia General Artificial se refiere a una IA superinteligente que puede realizar tareas mucho mejor que los humanos. No sería exagerado decir que toda nuestra economía se estructura en torno a él. Buscar AGIMientras Antropología, Google, Meta, xAI y OpenAI invierten cientos de miles de millones de dólares en una nueva carrera armamentista
Si Claude Mithos es tan capaz como Anthropic, ¿sería ese un ejemplo de AGI? La tarjeta modelo aborda esta pregunta directamente y Anthropic cree que está más cerca de AGI.
Claude Mithos En una sección sobre riesgos de seguridad, Antropic escribe: “Los riesgos actuales son bajos. Pero vemos señales de advertencia de que mantenerlos bajos puede ser un gran desafío si las capacidades continúan avanzando rápidamente (por ejemplo, hasta el punto de poderosos sistemas de inteligencia artificial sobrehumanos)”. Por supuesto, Anthropic tiene un fuerte incentivo financiero para promover esta creencia.
Este gráfico muestra cómo Mythos se compara con modelos antropomórficos anteriores en la puntuación ECI, que combina múltiples puntos de referencia.
Crédito: Antropología
Al final, el modelo de tarjeta de Claude Mithos es más conservador de lo que sugieren las reacciones en línea.
Por ejemplo, cuando la tarjeta modelo Claude Mythos haciendo Demuestre que este modelo se desempeña por encima de la línea de tendencia de los modelos antropogénicos anteriores, Anthropic dice que sí. No Mostrar evidencia de superación personal o crecimiento repetitivo. (“Los avances que podemos detectar se pueden atribuir con confianza a la investigación humana, no a la ayuda de la IA”).
Razones para pensar que el Proyecto Glasswing es un truco publicitario
No me obliguen a tocar mi cartel: “(Cuando) un vendedor de IA le diga que la IA es una tecnología imparable que cambiará el mundo, del orden de una revolución agrícola… debería tomar esta predicción como lo que es: un argumento de venta”.
Escribí estas palabras de advertencia en respuesta a un artículo del director ejecutivo de Anthropologie, Dario Amodi, que advertía sobre los peligros potencialmente catastróficos de la IA. Anthropic también tiene un historial de emitir advertencias nefastas sobre sus modelos de IA.
Quizás recuerdes la historia del modelo antropomórfico que intentó “chantajear” al director ejecutivo de una empresa para que no la cerrara. en realidad, Antropológicamente diseñó un entorno de prueba. Donde el chantaje era un resultado posible. Esto puede parecerse más a una captura digital que a un mal comportamiento del modelo real.
Entonces, ¿es Claude Mythos el último ejemplo del problema Chicken Little de la industria?
En X, la ingeniera de seguridad en inteligencia artificial, Heidi Khalaf, enumera varias preguntas abiertas que arrojan dudas sobre las afirmaciones de Anthropic.
Este tweet no está disponible actualmente. Se está cargando o eliminando.
Anthropic dijo que se encontraron miles de vulnerabilidades de día cero en la vista previa de Claude Mithos. Pero Khalaf dijo que el antropólogo omitió datos clave necesarios para evaluar la afirmación: la tasa de falsos positivos, cómo se comparan los mitos de la nube con las herramientas de ciberseguridad existentes y exactamente cuánta revisión humana manual se necesitaba.
Velocidad de la luz triturable
“Publicar una publicación de marketing con un lenguaje deliberadamente vago que claramente oscurece la evidencia que Anthropic necesita para fundamentar sus afirmaciones pone en duda si están tratando de recaudar más inversiones”, dijo Khalaf a Mashable. “También sirve a su imagen de ‘la seguridad es lo primero’ porque son capaces de enmarcar la falta de divulgación pública, incluso como un servicio público limitado para una evaluación independiente, mientras oscurece la capacidad incluso de los expertos para validar sus afirmaciones”.
Nos hemos comunicado repetidamente con Anthropic con respecto a estas inquietudes, pero la compañía no ha respondido. Actualizaremos este artículo si lo hacen. En la tarjeta del sistema Cloud Mythos, Anthropic escribió que se publicarán más datos en las próximas semanas a medida que se parcheen y corrijan los errores encontrados en Mythos.
Gary Marcus, experto en inteligencia artificial, autor y destacado crítico de la máquina exagerada de LLM, inicialmente le dijo a Mashable que era demasiado pronto para saber si Claude Mythos representaba un nuevo tipo de amenaza.
Pero Marcus se ha vuelto más escéptico desde que hablamos con él, y recientemente Escribió en X. Ese mito “no era tan aterrador” como parecía al principio. “Amigos, pueden relajarse. El mito no es una ganancia exponencial fuera de tendencia”, dijo. escribió.
Este tweet no está disponible actualmente. Se está cargando o eliminando.
Los expertos en ciberseguridad dijeron a Mashable que es muy poco probable que Claude Mythos pueda usarse para “apagar las luces” o derribar infraestructura crítica.
“Las afirmaciones sobre el uso catastrófico de Mythos tergiversan significativamente los modelos de amenazas, los riesgos de ciberseguridad y la capacidad de propagar esos riesgos de maneras que en realidad pueden conducir a incidentes críticos para la seguridad”, nos dijo Khalaf. “No es tan simple como preguntarle a un modelo con Anthropic: ‘Hackea este sistema’. Publicaciones de blogs técnicos Demostrando la necesidad de experiencia que los antropólogos minimizan en sus publicaciones de marketing.”
Otros expertos expresaron escepticismo, aunque reconocieron que el mito representa un riesgo real, algo que también afirmó Marcus.
“Se podría argumentar que no necesitaba un anuncio público”, dijo. Div GargUn investigador y fundador de IA de Stanford AGI, Inc.
“Sin embargo, al final, la decisión de limitar el acceso a quienes desarrollan y mantienen software crítico es exactamente lo que se quiere que haga una empresa en tales circunstancias… Es fácil criticar el acceso limitado, pero si no lo controlan, se obtendrán peores resultados”.
Tal Kolender, fundador y director ejecutivo de Cyber Security Firm recursoClaude le dijo a Mashable que herramientas como Mythos son peligrosas porque pueden aprovechar el descubrimiento.
“Es un teatro corporativo brillante”, dice Collender. “Etiquetar un modelo como ‘demasiado peligroso para revelarlo al público’ es ciertamente una flexibilidad de marketing porque inmediatamente crea mística y señala un enorme poder a los inversores. Pero detrás del truco de relaciones públicas, hay una verdad muy real, muy mundana… la industria de la seguridad cibernética en realidad no tiene un problema de ‘detección’. Ya nos estamos ahogando en herramientas que tienen un proceso automatizado para descubrir. Escala sin precedentes”.
TL;DR: Una semana después del lanzamiento del avance de Claude Mythos, algunas de las afirmaciones más importantes de Anthropic sobre el modelo parecen mucho más vagas, dicen los expertos. Sin embargo, reconocen que Claude Mythos y otras herramientas similares suponen un riesgo real.
Aún así, hay muchas razones legítimas para estar nerviosos por el nuevo modelo de frontera.
Avance de Claude Mythos Razones para pensar es Una amenaza real para la ciberseguridad global
en New York TimesEl autor Thomas Friedman evoca un escenario juegos de guerraDonde un adolescente piratea la red eléctrica local después de la escuela.
Este escenario parece aún más remoto una semana después. Pero aquí hay otro escenario posible: un grupo sofisticado de piratas informáticos utiliza una herramienta como Cloud Myth para encontrar vulnerabilidades de día cero en nuestra infraestructura digital, lanzando ataques más rápido de lo que las organizaciones pueden reaccionar.
Y ese escenario debería preocuparte.
Si Claude Mithos no es una herramienta que pueda hacer eso, la mayoría de los expertos coinciden en que dicha herramienta no está lejos.
Y algunos de los principales expertos en ciberseguridad del mundo ciertamente parecen preocupados.
“He encontrado más errores en las últimas semanas (con Claude Mithos) que en toda mi vida combinada”, dijo Nicholas Carlini, un científico investigador asociado con Anthropic y Google DeepMind. Sitio web del Proyecto Glasswing.
“En Linux, encontramos una serie de vulnerabilidades en las que, como usuario sin permiso, podía ascender a administrador ejecutando algún binario en mi máquina”, dijo Carlini.
esta semana, Instituto de seguridad de IA Claude ha publicado sus hallazgos sobre el poder de los Mitos y proporciona una verificación independiente de que representa un avance real.

AISI es la organización de investigación del Departamento de Ciencia y Tecnología del Gobierno del Reino Unido.
Crédito: AISI
El Claude Mithos ha superado pruebas de ciberseguridad que ningún otro modelo ha completado jamás, obteniendo puntuaciones más altas que cualquier otro modelo de vanguardia en prácticamente todas las pruebas.
“Nuestras pruebas muestran que Mythos Preview puede explotar sistemas con posturas de seguridad débiles, y es probable que se desarrollen más modelos con estas capacidades”, concluyó AISI.
Este tweet no está disponible actualmente. Se está cargando o eliminando.
AISI también identificó algunas limitaciones con Claude Mythos, que afectarían su eficacia en situaciones del mundo real.
Entonces, ¿el lanzamiento de Mythos por parte de Anthropic es una gestión responsable de la IA o un marketing de autoservicio? Los expertos con los que hablé dijeron que estas opciones no son mutuamente excluyentes.
“Yo diría que son ambas cosas, y eso no es una crítica”, dijo Xu. “Cualquier lanzamiento de plataforma importante en esta era se verá diferente para diferentes audiencias dependiendo de su prominencia y su tolerancia al miedo. Lo que me preocupa es si la intención es real, y la evidencia que he visto en Anthropic lo dice”.
Como suele ocurrir con los titulares que infunden miedo sobre la IA, la realidad es más complicada.
“Personalmente, no me voy a dormir preocupado porque un niño hackee la red eléctrica de Mythos, pero eso no significa que la preocupación sea imaginaria”, dijo Howie XuDirector de Innovación y Inteligencia Artificial del General. “Estamos en un punto de inflexión en el que las ventajas creativas y colaborativas de estas herramientas son enormes, y la infraestructura de seguridad no se ha puesto al día. Esa es exactamente la brecha que me mantiene ocupado. Incluso la probabilidad fraccionaria de un incidente grave es tan alta, por eso mi principal objetivo es construir una capa de confianza y seguridad en la era de los agentes”.
Finalmente, como indica el estrés antrópico en el modelo de mitos de la nube, estas herramientas probablemente beneficiarán a los defensores de la ciberseguridad más que a los piratas informáticos a largo plazo. Y en el corto plazo, puede estar justificado un enfoque más cauteloso, como el modelado con el Proyecto Glasswing.
TL;DR: Claude Mythos tiene formidables capacidades de codificación de ciberseguridad y representa una amenaza real. Sin embargo, si los piratas informáticos tienen acceso a herramientas de inteligencia artificial como Claude Mithos, también lo tendrán las empresas que se defienden contra tales ataques.
sujeto
Inteligencia artificial











