Home Smartwatch GPT-5.5 de OpenAI vs Claude Opus 4.7: ¿Cuál es mejor?

GPT-5.5 de OpenAI vs Claude Opus 4.7: ¿Cuál es mejor?

28

OpenAI lanzó su último modelo, GPT-5.5, el 23 de abril, apenas una semana después de la introducción de Anthropic Cloud Opus 4.7.

Como dos modelos líderes de dos laboratorios de inteligencia artificial líderes, queríamos ver cómo se comparan los nuevos modelos.

Alerta de spoiler: Creemos que Claude Opus 4.7 tiene una ventaja en codificación avanzada y agente, pero GPT-5.5 funciona mejor en la mayoría de los puntos de referencia.

Ver también:

El antropólogo dice que Claude Opus 4.7 tiene una tasa de honestidad del 92%, menos suplantación.

¿Quiere obtener más información sobre cómo aprovechar al máximo su tecnología? Suscríbase al boletín informativo sobre las mejores historias y ofertas de Mashable hoy

GPT-5.5 y Opus 4.7: clasificación

GPT-5.5 aún no está clasificado en todas las tablas de clasificación de IA, pero debería ser muy competitivo con Claude Opus 4.7. Como en la clasificación de pruebas comparativas verificadas. Premio ArcaGPT-5.5 supera a Opus 4.7 (más sobre esto a continuación).

en popular Tabla de clasificación de arenasSegún las pruebas de usuarios, Claude Opus 4.7 Thinking ocupa el primer puesto general. Curiosamente, Opus 4.7 está actualmente clasificado por debajo de Opus 4.6, aunque esto cambiará con el tiempo. Actualmente, los nuevos modelos antropomórficos ocupan los cuatro primeros puestos del ranking. Es más, el inédito Claude Mythos de Anthropic no está clasificado y Anthropic dice que funciona mejor que Opus 4.7.

en Índice de capacidad de la era (ECI) En la tabla de clasificación, GPT-5.4 Pro tiene actualmente la puntuación más alta. (El ECI combina varios criterios en una sola puntuación). Encontrará Gemini 3.1 Pro y GPT-5.4 en segundo y tercer lugar.

Ver también:

La capacidad de la IA para encontrar errores de software importantes crece un 490 % año tras año

GPT-5.5 y Opus 4.7: puntos de referencia

¿Cómo se comportan los nuevos modelos en las pruebas comparativas más habituales? Para esta prueba nos basamos principalmente en las puntuaciones autoinformadas de OpenAI y Anthropic. Ambos obtienen altas calificaciones, como era de esperar, pero el GPT-5.5 definitivamente tiene la ventaja.

Así es como se comparan en algunas de las principales pruebas comparativas de IA:

  • SWE-Bench Pro: puntuación GPT-5.5 58,6; Opus 4.7 obtuvo un 64,3 por ciento

  • Terminal-Banco 2.0: GPT-5.5 obtuvo un 82,7 por ciento; Opus 4.7 obtuvo un 69,4 por ciento

  • La última prueba de la humanidad: GPT-5.5 recibió el 40,6 por ciento; Opus 4.7 obtuvo un 31,2 por ciento*

  • La última prueba de la humanidad (con herramientas): GPT-5.5 obtuvo el 52,2 por ciento; Opus 4.7 obtuvo un 54,7 por ciento

  • NavegarComp: GPT-5.5 obtuvo el 84,4 por ciento; Opus 4.7 obtuvo un 79,3 por ciento

  • Diamante GPQA: GPT-5.5 obtuvo una puntuación del 93,6 por ciento; Opus 4.7 obtuvo un 94,2 por ciento

  • ARC-AGI-1 (verificado): GPT-5.5 (Alto) obtiene una puntuación del 94,5 por ciento; Claude obtuvo 4,7 (alto) 92 por ciento**

  • ARC-AGI-2 (Verificado): GPT-5.5 (Alto) obtuvo un 83,3 por ciento; Claude obtuvo 4,7 (alto) 68,3 por ciento**

* Para la última prueba de la humanidad, citamos Resultados HLE verificados del análisis sintético.. En particular, Anthropic informa que el Opus 4.7 obtuvo una puntuación del 46,9 por ciento en esta prueba.

**Ver resultados completos en Sitio web del Premio Arca.

GPT 5.5 y Opus 4.7: disponibilidad y precios

OpenAI dice que GPT 5.5 es “nuestro modelo más inteligente e intuitivo de usar hasta ahora”. Claude Opus 4.7 es el modelo más avanzado de Anthropic disponible para los usuarios de Claude, aunque Anthropic dice que el Claude Mythos Preview inédito es un modelo más capaz en general.

Como tal, sólo los clientes que pagan pueden acceder a estos modelos fronterizos.

GPT 5.5 solo está disponible en ChatGPT y Codex para usuarios de OpenAI Plus, Pro, Business y Enterprise (lo siento, usuarios de ChatGPT Go). Los usuarios Pro, Business y Enterprise también pueden acceder a GPT-5.5 Pro, mientras que los clientes Plus, Pro, Business y Enterprise pueden acceder a GPT-5.5 Thinking.

OpenAI está promocionando GPT-5.5 en su API, aunque la compañía dice que es más eficiente con los tokens. El precio de la API comienza en “$5 por 1 millón de tokens de entrada y $30 por 1 millón de tokens de salida con una ventana de contexto de 1 millón”.

Opus 4.7 está disponible para clientes Pro y Max; A través de la API, está disponible por “5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida”.

GPT-5.5 y Opus 4.7: conjunto de funciones

OpenAI dice que GPT-5.5 proporciona “mejoras significativas en la codificación de agentes, el uso de computadoras, el trabajo del conocimiento y la investigación científica básica”. El antropólogo dice que Claude Opus 4.7 mejora la codificación avanzada, la inteligencia visual y el análisis de documentos.

ChatGPT y Claude tienen el mismo conjunto de funciones generales, aunque existen algunas excepciones. En términos generales, puedes utilizar estos dos chatbots de IA para investigación, codificación, proyectos creativos y tareas profesionales diarias. Puede utilizar tanto los nuevos modelos en OpenAI como las plataformas de codificación de Anthropic, Codex y Claude Code.

Es más fácil hablar de diferencias que de similitudes. Aunque GPT-5.5 no es un modelo de imagen, dentro de ChatGPT puedes usar el nuevo Modelo ChatGPT Imagen 2.0. Anthropologie recientemente lanzado Diseño ClaudePero sólo ofrece visualización de datos, gráficos y diapositivas, no generación de imágenes completa. Entonces, si desea crear imágenes o gráficos interactivos para un proyecto, GPT-5.5 tendrá más herramientas disponibles para utilizar.

GPT-5.5 se puede utilizar para crear visualizaciones de datos complejas e interactivas.
Crédito: OpenAI

ChatGPT tiene más integraciones de aplicaciones y compras, aunque gracias a su reciente adquisición de OpenClaw, Anthropic tiene capacidades de agencia.

TL;DR: Si tuviéramos que elegir entre estos modelos para el trabajo profesional diario, ChatGPT tendría ventaja sobre el GPT-5.5 por su conjunto de funciones más amplio. Sin embargo, para codificación avanzada y agente, elegiríamos Claude Opus 4.7.


Divulgación: Ziff Davis, la empresa matriz de Mashable, presentó una demanda contra OpenAI en abril de 2025, alegando que violó los derechos de autor de Ziff Davis al entrenar y operar sus sistemas de IA.

Enlace fuente