Home Smartwatch Google lanza Gemini 3.1 Pro: puntos de referencia, cómo probarlo

Google lanza Gemini 3.1 Pro: puntos de referencia, cómo probarlo

19

Google lanzó el jueves su último modelo insignia, el Gemini 3.1 Pro. Google dice que el Gemini 3.1 Pro logró el doble del rendimiento verificado del 3 Pro en ARC-AGI-2, un punto de referencia popular que mide el razonamiento lógico de un modelo.

Google lanzó originalmente Gemini 3 y 3 Pro en noviembre, y esta nueva versión muestra la rapidez con la que las empresas de inteligencia artificial están introduciendo modelos nuevos y actualizados. Gemini 3.1 Pro es el nuevo modelo insignia que impulsa Gemini y varias herramientas de inteligencia artificial de Google, como Gemini 3 Deep Think. Google dice que está diseñado para proporcionar soluciones más creativas.

“3.1 Pro está diseñado para tareas donde una respuesta simple no es suficiente, tomando lógica avanzada y haciéndola útil para desafíos difíciles” publicación de blog de google Afirma que “esta inteligencia avanzada puede ayudar con aplicaciones prácticas, ya sea que esté buscando una explicación visual clara de un tema complejo, una forma de sintetizar datos en una sola vista o darle vida a un proyecto creativo”.

Ver también:

GPT-5.2 vs Gemini 3: cómo se comparan los dos modelos pesados ​​en puntos de referencia, precio y conjunto de características

Esto es lo que sabemos hasta ahora sobre Gemini 3.1 Pro, incluido cómo se compara con los últimos modelos de Anthropic y OpenAI, y cómo probarlo usted mismo.

Cómo probar Gemini 3.1 Pro

A partir de hoy, Google implementará Gemini 3.1 Pro en las aplicaciones Gemini, Gemini APIA y Notebook LM. Los usuarios gratuitos podrán probar 3.1 Pro en la aplicación Gemini, pero los usuarios pagos con los planes Google AI Pro y AI Ultra tendrán tasas de uso más altas. Dentro de Notebook LM, sólo estos usuarios de pago tendrán acceso a 3.1 Pro, al menos por ahora. Los codificadores y usuarios empresariales también pueden acceder al nuevo modelo central a través de Desarrolladores, y las empresas pueden acceder a 3.1 a través de AI Studio, AntiGravity, Vertex AI, Gemini Enterprise, Gemini CLI y Android Studio.

Gemini 3.1 Pro ya estaba disponible para los editores de Mashable que usaban Gemini. Para probarlo usted mismo, diríjase Géminis en el escritorio O abra la aplicación móvil Gemini.

Izquierda:
Dos resultados del mismo mensaje de animación.
Crédito: Google

Bien:
Crédito: Google


Por qué es importante Gemini 3.1 Pro

Cuando Google lanzó el Gemini 3 Pro en noviembre, el modelo era tan impresionante que llevó al director ejecutivo de OpenAI, Sam Altman, a declarar un código rojo. Según se informa, OpenAI está comenzando a perder usuarios de ChatGPT frente a Gemini, ya que Gemini 3 Pro AI encabeza la clasificación. El último modelo central de ChatGPT, GPT-5.2, ha caído en la clasificación Tablas de clasificación tipo arena (anteriormente conocido como LMArena), ha perdido terreno significativo frente a competidores como Google, Anthropic y xAI.

Gemini 3 Pro ya supera a GPT-5.2 en muchos puntos de referencia y, con un modelo de pensamiento más avanzado, Gemini puede llegar aún más lejos.

Gemini 3.1 Pro: rendimiento de referencia

Google ha publicado datos de rendimiento comparativos que muestran que Gemini 3.1 Pro supera a los modelos Gemini anteriores, Claude Sonnet 4.6, Claude Opus 4.6 y GPT-5.2. Sin embargo, el nuevo modelo de codificación de OpenAI, GPT-5.3-Codex, superó a Gemini 3.1 Pro en el punto de referencia verificado SWE-Bench Pro, según el propio Google.

Los aspectos más destacados de los resultados comparativos de Gemini 3.1 Pro incluyen:

  • 44,4 por ciento en el examen final de humanidadEn comparación con el 40,0 por ciento de Claude Opus 4.6 y el 34,5 por ciento de GPT-5.2

  • 77,1 por ciento en ARC-AGI-2En comparación con el 31,1 por ciento del Gemini 3 Pro, el 68,8 por ciento del Claude Opus 4.6 y el 52,9 por ciento del GPT-5.2

  • 94,3 por ciento en GPQA DiamanteEn comparación con el 91,9 por ciento del Gemini 3 Pro, el 91,3 por ciento del Claude Opus 4.6 y el 92,4 por ciento del GPT-5.2

  • 80,6 por ciento verificado en SWE-BenchEn comparación con el 76,2 por ciento del Gemini 3 Pro, el 80,8 por ciento del Claude Opus 4.6 y el 80,0 por ciento del GPT-5.2

  • 54,2 por ciento en SWE-Bench Pro (Público).En comparación con el 43,3 por ciento de Gemini 3 Pro, el 55,6 por ciento de GPT-5.2 y el 56,8 por ciento de GPT-5.3-Codex.

  • 92,6 por ciento en MMLUEn comparación con el 91,1 por ciento de Claude Opus 4.6 y el 89,6 por ciento de GPT-5.2

Google publicó una imagen que muestra los resultados completos de las pruebas comparativas de Gemini 3.1 Pro:


Divulgación: Ziff Davis, la empresa matriz de Mashable, presentó una demanda contra OpenAI en abril de 2025, alegando que violó los derechos de autor de Ziff Davis al entrenar y operar sus sistemas de IA.

Enlace fuente