Home Smartwatch Google no dirá con qué frecuencia Gemini 3.5 Flash alucina

Google no dirá con qué frecuencia Gemini 3.5 Flash alucina

25

A medida que la IA se integra en todos los aspectos de nuestras vidas, las alucinaciones por IA siguen siendo un problema persistente y complejo. Sin embargo, en el discurso de apertura de dos horas de Google I/O, donde Google introdujo una expansión masiva de la búsqueda por IA y un nuevo modelo predeterminado, Gemini 3.5 Flash, no se mencionó ninguna alucinación.

De manera similar, el Tarjeta de sistema flash Gemini 3.5 Ninguna mención de alucinaciones. La adulación está notoriamente ausente. Es particularmente notable que tanto Anthropologie como OpenAI informen públicamente datos sobre métricas como la frecuencia con la que sus modelos alucinan, inducen delirios o actúan de incógnito.

Entonces, a medida que Google hace que el modo AI y las descripciones generales de AI sean más visibles en la Búsqueda de Google, los usuarios no se dan cuenta de la probabilidad de que las respuestas contengan alucinaciones y errores de confianza.

Google fabrica herramientas de inteligencia artificial a veces Incluya advertencias como “Las respuestas de IA pueden contener errores”. Pero no hay ninguna revelación para los buscadores de que Las respuestas en modo Géminis e IA sólo pueden ser precisas entre el 68,8 y el 83,8 por ciento de las veces.

de donde resulta Los últimos datos de Google sobre la precisión de Gemini.

En respuesta a las preguntas de Mashable, un portavoz de Google dijo que la compañía planea publicar más información sobre el resto de la serie de modelos Gemini 3.5, así como la evaluación de seguridad del nuevo modelo, que se espera para junio.


Crédito: Google

Géminis, ¿qué tan precisos son el modo IA y la descripción general de la IA? Esto es lo más alto de una clase reprobada.

Google no informa los índices de fidelidad, disfraz o alucinaciones de sus últimos modelos. Sin embargo, en diciembre publicó un estudio basado en su precisión. HECHOS prueba de puesta a tierraUn punto de referencia creado por Google DeepMind para medir la precisión.

Información “Evalúa exhaustivamente la capacidad del modelo de lenguaje para producir texto realista y preciso”, y Gemini 3 Pro y Gemini 2.5 Pro encabezaron este punto de referencia.

Google informa que el Gemini 3 Pro tiene una puntuación de precisión general de 68,8. En muchas aulas, esto sería una sólida calificación de “F”, aunque se considera una puntuación alta para un modelo de IA.

En el punto de referencia de búsqueda FACTS, que mide la capacidad del modelo para “producir respuestas objetivas interactuando con una herramienta de búsqueda”. El Gemini 3 Pro obtiene una puntuación del 83,8 por ciento.

Tabla que muestra los modelos de IA puntuados en el punto de referencia de puesta a tierra de FACTS


Crédito: Google

El punto de referencia de búsqueda FACTS también mide la “tasa de cobertura” de los modelos, o la frecuencia con la que se niegan a responder una pregunta, el resultado deseado cuando se desconoce la respuesta. El Gemini 3 Pro tiene una “tasa de cobertura” significativamente menor que el GPT-5, el Claude 4.5 Opus, el Claude 4.5 Sonnet e incluso su predecesor, el Gemini 2.5 Pro.

¿Qué dice Google sobre las alucinaciones de la IA?

soltero En él aparecen referencias a alucinaciones. Tarjeta del sistema Gemini 3 Pro Publicado el 18 de noviembre de 2025. “Limitaciones conocidas: Gemini 3 Pro puede presentar algunas limitaciones comunes del modelo básico, como alucinaciones. También puede haber problemas ocasionales de lentitud o tiempo de espera”.

Este lenguaje repetitivo es similar al que se incluye Tarjeta del sistema serie Gemini 2lo que admite problemas adicionales. “Gemini 2.0 Flash puede presentar algunas de las limitaciones comunes del modelo básico, como alucinaciones, y limitaciones en torno a la comprensión causal, la deducción lógica compleja y el razonamiento contrafactual.(Énfasis añadido).

Las alucinaciones son en realidad una característica, no un error, de cómo funcionan los modelos de lenguaje de gran tamaño. Son algoritmos probabilísticos que predicen el siguiente token de una secuencia. Por definición, están prediciendo, no “conociendo” o “informando”.

“Las alucinaciones sólo pueden reducirse y nunca eliminarse” Niranjan KrishnanDijo a Mashable el jefe de Soluciones de IA, FPT Software. “Los grandes modelos de lenguaje son penalizados si suenan inciertos o vacilantes. No saben lo que es verdad, pero saben cómo parecer verdadero. Este sesgo genera errores de confianza. Los modelos no conocen sus limitaciones y no saben cuándo detenerse”.

Krishnan añade: “Tratar de eliminar las alucinaciones es un objetivo equivocado. El desafío final es crear sistemas que sepan cuándo decir: ‘No sé'”.

“Creo que los usuarios tienen derecho a esa información, especialmente considerando que si usas un chatbot de IA, por ejemplo, Claude o ChatGPT, estás eligiendo esa experiencia… pero cuando estás en Google, no todos eligen obtener una descripción general de la IA o interactuar con el modo IA. Están abriendo un motor de búsqueda que es una experiencia diferente a la que están usando ahora”.

– Klaudia Jaźwińska, Centro Tow de Periodismo Digital

Entonces, ¿por qué Google no informa las tasas de alucinaciones o adulación como sus principales competidores?

Gary MarcosCientíficos, escritores y Cassandra, la IA de Silicon Valleyle dijo a Mashable que “uno podría asumir que su desempeño allí no fue innovador o probablemente nos hubiéramos enterado”. “Un poco de claridad sobre cosas como las etiquetas nutricionales definitivamente sería algo bueno”, añadió.

Al ignorar las alucinaciones de la IA, Google está privando a los usuarios de información que podrían utilizar para evaluar los resultados de la IA.

Mashable contactó a Google para preguntarle sobre la falta de datos sobre alucinaciones Tarjeta del sistema Géminis. En respuesta, un portavoz de Google dijo: “Adoptamos un enfoque riguroso para definir y medir rasgos de personalidad como la ayuda, el tono y la adulación. Nuestro objetivo es entrenar modelos para proporcionar retroalimentación objetiva y directa que evite los halagos o simplemente refleje la perspectiva del usuario, manteniendo el sistema altamente manejable para los desarrolladores”.

El portavoz añadió:

Mejorar el realismo del modelo y la gestión de la personalidad es un esfuerzo científico continuo para nosotros. Si bien equilibrar la creatividad de un modelo con una precisión realista sigue siendo un desafío en toda la industria, las tasas de alucinaciones han disminuido constantemente a medida que las capacidades centrales del modelo han avanzado… Para protegernos continuamente contra resultados erróneos, invertimos mucho en políticas de seguridad sólidas, como sistemas pioneros de control de calidad automatizados. Búsqueda divertidaY como puntos de referencia de evaluación de código abierto Fundamentándose en HECHOS Para mejorar la precisión en tiempo real con seguimiento y cronometraje.

¿Por qué esto importa?

Miles de millones de personas confían en Google para encontrar información sobre todo, desde curiosidades aleatorias sobre celebridades hasta diagnósticos médicos que cambian sus vidas. Y Google ha dicho durante mucho tiempo que busca conocimientos, autoridad, experiencia y confiabilidad (o EEAT en la jerga de Google) para cuestiones de “su dinero o su vida” (YMYL).

Estos asuntos de YMYL incluyen “que puedan afectar significativamente la salud, la estabilidad financiera o la seguridad de las personas, o el bienestar de la sociedad”. Ahora, los usuarios están aprendiendo sobre estas cosas directamente en la Búsqueda de Google o en la aplicación Gemini, una herramienta que solo tiene una precisión de hasta el 83,8 por ciento.

Las alucinaciones de la IA también están envenenando nuestro cuerpo colectivo de conocimientos. Fortune informó recientemente esta información en un estudio. que encontró 4.000 referencias fabricadas por IA en casi 3.000 artículos médicos. De manera similar, a los abogados de todo el mundo se les permite incluir decisiones alucinatorias en sus escritos. uno Base de datos que rastrea alucinaciones legales Incluye 1.497 casos y contando.

La transformación de la IA de Google también está afectando a los editores que crean contenido que se basa en Gemini.

A medida que Google pasó a la búsqueda mediante IA, el tráfico a los sitios web de noticias se ha desplomado, un fenómeno descrito como “”Apocalipsis del tráfico“y”Armagedón de la IA“Para los editores.

Érase una vez, cuando Google se enorgullecía de su política de “no ser malvado”, la empresa Éxito definido Qué tan rápido los usuarios abandonan Google. “Quizás seamos las únicas personas en el mundo que podemos decir que nuestro objetivo es lograr que la gente abandone nuestro sitio web lo más rápido posible”. Ahora, Google quiere que los usuarios pasen el mayor tiempo posible en su jardín amurallado.

Para ser claros, el reportaje real (entrevistas, investigación, fotografía, videografía y la investigación a la antigua usanza) todavía lo realizan periodistas humanos. Pero en lugar de leer sobre la guerra de Irán en Google Los New York TimesEl modo Gemini y AI te llevará directamente a la página de búsqueda.

En cualquier otro contexto, los periodistas lo llaman plagio. Y como informó anteriormente Mashable, los chatbots de IA como Gemini son particularmente malos para analizar noticias de última hora, cuando la información errónea se difunde rápidamente.

Klaudia JaźwińskaUn periodista e investigador para esto. Centro Tau de Periodismo Digitalle dijo a Mashable que Google debería hacer más para informar a los usuarios sobre las limitaciones de la IA.

“Creo que los usuarios tienen derecho a esa información, especialmente considerando el hecho de que si usas un chatbot de IA, por ejemplo, como Claude o ChatGPT, estás eligiendo esa experiencia”, dijo Jaźwińska. “Pero cuando estás en Google, no todo el mundo elige obtener una visión general de la IA o utilizar el modo IA. Están abriendo un motor de búsqueda que siempre han usado, y ahora la experiencia es diferente. Y creo que es por eso que (Google) debería ser más transparente sobre lo que puede y no puede hacer y cuáles son sus limitaciones”.

En ausencia de una regulación sobre la seguridad y la transparencia de la IA, Google, al igual que OpenAI y Anthropic, podría comprometerse a publicar datos sobre las alucinaciones, el psicofascismo o los índices de honestidad de Géminis.

Mientras tanto, no olvides lo que Google tiene que decir. Términos de servicio de IA: “Use discreción antes de confiar, divulgar o utilizar de otro modo el contenido proporcionado por el Servicio”.


Divulgación: Ziff Davis, la empresa matriz de Mashable, presentó una demanda contra OpenAI en abril de 2025, alegando que violó los derechos de autor de Ziff Davis al entrenar y operar sus sistemas de IA.

Enlace fuente