Home Apple Esta actualización de ChatGPT Voice muestra lo que podemos esperar de Siri

Esta actualización de ChatGPT Voice muestra lo que podemos esperar de Siri

2

Una nueva actualización de voz de ChatGPT hace que la interacción con el chatbot sea más flexible que nunca y creo que es un ejemplo de una de las cosas clave que eventualmente podemos esperar de la nueva Siri.

Si bien el cambio de OpenAI puede parecer relativamente pequeño en la superficie, ya descubrí que transforma completamente la experiencia de usar ChatGPT…

Texto a voz

Cuando ChatGPT se lanzó por primera vez, era solo texto. Posteriormente, ampliar la funcionalidad a la interacción por voz tuvo dos efectos.

Primero, hizo que el chatbot pareciera que estaba imitando a un humano. Ese es un tema en sí mismo, pero estoy contigo. David Wiener Y Juan Gruber Pensar que ese no debería ser el propósito de un chatbot. (OpenAI al menos ha vuelto a una versión que priorizaba la amabilidad sobre la precisión).

En segundo lugar, mejoró la usabilidad. Hablar con una IA es claramente más rápido y conveniente que escribir y leer respuestas escritas, al menos para ciertos tipos de interacciones.

Sin embargo, hay ocasiones en las que la interacción visual y de texto es más apropiada, y si bien fue genial tener la opción, puede ser frustrante cuando puedes realizar el 95% del trabajo mediante voz pero luego tienes que cambiar al texto para cosas como pedirle a ChatGPT que cree una imagen.

Esto es especialmente cierto porque los dos modos son distintos y puedes sentir como si estuvieras interactuando con dos modelos ChatGPT completamente diferentes: uno de voz y el otro de texto.

Integrando los dos

La última actualización de ChatGPT integra interacciones de texto y voz.

Ahora puedes usar ChatGPT Voice dentro del chat, no se requiere un modo separado. Puede hablar, ver respuestas, revisar mensajes anteriores y ver elementos visuales como imágenes o mapas en tiempo real.

Sospecho que una de las razones por las que Apple está tardando más de lo esperado es en proporcionar exactamente este tipo de integración. Efectivamente, la compañía lo está haciendo al revés: Siri se lanzó como un servicio sólo de voz y Apple Intelligence ahora agrega capacidades basadas en texto, como resumir correos electrónicos.

OpenAI parece estar enfrentando algunos desafíos para lograr tales integraciones. En mis pruebas iniciales, a veces funcionó muy bien y otras no. Por ejemplo, sentí que decía mostrarme un mapa cuando en realidad no lo hacía.

Este es el futuro de la nueva Siri

Si Siri quiere cumplir todas las promesas que le hizo a Apple, debe hacer exactamente esto y más.

Necesitamos poder darle un comando de voz y hacer que no solo dé retroalimentación hablada, sino que también manipule texto e imágenes.

Además, debe actuar como un agente inteligente al interactuar con nuestras aplicaciones instaladas. Le daremos una instrucción como “reservar el primer vuelo mañana por la mañana desde Heathrow a Las Vegas” y utilizará cualquier aplicación de viaje que hayamos instalado para realizar esta tarea.

Pero Apple puede acabar subcontratando

Proporcionar esta capacidad no es una tarea fácil. Mi jurado todavía está deliberando no solo sobre dónde tiene Apple los chatbots de IA hoy, sino también sobre dónde están será Es hora de lanzar el nuevo Siri. Creo que es muy probable que Apple tenga que subcontratar capacidades de IA a otras empresas.

Personalmente, no me importa si la tecnología utilizada es desarrollada por Apple o confiada a la tecnología de inteligencia artificial proporcionada por OpenAI, Google o cualquier otra persona. ¿Qué soy yo? hacer Preocúpate por dos cosas.

Primero, Apple protege nuestra privacidad a través de interfaces personalizadas con chatbots de terceros tal como lo hace hoy en ChatGPT. Cuando hacemos una pregunta que Siri no puede responder y regresa a ChatGPT, OpenAI nunca utiliza nuestras interacciones para capacitación porque esa protección de la privacidad es parte de lo que Apple acordó con la empresa.

En segundo lugar, la rapidez con la que Apple puede llevar esta inteligencia a sus dispositivos. El año que viene es el límite absoluto de cuánto tiempo podemos esperar. Si cumplir con esa fecha límite significa que lo que hay bajo el capó del nuevo Siri es una versión personalizada de ChatGPT, Gemini o algo más, por mí está totalmente bien.

¿Cuál es tu opinión sobre este asunto? Por favor comparte tus pensamientos en los comentarios.

Accesorios destacados

Enlace fuente