He estado usando asistentes de voz durante años y, si bien me ayudan, siempre me siento frustrado cuando me interrumpen a mitad de una frase o se pierden por completo lo que estaba diciendo. No fui optimista cuando revisé el modo de voz de ChatGPT y no estaba muy feliz de estar equivocado. El modo de voz no consiste solo en hablar con un chatbot, se siente como una conversación auténtica.
Capta pausas, pensamientos murmurados e incluso palabras de relleno como “uhhhh” sin interrumpir el flujo. Ya sea que esté conduciendo, cocinando o intentando realizar múltiples tareas, puedo hablar con naturalidad y obtener respuestas útiles sin levantar el teléfono. No es más rápido que escribir: se siente más fácil, más intuitivo y más eficiente. Si aún no lo has probado, he aquí por qué el modo de voz de ChatGPT podría convertirse en tu forma favorita de usar la IA.
no te lo pierdas: ¿Qué es ChatGPT? Todo lo que necesitas saber sobre los chatbots con IA
ChatGPT no es el único chatbot manos libres de OpenAI. Gemini Live de Google ofrece la misma vibra de “háblame y te mantendré al tanto”. La aplicación móvil Claude de Anthropic tiene una versión beta de su modo de voz, completa con viñetas en pantalla mientras habla, y los asistentes de iOS y Android de Perplexity también responden preguntas habladas e inician aplicaciones como OpenTable o Uber cuando se les ordena.
No se pierda nuestro contenido tecnológico imparcial y reseñas basadas en laboratorio. Añadir CNET Como fuente preferida de Google.
Pero incluso cuando todos compiten por dominar la conversación de IA en tiempo real, ChatGPT puede ser mi opción. Sea cual sea el chatbot que prefieras, tómate un descanso de escribir y prueba la opción de voz. Es más útil de lo que crees.
(Divulgación: Jeff Davis, la empresa matriz de CNET, presentó una demanda contra OpenAI en abril, alegando que violó los derechos de autor de Jeff Davis al entrenar y operar sus sistemas de IA).
Échale un vistazo: La función viral de ChatGPT: convertir personas en figuras de acción
¿Qué es exactamente el modo de voz?
El chat de voz (o “conversación de voz”) es el modo manos libres de ChatGPT que le permite hablar con un modelo de IA y escucharlo hablar con usted, sin necesidad de escribir. Encontrarás un ícono de voz en las aplicaciones móviles, de escritorio y web en la parte inferior derecha de cualquier conversación. Si presionas el botón, puedes decir tu pregunta en voz alta y ChatGPT la transcribirá, dará sus razones y responderá. Tan pronto como termina de hablar, comienza a escuchar nuevamente, creando un diálogo natural de ida y vuelta.
solo recuerda: El modo de voz se ejecuta en el mismo modelo de lenguaje grande que el ChatGPT normal, por lo que aún puede alucinar o obtener información incorrecta. Siempre debes verificar todo lo importante.
OpenAI ofrece dos versiones de esta conversación de voz: Voz estándar (opción liviana y gratuita por defecto) y Voz avanzada (Solo disponible para usuarios pagos).
Standard Voice primero convierte su voz en texto y la procesa con GPT-4o (y GPT-4o Mini), lo que le lleva un poco más de tiempo hablar con usted. Advanced Voice, por otro lado, utiliza de forma nativa un modelo multimodal, lo que significa que te “escucha” y produce audio, por lo que la conversación es más natural y se realiza en tiempo real. Puede captar y adaptarse a otras señales además de las palabras, como la velocidad a la que hablas o la emoción en tu voz.
nota: Los usuarios gratuitos pueden acceder a una vista previa diaria de voz mejorada.
sorpresa
7 razones para comenzar a utilizar la función Modo de voz de ChatGPT
1. Es una conversación real
A diferencia de escribir, cuando hablo con ChatGPT, no me ocupo de cada error tipográfico para encontrar la palabra correcta o el retroceso. Simplemente estoy hablando, como si estuviera con un amigo o familiar, lleno de “ummmmm” y “me gusta” y otras pausas incómodas. El modo de voz aparece con todos mis pensamientos a medio terminar y brinda una respuesta o una pregunta completamente desarrollada para ayudarme a completar lo que necesito. Este toma y daca sin esfuerzo se siente mucho más natural que escribir.
2. Puedes usar ChatGPT con manos libres
Obviamente, todavía tengo que abrir la aplicación ChatGPT y tocar el botón de modo de voz para comenzar, pero una vez que comienzo, ya no necesito usar mis manos para mantener una conversación con el chatbot AI. Puedo quedarme atrapado en el tráfico y quiero tomarme unas vacaciones a finales de este año. Puedo preguntar sobre vuelos, hoteles, puntos de referencia, restaurantes y cualquier otra cosa sin tocar mi teléfono, y esa conversación se guarda dentro de la aplicación, por lo que no tengo que recordar lo que me dice ChatGPT.
3. Es bueno para aprender un nuevo idioma con traducción en tiempo real.
Mencioné anteriormente que uso el modo de voz para practicar el idioma, ese modo de voz es bueno. Hablo inglés y respondo en ChatGPT en perfecto polaco, con consejos de pronunciación. Simplemente pregúntale al Modo de voz: “¿Puedes ayudarme a practicar mi (idioma)?” y te responderá de varias maneras que pueden ayudarte, como iniciar conversaciones, vocabulario básico o números. Y recuerda dónde lo dejaste, para que puedas tomar las lecciones de una manera; No se requiere Duolingo.
4. Obtén respuestas sobre lo que ves en el mundo real.
Esta función es exclusiva de Advanced Voice, pero con Voice Mode es probablemente mi función favorita. Gracias a sus superpoderes multimodales, puedo encender la cámara de mi teléfono o tomar un video/foto y pedirle ayuda a ChatGPT. Por ejemplo, tuve problemas para identificar un cuadro que encontré en una tienda de segunda mano y el dueño no tenía idea de dónde venía. Abrí el chat de voz, encendí mi cámara y le pregunté al modo de voz de dónde era la pintura. En cuestión de segundos, puede decirme el título de la pintura, el nombre del artista y cuándo fue pintada.
5. Es una buena opción para personas con determinadas discapacidades
Para cualquier persona con baja visión o dislexia, hablar definitivamente es mejor que escribir. El modo de voz puede transcribir tu discurso y luego leer tu respuesta en voz alta a la velocidad que elijas (puedes ajustar esto en tu configuración o decirle a ChatGPT que disminuya la velocidad). La opción de manos libres ayuda a cualquier persona con problemas de habilidades motoras, ya que todo lo que tiene que hacer es un toque para iniciar y otro para detener, sin tener que escribir mucho en el teclado.
6. Inteligencia rápida
A veces tengo muchas ideas y pienso más rápido de lo que puedo escribir, por lo que el modo de voz de ChatGPT es perfecto para escupir ideas para historias, idear un nuevo diseño para mi sala de estar o decidir comidas interesantes para cocinar durante la semana. Como pienso en voz alta en lugar de mirar mi teléfono, mis ideas fluyen mucho más fácil y rápido, especialmente con los seguimientos instantáneos de ChatGPT. Mantiene el ritmo hasta que tengo una idea pulida para lo que sea que esté pensando.
7. Puedes escuchar un resumen instantáneo.
Coloque un PDF de 90 páginas, como el guión de una película o un libro de texto, en el chat, solicite una sinopsis y haga que la IA se la lea en voz alta mientras dobla la ropa. Es como convertir cualquier documento (incluso una página de Wikipedia) en un podcast, bajo demanda.
El modo de voz no es sólo un buen truco; Esta es una forma más rápida y natural de utilizar ChatGPT. Ya sea que estés traduciendo señales de tráfico, generando una lluvia de ideas o escuchando noticias en voz alta, hablar con ChatGPT se siente menos como usar un chatbot y más como una conversación con un pequeño experto. Una vez que te acostumbres a pensar en voz alta, nunca volverás a usar el teclado.











