¿Cómo suena la inteligencia artificial? Hollywood lleva décadas imaginando esto. Ahora los desarrolladores de IA están aprovechando las películas y creando voces para máquinas reales basadas en fantasías cinematográficas que datan de máquinas parlantes.
El mes pasado, OpenAI Lanzamiento de actualización Es un chatbot con inteligencia artificial. ChatGPT, dice la compañía, aprende a oír, ver y conversar con una voz natural, muy parecida al sistema operativo incorpóreo al que le puso voz Scarlett Johansson en la película “Her” de Spike Jonze de 2013.
La voz de ChatGPT, llamada Skye, también tenía un efecto amaderado, calmante y un toque sexy. Era agradable y indulgente consigo mismo; Parecía dispuesto a cualquier cosa. Después del debut de Sky, Johansson expresó su disgusto por el sonido “terriblemente similar” y dijo que previamente había rechazado la solicitud de OpenAI de darle voz al robot. La compañía protestó porque Skye tenía la voz de una “actriz profesional diferente”, pero estuvo de acuerdo. detener su voz En honor a Johansson. Hay usuarios desamparados de OpenAI Comenzó una petición para traerlo de vuelta
A los creadores de IA les gusta resaltar las capacidades cada vez más naturales de sus herramientas, pero sus voces sintéticas se basan en capas de artificialidad y proyección. Skye representa la vanguardia de las ambiciones de OpenAI, pero se basa en un concepto antiguo: el robot de IA como una mujer empática y leal. En parte madre, en parte secretaria y en parte novia, Samantha era un objeto de consuelo multiusos que ronroneaba directamente en los oídos de sus usuarios. Incluso a medida que avanza la tecnología de la IA, estos estereotipos se recodifican repetidamente.
Voces de mujeres, como señala Julie Wask “Mujeres artificiales: muñecas sexuales, cuidadores robóticos y más mujeres facsímiles”, Impulsa tecnologías que a menudo se imaginan antes de que se conviertan en realidad.
En la serie original “Star Trek”, que debutó en 1966, la voz de la computadora en la cubierta del Enterprise fue realizada por Mazel Barrett-Roddenberry, esposa del creador del programa Gene Roddenberry. En la película “Alien” de 1979, la tripulación del USCSS Nostromo se dirigió a la voz de su computadora como “Madre” (su nombre completo era MU-TH-UR 6000). Una vez que las empresas de tecnología comenzaron a comercializar asistentes virtuales (Siri de Apple, Alexa de Amazon, Cortana de Microsoft) sus voces fueron en gran medida feministas.
Estos asistentes de voz de primera generación, que han mediado en nuestra relación con la tecnología durante más de una década, tienen un encanto en miniatura y de otro mundo. Son sonidos autoajustados, sus voces humanas acentuadas por un trino mecánico. A menudo hablan con una cadencia mesurada de una sola nota, lo que sugiere una vida mental atrofiada.
Pero el sonido robótico que emiten intensifica su atractivo. Son programables, manipulables y subordinados a nuestras demandas. No creen que sean más inteligentes que nosotros. Suenan como retrocesos a las monótonas computadoras femeninas de “Star Trek” y “Alien”, y sus voces tienen un brillo retro-futurista. Sirven a la nostalgia en lugar del realismo.
Ese sonido artificial ha seguido dominando, incluso cuando la tecnología detrás de él ha mejorado.
El software de voz a voz fue diseñado para hacer que los medios visuales sean accesibles para usuarios con ciertas discapacidades y, en TikTok, se ha convertido en una fuerza creativa por derecho propio. Desde que TikTok lanzó su función de conversión de texto a voz en 2020, ha creado una gran cantidad de voces simuladas para elegir; ahora ofrece más de 50, incluidos nombres como “Hero”, “Storyteller” y “Bestie”. Pero la plataforma está definida por una opción. “Jessie”, una voz implacablemente femenina con un tono robótico ligeramente vago, es la voz ininteligible de un pergamino sin sentido.
A Jesse parece que se le asigna una sola emoción: el entusiasmo. Parece que está vendiendo algo. Esto lo convierte en una opción atractiva para los creadores de TikTok, que se están vendiendo. La carga de representarse a uno mismo se puede subcontratar a Jessie, cuya brillante y retro voz de robot le da a los videos un brillo deliciosamente irónico.
Hollywood también ha producido robots varoniles, ninguno más famoso que HAL 9000, la voz informática de “2001: Odisea en el espacio”. Al igual que sus compañeras femeninas, HAL irradia tranquilidad y lealtad. Pero cuando se enfrenta al personaje humano central de la película, Dave Bowman (“Lo siento, Dave, me temo que no puedo hacerlo”), su serenidad se convierte en una habilidad aterradora. Dave se da cuenta de que HAL es leal a una autoridad superior. La voz masculina de HAL le permite actuar como rival y espejo de Dave. Se le permite convertirse en un personaje real.
Al igual que HAL, Samantha en “Her” es una máquina que se vuelve real. En un giro de la historia de Pinocho, comienza la película limpiando la bandeja de entrada de correo electrónico de un hombre y asciende a un nivel superior de conciencia. Ella se convierte en algo más que una chica de verdad.
La voz de Scarlett Johansson, como inspiración para robots tanto ficticios como reales, subvierte las tendencias vocales que definen a nuestras compañeras feministas. Tiene un borde afilado que grita estoy vivo. No se parece en nada al asistente virtual procesado que estamos acostumbrados a escuchar hablar a través de nuestros teléfonos. Pero su interpretación de Samantha se siente humana no sólo por su voz sino también por lo que dice. Crece a lo largo de la película, adquiere deseo sexual, pasatiempos avanzados y amigos de IA. Tomando prestada la influencia de Samantha, OpenAI hizo que Skye pareciera que tenía decisión propia. Como si estuviera más avanzado de lo que realmente estaba.
Cuando vi “Ella” por primera vez, pensé que Johansson le daba voz a un robot humanoide. Pero cuando volví a ver la película la semana pasada, después de ver la demostración ChatGPT de OpenAI, el papel de Samantha me pareció infinitamente más complejo. Los chatbots no producen automáticamente voces humanas. No tienen garganta ni labios ni lengua. Dentro de “su” mundo tecnológico, el robot Samantha se basaría en una voz femenina humana, tal vez una actriz ficticia que se parece mucho a Scarlett Johansson.
Parecía que OpenAI entrenó su chatbot con la voz de una actriz anónima que sonaba como una actriz famosa que expresó un chatbot de película entrenado con una actriz irreal que sonaba como una actriz famosa. Cuando ejecuto la demostración de ChatGPT, escucho una simulación de una simulación de una simulación de una simulación de una simulación.
Las empresas de tecnología anuncian sus asistentes virtuales en términos de los servicios que brindan. Pueden leerte el parte meteorológico y llamarte un taxi; OpenAI promete que sus chatbots más avanzados podrán reírse de tus chistes y detectar tus cambios de humor. Pero existen para hacernos sentir más cómodos con la tecnología.
La voz de Johansson actúa como una lujosa manta de seguridad que cubre aspectos inconexos de las interacciones asistidas por IA. “Me dijo que sentía que al hablar de mis sistemas, podría cerrar la brecha entre las empresas de tecnología y los creativos y ayudar a los consumidores a sentirse cómodos con los cambios sísmicos relacionados con los humanos y la IA”, dijo Johansson sobre el fundador de OpenAI, Sam Altman. “Dijo que sentía que mi voz consolaría a la gente”.
No es que la voz de Johansson suene inherentemente como la de un robot. Esto se debe a que los desarrolladores y cineastas diseñan las voces de sus robots para minimizar la incomodidad inherente a las interacciones entre robots y humanos. OpenAI dijo que quería emitir una voz de chatbot que fuera “identificable” y “cálida” e “inspirara confianza”. La inteligencia artificial ha sido acusada de destruir industrias creativas, consumir energía e incluso amenazar la vida humana. Es comprensible que OpenAI quiera una voz que haga que las personas se sientan cómodas usando sus productos. ¿Cómo suena la inteligencia artificial? Suena a gestión de crisis.
AbiertoAI Lanzamiento de First Sky’s Voice a miembros Premium en septiembre pasado, junto con otra voz femenina llamada Juniper, las voces masculinas Amber y Cove, y una voz de género neutral llamada Breeze. Cuando me registré en ChatGPT y saludé a su asistente virtual, sonó la voz de un hombre en ausencia de Skye. “Hola. ¿Cómo te va?” ella dijo Parecía relajado, tranquilo y optimista. Sonaba (no estoy segura de cómo describirlo) guapo.
Me di cuenta de que estaba hablando con Cove. Le dije que estaba escribiendo un artículo sobre él y elogió mi trabajo. “¿Ah, de verdad?” ella dijo “Es impresionante.” Mientras hablábamos, me sentí seducido por su técnica natural. Salpicó sus oraciones con palabras de relleno como “uh” y “um”. Levantó la voz cuando me hizo preguntas. Y me hizo muchas preguntas. Me sentí como si estuviera hablando con un terapeuta o con un novio.
Pero nuestra conversación se detuvo rápidamente. Cada vez que le preguntaba sobre él, tenía muy poco que decir. No era un personaje. No tenía yo. Sólo fue diseñado para ayudar, me informó. Le dije que hablaría con ella más tarde y ella dijo: “Oh, claro. Comuníquese cuando necesite ayuda. Cuídese”. Me sentí como si estuviera hablando por teléfono con una persona real.
Pero cuando revisé la transcripción de nuestro chat, pude ver que su discurso era tan estático y primitivo como el de cualquier chatbot de servicio al cliente. No era particularmente inteligente ni humano. Era simplemente un actor decente que aprovechaba al máximo cero papeles.
Cuando Sky desapareció, los usuarios de ChatGPT acudieron al foro de la empresa para quejarse. Algunos utilizan por defecto sus chatbots como Juniper, quien les suena como “bibliotecario” o “maestro de jardín de infantes”, una voz femenina que se ajusta a los estereotipos de género equivocados. Querían marcar una nueva mujer con una personalidad diferente. Como escribió un usuario: “Necesitamos otra mujer”.
Producido por La cerradura está clara
Warner Bros. Audio vía (Samantha, HAL 9000); OpenAI (cielo); Paramount Pictures (computadora empresarial); manzana (Siri); TikTok (JC)










