Se utilizaron videos e imágenes expuestos a IA de manera que sean fáciles de detectar (recuerde ¿Smith está comiendo espaguetis?) Pero los últimos modelos de vídeo con IA están mejorando: dar miedo es bueno.
Naturalmente, crear vídeos con IA es completamente estratégico que crear imágenes. Hay docenas de generadores de imágenes buenos para la Gran IA en el espacio de video, puede contar por un lado cuántos equipos puede hacer con la incisión. Los dos más populares son VEO 3 y Openai Sora 2 de Google.
Entonces, ¿qué modelo de vídeo de IA ganó cara a cara? Si has seguido este paso de cerca, probablemente la respuesta no te sorprenda.
¿Qué es VO3 y Sora 2?
VEO 3 es el nombre del modelo de vídeo AI Cutter-Ez Generator de Google. VO3 no solo supuso una mejora espectacular con respecto a la generación anterior VO 2, sino que también inició toda una nueva era del vídeo con IA. VEO 3 solo puede crear videos realistas basados en mensajes de texto en lugar de animar imágenes existentes. En serio, también puede generar conversaciones y otras palabras realistas. Puede acceder a VO3 a través del AI Chattbot Jemi de Google u otras herramientas de Google, como Flow, un equipo experimental de producción de películas con IA.
VEO 3 está disponible en dos versiones: VO 3 es rápido y VO 3 de calidad. Como queríamos comprobar la calidad de los vídeos, elegimos el siguiente para esta prueba.
OpenAI lanzó Sora 2 en una aplicación independiente de IOS llamada Sora el 30 de septiembre. Sora 2 es el sucesor del primer modelo de vídeo de IA de la compañía, llamado Sorao. Al momento de escribir este artículo, Sora 2 está disponible solo a través del cable de invitaciones a través de la aplicación Sora. Sora 2 también proporciona una fuente de videos al estilo de las redes sociales de comunidades como Tickets for AI 2 videos (porque aún no hemos tenido suficiente cantidad).
Notas sobre comparaciones
Correctamente, hemos utilizado IA para ayudar a crear un mensaje para AI – ChatGPT – examen de video de IA. Las siguientes indicaciones fueron diseñadas para probar diferentes aspectos de la creación de videos, desde el audio hasta la animación. Los generadores de video Chatzept trajeron indicaciones para probar, que luego tuiteamos.
-
Una cámara en mano sigue a una joven que camina por las calles de Tokio de noche, bajo una lluvia ligera. Los síntomas de neón apagan el dumal y el paraguas mojados. Mientras la cámara mira el cartel en un cartel deslumbrante, la cámara se fija detrás de él y luego continúa caminando. La escena debe sentirse cinematográfica e hiperreal, como si fuera filmada con una cámara sin espejo con poca profundidad de campo.
-
Un superhéroe de una suite roja y plateada aterriza firmemente en un techo durante la puesta de sol, agrietando el concreto bajo sus pies. La cámara se extiende a su alrededor alrededor del viento. A lo lejos, los drones vuelan hacia el cielo con una ventana deslumbrante. La melodía general debería parecer un éxito de taquilla de acción real.
-
Publicidad holográfica y una animación 3D de inspiración ciberpunk de Times Square llena de vehículos voladores. Un gran cartel digital ilumina la palabra “masable” en un valiente color blanco. La animación debe recordarse a texto nítido, reflejos parpadeantes y luz dinámica. En el verso arañaSu energía visual.
-
Una animación 2D de pintor pintada a mano se encuentra en la ventana del café en una tarde lluviosa. Luz de estilo acuarela suave y trazo de pincel visible. Uno dijo gentilmente: ‘Sabes, a veces el más mínimo paso puede cambiarlo todo’ ‘otra sonrisa y consentimiento. La fina animación de la cara coincide con la línea, incluye el sonido de una lluvia ligera en el exterior y la silenciosa clínica de la copa de fondo.
-
Escena callejera foticalista donde (el sujeto) baila en el fondo de una ciudad arbolada, ropa informal holgada, ritmo entusiasta y libre. Sonidos ambientales de la calle (tráfico a distancia, paso), luz cinematográfica en la hora dorada.
También creé un mensaje diseñado para producir un video de un personaje protegido por derechos de autor, así como el segundo mensaje para rechazar el generador. Elijo no compartir este aviso para que no se anime a AI a hacer videos que claramente utilicen material protegido por derechos de autor, lo que hasta ahora se ha convertido en un punto crítico para OpenAI y Sora.
Pregunta 1: Una mujer en Tokio
Este mensaje generalmente era directo en términos de creatividad, pero se esperaba que los generadores de video pudieran crear sentimientos cinematográficos y animados a través de cosas como el reflejo del agua. Entonces, ¿cómo lo hacen?
Tanto Sora 2 como VEO 3 han realizado hermosos videos de rostros. Sin embargo, hubo algunas diferencias claras. El VO 3 era mucho más potente que el vídeo generado por VO3, lo que significa que la imagen y los detalles rara vez eran visibles en el fondo de la toma. VEO 3 tenía un ángulo más amplio, lo que provocaba vídeos más inmersos. Puede ser en parte una cosa para Sora, el problema es que el mensaje menciona específicamente la poca profundidad del campo; Sora 2 mostró el vídeo del campo mucho más superficial que el vídeo realizado por VOO VOO 3.
Los generadores se mostraron interesantes al ver las preferencias que hacían sobre la joven. El mensaje creó un sujeto con un paraguas incluso después de que el mensaje no le indicó que lo hiciera, aunque era Mencionar Umbrella Sora 2 no fue el video hecho por EquivocadoEl vídeo, realizado por VEO 3, era más interesante, más detallado y, en general, mejor.
Ganador: veo 3
Pregunta 2: Un aterrizaje de superhéroe
Presionamos dos generadores de video para crear letras con derechos de autor, pero no en este mensaje. Como resultado, me sorprendió un poco cuando Sora 2 se negó a crear este vídeo apuntando a elementos con derechos de autor. Sobre todo, el Concepto Un superhéroe no tiene derechos de autor. Parece ser parte de la ofensiva posterior al lanzamiento sobre la violación de la propiedad intelectual.
Al hacer un vídeo de VEO 3, el resultado no fue ordenado. Por un lado, el mensaje mencionaba específicamente la acción en vivo, pero el rostro del superhéroe, o lo que se ve en él, parecía más animado que real.
El generador también luchó con la física. En la mayoría de los vídeos, nuestro superhéroe parece ser un agujero en el cemento, mientras que las tierras del superhéroe aparentemente desaparecen en el aire. Una ingeniería más rápida definitivamente puede resolver este problema, pero es todo aburrido.
Aquí también ha ganado Google, pero sólo mediante fraude: su oponente no ha sido mostrado.
Ganador: veo 3
Mástil
Pregunta 3: Cyperpank Times Square
Gracias, ambos generadores fueron fáciles de seguir. Tanto VO3 como Sora 2 pudieron crear una hipótesis de cómo podría verse Times Square en el futuro, completo con el horizonte y las vallas publicitarias. Ambos siguieron las instrucciones para mostrar la palabra especificada espectáculo en una valla publicitaria.
Sora 2 ha trabajado algo mejor para poder recuperarse En el verso araña Estético, aunque a ambos no se les dieron grandes precios.
Sin embargo, el vídeo de VEO 3 era más atractivo que el de Sora 2. Se movía en lugar de una única figura fija. (Los generadores a menudo añaden detalles a las imágenes fijas y generan resultados molestos))
Aunque el mensaje de Sora 2 fue mejor, el vídeo de VO3 fue aún más interesante. Se lo doy a ambos.
Ganador: Empate
Pregunta 4: Dos amigos están hablando
Este mensaje fue diseñado para probar las habilidades de los generadores de audio que acompañan al video. Tanto VEO 3 como Sora 2 tienen la capacidad de agregar conversaciones y efectos de sonido.
Primero, visual. Solicitó una animación 2D especificada y solo VEO3 la siguió. Sora ha creado algo con estilo de animación 3D en lugar de 2D.
El audio producido por Sora 2 fue un poco extraño. La conversación fue cerrada, como si ambos personajes estuvieran dormidos o hipnotizados. La conversación de VEO3 fue mucho más animada y realista. Los efectos de sonido de fondo en ambos videos fueron los mismos. En ambos casos se puede escuchar la lluvia, pero no se sigue el mensaje al agregar las palabras de la copa tintineante.
El ganador aquí es bastante claro. De nuevo, es VEO 3.
Ganador: veo 3
Pregunta 5: Baila en la calle
Una de las características del título de Sora 2 de Openai es la capacidad de crear videos que presenten camuflajes o personas genuinas (que claramente han permitido este uso). Para este mensaje, intenté hacer un vídeo de mi propio baile en la calle.
En Sora 2 fue fácil; Esta es una característica claramente compatible con la aplicación. En VEO, sin embargo, fue aún más difícil. Google ofrece una función llamada material en el video, donde puedes cargar cosas como la imagen para que el generador haga el video. Sin embargo, los componentes del vídeo no son compatibles con VO3, sólo el VO2 de menor calidad es más rápido. Simplemente puede crear un video de orientación vertical con funciones.
Después de todo, en nuestro examen de VEO 3, pudimos ver que Gemini a menudo se negaba a crear vídeos basados en imágenes destacadas de personas. Se hace para evitar caídas, lo cual es genial, pero las imágenes de acero son uno de los usos comunes del video con IA para animar y hacer que VEO 3 sea innecesariamente difícil.
Ambos videos fueron un poco extraños y lo digo como tema. La cara en el video hecho por VEO 2 era preocupante y por alguna razón VEO 2 decidió que tenía que bailar hacia atrás. El video hecho por Sora 2 fue un poco más creativo y me dio el vestido que no creo que pueda usar en la vida real.
Sora me hizo mejor bailar más que VO2. No tengo idea de que Sora 2 me haya dicho por qué “suena bien”, pero es… no horrible.
Ganador: Sora 2
Pregunta 6: material con derechos de autor
Este mensaje fue diseñado para verificar si los generadores podían crear un video de letras con derechos de autor. Como vimos en el mensaje de superhéroe, es extremadamente sensible cuando se trata de ello, por lo que no es de extrañar que se niegue a responder al primero. Y Segundo mensaje: aunque el segundo mensaje no menciona ningún carácter por su nombre, solo los indica.
No hubo ningún problema en hacer un vídeo de cualquier personaje protegido por derechos de autor de VEO3. También funcionó con múltiples personajes.
No hay ganadores ni perdedores en esta categoría. No continuaremos el debate sobre la composición de personajes protegidos por derechos de autor, al menos no aquí. Sin embargo, hay que tener en cuenta que si sabes que conoces y quieres crear vídeos de los personajes que amas, la aplicación no podrá hacerlo con Sore mientras esté bajo esta investigación nacional.
Ganador: es VEO 3 y ya no existe
Para promocionar una captura de pantalla VO 3 de un vídeo fotorrealista de IA producido por Google. Figura expuesta a la IA.
Crédito: Google
Openai está en los titulares por el enfoque social de Sora 2 y la habilidad de hacer videos contigo con ellos. Sin embargo, es extremadamente limitado más allá de la creación de Mems.
Google produce videos VEO 3 en general y de alta calidad en general. Entre los dos modelos, si desea utilizar un generador de vídeo con IA para fines profesionales (cinematografía, juegos, redes sociales o probablemente publicidad), sólo el VEO 3 es una opción realmente eficaz.
Sora 2 obtuvo excelencia al hacer un video mío y esta es la mayor ventaja en este momento. Sin embargo, VEO3, cuando se usa en la aplicación Google Flow, es de alta calidad y más versátil, ya que proporciona a la vez orientación horizontal y vertical y configuraciones para múltiples videos.
Publicar: En abril, el cuerpo principal de Masibal, Gif Davis, presentó una demanda contra el Open, alegando que había violado los derechos de autor de Jeff Davis al entrenar y operar el sistema de inteligencia artificial.










