OpenAI anuncia Sora, su nueva herramienta IA para la producción de videos

El producto aún está en fase de revisión, pero OpenAI asegura que ya es capaz de recrear unos 60 segundos de transmisión en base a las especificaciones aportadas por los usuarios. De momento están puliendo ciertos detalles y optimizando funciones, aunque no hay ventana de lanzamiento oficial.

***

OpenAI presentó Sora, su nueva herramienta basada en IA
Esta puede generar videos de hasta 60 segundos de duración bajo especificaciones de los usuarios
La compañía compartió algunos ejemplos generados con Sora
Aclaran que el producto está bajo revisión, y aún presenta ciertas dificultades en torno a determinados procesos
Se desconoce posible ventana de lanzamiento para el público

La empresa responsable del popular chatbot conocido como ChatGPT, OpenAI, anunció el día de hoy el lanzamiento de su nueva herramienta llamada Sora, la cual permite la creación de videos con inteligencia artificial a partir de las descripciones de los usuarios en texto.

El anuncio vino a lugar en una publicación difundida a través de sus canales oficiales, en la cual hizo una pequeña demostración de lo que puede hacer Sora con una solicitud hecha a través de un prompt/guión. Al respecto, OpenAI especifica que de momento puede crear videos de unos 60 segundos de duración, altamente detallados, con posicionamiento de la cámara bajo especificaciones y con la aparición de personas en el material.

Para el ejemplo en cuestión, OpenAI hizo la siguiente solicitud:

La hermosa y nevada ciudad de Tokio está bulliciosa. La cámara se mueve por la bulliciosa calle, siguiendo a varias personas que disfrutan del hermoso clima nevado y de compras en puestos cercanos. Los hermosos pétalos de cerezos vuelan por el viento junto con los copos de nieve.

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) February 15, 2024

De la mano con este ejemplo, también compartieron otros materiales generados con el apoyo de Sora, entre los cuales destacan los siguientes:

Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS

— OpenAI (@OpenAI) February 15, 2024

Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB

— OpenAI (@OpenAI) February 15, 2024

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq

— OpenAI (@OpenAI) February 15, 2024

En cuanto al producto, la compañía indica que de momento está en fase de revisión por parte de su equipo, por lo que están en proceso de detección de fallos o riesgos. Sin embargo, le están facilitando acceso a ciertos artistas visuales, diseñadores y cineastas para poder recibir algunos comentarios sobre la herramienta, los cuales ayudarán a pulir su funcionamiento para adaptarse a las necesidades de los usuarios.

El equipo de OpenAI indica que si bien hay muchas posibilidades, el modelo aún presenta algunas debilidades. De momento experimenta dificultades para simular de forma precisa ciertas físicas, y es posible que no establezca relaciones causales entre ciertos eventos: “Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco”, indicó la empresa.

También indican que es posible que el modelo confunda ciertos detalles de los mensajes compartidos por los usuarios, por lo que puede confundir orientaciones espaciales y experimentar dificultades para recrear ciertas descripciones.

De cara a la seguridad, el equipo también está haciendo las debidas diligencias para evitar que Sora sea utilizado para generar contenidos que puedan ser ofensivos y/o violen ciertas normativas.

“También estamos creando herramientas para ayudar a detectar contenido engañoso, como un clasificador de detección que puede indicar cuándo Sora generó un video”, indicó OpenAI, y agregó que están aprovechando “los métodos de seguridad existentes” disponibles para los productos que utilizan DALL·E 3, que también son aplicables a Sora.

De momento no hay detalles sobre si su lanzamiento será abierto para el público, por lo que se desconoce si estará primeramente disponible para quienes posean una suscripción.

Artículo de Angel Di Matteo / DiarioBitcoin

Imagen de Unsplash

DiarioBitcoin