OpenAI ha anunciado su nuevo modelo impulsado por Inteligencia Artificial (IA), denominado Sora, capaz de generar escenas realistas en vídeo de hasta 60 segundos a partir de instrucciones de texto. Esta innovación representa un avance significativo en el desarrollo de IA, con el objetivo de resolver problemas que implican interacciones con el mundo real. https://x.com/OpenAI/status/1758192957386342435?s=20
(imagen capturada en un video de Sora)
Mira en este hilo de X los videos más impactantes realizados por Sora: https://x.com/tusmedios/status/1758438606820048987?s=20
Sora ha sido diseñado para comprender y simular el mundo físico en movimiento, permitiendo a los usuarios crear vídeos detallados con complejos movimientos de cámara y múltiples personajes expresando emociones. Los usuarios simplemente necesitan proporcionar instrucciones detalladas sobre las características deseadas de la escena, como personajes, acciones, entorno, clima y movimientos de cámara.
El modelo interpreta estas instrucciones con precisión gracias a su amplio conocimiento del lenguaje, lo que le permite crear escenas realistas que incluyen personajes expresivos y detalles cinematográficos. Además, Sora puede animar imágenes estáticas, extender la duración de vídeos existentes y completar fotogramas faltantes.
Sora utiliza una arquitectura de transformador similar a la de los modelos GPT, representando las imágenes del vídeo como colecciones de unidades de datos más pequeñas, conocidas como parches. Estos parches son equivalentes a tokens en GPT y permiten un rendimiento de escalado superior.
Aunque actualmente el acceso al modelo está limitado al equipo de investigación de OpenAI y a un grupo selecto de artistas visuales, diseñadores y cineastas, la empresa está trabajando en la mejora de Sora para hacerlo más útil y accesible para profesionales creativos. Sin embargo, el modelo aún enfrenta desafíos en la representación precisa de ciertos aspectos, como el espacio, la física y las acciones de causa y efecto.
OpenAI está implementando medidas de seguridad para evitar la generación de contenido engañoso o dañino. Esto incluye la colaboración con expertos en desinformación y el desarrollo de herramientas para detectar y clasificar vídeos generados por Sora. Además, están aplicando métodos de seguridad existentes, como la verificación de metadatos y el uso de clasificadores de imágenes, para garantizar el cumplimiento de las políticas de uso y evitar la difusión de contenido inapropiado.
Fuente: Infobae