OpenAI acaba de lanzar Sora 2, la nueva generación de su modelo de inteligencia artificial capaz de crear vídeos a partir de una descripción de texto. Pero la tecnología no llega sola, pues también estrena una nueva red social al estilo TikTok que por ahora solo funciona en iPhone y que, elocuentemente, se llama Sora.
De la mano de Sora 2, los creadores de ChatGPT presumen de una importante cantidad de optimizaciones respecto de la versión original. La plataforma puede generar clips con diálogo y efectos de sonido que son bastante más complejos que los que se ofrecían previamente.
En tal sentido, OpenAI afirma que Sora 2 es capaz de crear vídeos mucho más realistas al representar dinámicas como la rigidez y la flotabilidad. Esto le permite representar secuencias que antes eran muy difíciles —o incluso imposibles— de replicar.
Los ejemplos de materiales creados con el nuevo modelo son bastante impresionantes. OpenAI ha compartido una selección de clips muy interesante y donde resaltan ejemplos como el de una gimnasta completando una rutina de barra fija, o un joven dando múltiples volteretas hacia atrás.
Otros casos están especialmente destinados a reflejar que lo que vemos en pantalla es producto de una IA, como un ranchero montando un caballo parado sobre el lomo de otro caballo. Los de Sam Altman indican que Sora 2 ofrece mejores resultados al respetar las leyes de la física, y que es menos propenso a deformar la realidad para cumplir con las instrucciones de los usuarios.
También se observa una interesante evolución con la generación de audio, que es capaz de crear diálogos y de superponerlos correctamente con efectos de sonido de fondo. Por ejemplo, una pareja conversando mientras por detrás se escuchan las explosiones de fuegos artificiales.
Sora 2, la nueva IA para crear vídeos, tiene su propia red social
El realismo de la mayoría de las creaciones hechas con Sora 2 es innegable, aunque también es una realidad que al segundo vistazo te das cuenta de que los vídeos fueron generados por IA. Al menos en los ejemplos que ha compartido OpenAI donde se simula un escenario de la vida real, claro. En aquellos clips donde el resultado final es de animación o stop-motion, esas falencias se esconden con mayor facilidad.
Si bien el modelo respeta mejor las físicas, todavía no las maneja correctamente al 100 %. Uno de los ejemplos más evidentes es el de un grupo de personas jugando al vóley en una playa. Cuando el balón vuela se siente raro —tal vez porque gira siempre a la misma velocidad— y los movimientos de los brazos de los jugadores también parecen antinaturales. Pero lo que verdaderamente delata a la IA es el bote final de la pelota contra el suelo, pues, en lugar de que la arena lo amortigüe, rebota como si fuese de cemento.
Más allá de que Sora 2 todavía tiene problemas para crear vídeos perfectos, la evolución de los resultados es innegable. De hecho, OpenAI considera que la primera versión de Sora fue el equivalente a GPT-1 y que Sora 2 es como GPT-3.5. Esto quiere decir que todavía hay mucho margen para la mejora, y que solo es cuestión de tiempo para que su realismo sea prácticamente indiscutible.
Un despliegue inicial limitado
El debut de Sora 2 se da en simultáneo con Sora, una app que funciona como red social para compartir contenido generado con IA. La existencia de la plataforma se había divulgado de forma extraoficial, pero los californianos han confirmado su existencia. Eso sí, de momento solo está disponible para iPhone en Estados Unidos y Canadá, y con invitación.
Una función interesante de la app de Sora es que permite introducir a personas reales dentro de vídeos creados con inteligencia artificial. Esta característica, llamada “Cameos”, funciona con clips propios o de amigos/conocidos y se supone que se ofrece un control granular para que la apariencia de las personas no se use con fines espurios. Después de todo, lo que propone es crear deepfakes en formato de vídeo.
Quienes reciban la invitación para Sora 2 también podrán usar el modelo desde la versión web del generador de vídeos. Asimismo, se habilitará una variante Pro de la tecnología para quienes pagan por ChatGPT Pro. La versión base de la IA se ofrecerá de forma gratuita, al menos en un principio. OpenAI promete añadir el nuevo generador de vídeos a su API en el futuro cercano.
DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://hipertextual.com/inteligencia-artificial/sora-2-openai-red-social/