OpenAI dévoile Sora, une IA qui génère des vidéos époustouflantes

En avril, une start-up new-yorkaise appelée Runway AI a dévoilé une technologie qui permet aux gens de générer des vidéos, comme une vache lors d’une fête d’anniversaire ou un chien discutant sur un smartphone, simplement en taper une phrase dans une case sur un écran d’ordinateur.

Les vidéos de quatre secondes étaient floues, saccadées, déformées et dérangeantes. Mais ils indiquaient clairement que les technologies d’intelligence artificielle allaient générer des vidéos de plus en plus convaincantes dans les mois et années à venir.

À peine 10 mois plus tard, la start-up de San Francisco, OpenAI, a dévoilé un système similaire qui crée des vidéos qui semblent tirées d’un film hollywoodien. Une démonstration comprenait de courtes vidéos – créées en quelques minutes – de mammouths laineux trottant dans une prairie enneigée, d’un monstre regardant une bougie fondante et d’une scène de rue de Tokyo apparemment filmée par une caméra survolant la ville.

OpenAI, la société à l’origine du Chatbot ChatGPT et le générateur d’images fixes DALL-E, fait partie des nombreuses entreprises qui s’efforcent d’améliorer ce type de générateur de vidéo instantanée, notamment des start-ups comme Runway et des géants de la technologie comme Google et Meta, propriétaire de Facebook et Instagram. La technologie pourrait accélérer le travail des cinéastes chevronnés, tout en remplaçant entièrement les artistes numériques moins expérimentés.

Cela pourrait également devenir un moyen rapide et peu coûteux de créer de la désinformation en ligne, rendant encore plus difficile la détection de la réalité sur Internet.

“Je suis absolument terrifié à l’idée que ce genre de chose puisse influencer une élection très disputée”, a déclaré Oren Etzioni, professeur à l’Université de Washington spécialisé dans l’intelligence artificielle. Il est également le fondateur de True Media, une organisation à but non lucratif qui lutte pour identifier la désinformation en ligne dans les campagnes politiques.

OpenAI appelle son nouveau système Sora, d’après le mot japonais signifiant ciel. L’équipe à l’origine de cette technologie, comprenant les chercheurs Tim Brooks et Bill Peebles, a choisi ce nom car il « évoque l’idée d’un potentiel créatif illimité ».

Dans une interview, ils ont également déclaré que la société ne rendait pas encore Sora public car elle s’efforçait toujours de comprendre les dangers du système. Au lieu de cela, OpenAI partage la technologie avec un petit groupe d’universitaires et d’autres chercheurs externes qui la « équipe rouge », un terme désignant la recherche de façons dont elle peut être utilisée à mauvais escient.

“L’intention ici est de donner un aperçu de ce qui se profile à l’horizon, afin que les gens puissent voir les capacités de cette technologie – et que nous puissions obtenir des commentaires”, a déclaré le Dr Brooks.

OpenAI marque déjà les vidéos produites par le système avec des filigranes qui les identifient comme étant générés par l’IA. Mais l’entreprise reconnaît que ceux-ci peuvent être supprimés. Ils peuvent également être difficiles à repérer. (Le New York Times a ajouté des filigranes « Généré par l’IA » aux vidéos accompagnant cette histoire.)

Le système est un exemple d’IA générative, capable de créer instantanément du texte, des images et des sons. Comme d’autres technologies d’IA générative, le système d’OpenAI apprend en analysant les données numériques – dans ce cas, des vidéos et des légendes décrivant ce que contiennent ces vidéos.

OpenAI a refusé de dire combien de vidéos le système avait appris ni d’où elles venaient, sauf pour dire que la formation comprenait à la fois des vidéos accessibles au public et des vidéos sous licence des détenteurs de droits d’auteur. L’entreprise parle peu des données utilisées pour former ses technologies, probablement parce qu’elle souhaite conserver un avantage sur ses concurrents – et a été poursuivie à plusieurs reprises pour avoir utilisé du matériel protégé par le droit d’auteur.

(Le New York Times poursuivi OpenAI et son partenaire Microsoft, en décembre, alléguant une violation du droit d’auteur sur le contenu d’actualité lié aux systèmes d’IA.)

Sora génère des vidéos en réponse à de courtes descriptions, comme « un monde en papier magnifiquement rendu d’un récif de corail, regorgeant de poissons colorés et de créatures marines ». Même si les vidéos peuvent être impressionnantes, elles ne sont pas toujours parfaites et peuvent contenir des images étranges et illogiques. Le système, par exemple, a récemment généré une vidéo de quelqu’un mangeant un cookie, mais le cookie n’a jamais été plus petit.

DALL-E, Midjourney et d’autres générateurs d’images fixes se sont améliorés si rapidement au cours des dernières années qu’ils produisent désormais des images presque impossibles à distinguer des photographies. Cela rend plus difficile l’identification de la désinformation en ligne, et de nombreux artistes numériques se plaignent du fait qu’il leur est plus difficile de trouver du travail.

“Nous avons tous ri en 2022 lorsque Midjourney est sorti pour la première fois et a dit : ‘Oh, c’est mignon'”, a déclaré Reid Southen, un artiste conceptuel de films dans le Michigan. “Maintenant, des gens perdent leur emploi à cause de Midjourney.”

Source link

OpenAI dévoile Sora, une IA qui génère des vidéos époustouflantes

Comments

Leave a Reply Cancel reply