Découvrir > OpenAI Sora : et maintenant l’intelligence artificielle crée des vidéos

Written by Florence Santrot• 19 février 2024• 16 h 14 min• Découvrir, Tech-Sciences

OpenAI Sora : et maintenant l’intelligence artificielle crée des vidéos

Après DALL-E pour les images et ChatGPT pour le texte, OpenAI dévoile Sora. Cette nouvelle IA générative est capable de créer des vidéos de toute pièce. Bluffant… mais pas tout le temps !

Le 19/02/2024 par Florence Santrot

Extrait d'une vidéo créée par Sora, le nouvel outil text-to-video d'OpenAI. Crédit : OpenAI.

Plus vrais que natures, les petits films générés par Sora sont relativement bluffants. Si certains rendus demeurent encore grotesques, on voit déjà émerger le potentiel de ce nouvelle outil d’intelligence artificielle (IA). Dévoilé le le 15 février 2024, il vient compléter l’éventail de services proposé par la firme américaine, après l’incroyable succès de DALL-E et ChatGPT. À en croire le buzz autour de Sora, la popularité de cette IA “text-to-video” (création de vidéos sur instructions textuelles) pourrait être similaire à ses congénères. Si Sora n’est pas encore accessible au grand public, cela ne saurait tarder.

Actuellement, OpenAI a ouvert l’accès à son nouvel outil à un petit groupe de développeurs et de spécialistes en cybersécurité (les membres Red. Ils testent cette nouvelle IA pour identifier les points forts et les points faibles et faire remonter leurs critiques à la société de Sam Altman. Outre identifier les “hallucinations” de Sora, la crainte est évidemment que cet outil ne serve à créer des deepfakes ou à diffuser de la désinformation. D’ailleurs, OpenAI a déclaré vouloir prendre des “mesures de sécurité importantes” avant de proposer Sora aux internautes. Parallèlement, une poignée de créateurs de contenu expérimente l’outil pour en tester les capacités créatives.

Sora, mode d’emploi

Comment fonctionne concrètement Sora et comment génère-t-il techniquement ces vidéos bluffantes ? Voici les étapes du processus de génération de l’IA :

1. Saisie de la description textuelle :

L’utilisateur décrit la vidéo souhaitée en langage naturel, précisant le sujet, l’action, le lieu, l’ambiance, etc.
Plus la description est détaillée et précise, plus le résultat sera précis et cohérent.

2. Analyse et traitement du texte :

Sora utilise le modèle de langage GPT-4 d’OpenAI pour analyser la description et en extraire les éléments clés.
Il identifie les concepts visuels, les relations entre eux et les intentions de l’utilisateur.

3. Génération de l’image vidéo :

Sora s’appuie sur un modèle de génération d’images de type DALL-E 3 pour créer des images à partir des concepts visuels identifiés.
Il utilise une technique de “récapitulation” pour générer des légendes descriptives des images et garantir leur cohérence avec la description textuelle.

4. Assemblage des images en vidéo :

Les images générées sont ensuite assemblées pour créer une vidéo fluide et cohérente (du moins c’est le résultat attendu, mais si parfois ce n’est pas le cas !).
Sora peut également générer des transitions et des effets spéciaux pour agrémenter la vidéo.

5. Ajustement et finalisation :

L’utilisateur peut visionner la vidéo générée et apporter des ajustements à la description textuelle si nécessaire.
Il peut également choisir de modifier la durée de la vidéo, le style visuel, etc.

Points importants à retenir:

Sora est encore en phase de développement et n’est pas accessible au grand public.
Son utilisation nécessite une certaine expertise en matière de langage naturel et de génération d’images.
Les vidéos générées par Sora peuvent être très réalistes, mais il est important de garder à l’esprit qu’il s’agit d’une technologie de synthèse d’images et non d’une captation de la réalité.

Sora : de l’excellent, du bon et… du très mauvais

Si certains résultats sont bluffants, d’autres tests se montrent carrément décevants, voire ridicule. Si le grand public ne peut pas tester directement Sora, il est possible de suggérer sur X/Twitter à Sam Altman des idées de prompts qu’il soumet lui-même à sa nouvelle IA. Et même quand le rendu est mauvais, le PDG d’OpenAI joue la transparence et partage :

https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024

Mais d’autres exemples donnent vraiment envie de jouer avec cette nouvelle IA générative :

Prompt: “A gorgeously rendered papercraft world of a coral reef, rife with colorful fish and sea creatures.” pic.twitter.com/gzEE8SwP81
— OpenAI (@OpenAI) February 15, 2024

Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024

Prompt: “A half duck half dragon flies through a beautiful sunset with a hamster dressed in adventure gear on its back”#AI #Sora #OpenAI

(7/n) pic.twitter.com/S0cm1D4mvi
— Pranav Arya (@PranavArya37) February 15, 2024

Prompt: “An instructional cooking session for homemade gnocchi hosted by a grandmother social media influencer set in a rustic Tuscan country kitchen with cinematic lighting”#AI #Sora #OpenAI

(12/n) pic.twitter.com/Psq6jGLONF
— Pranav Arya (@PranavArya37) February 15, 2024

"a photorealistic video of a butterfly that can swim navigating underwater through a beautiful coral reef"

Video generated by Sora pic.twitter.com/nebCKLa09U
— Tim Brooks (@_tim_brooks) February 17, 2024

SOUTENEZ WE DEMAIN, SOUTENEZ UNE RÉDACTION INDÉPENDANTE
Inscrivez-vous à notre newsletter hebdomadaire
et abonnez-vous à notre magazine.

A lire aussi :

L’IA entre au bloc : promesses, résistances et avenir de la chirurgie augmentée
Robots assistant les chirurgiens, logiciels prédisant les durées d'opération, algorithmes détectant les erreurs humaines… Dans les blocs opératoires, l'intelligence artificielle gagne du terrain. Les promesses sont immenses mais elles ne vont pas sans réticences ni défis à relever.
De Sentier Valley à La Boétie Valley : la mue du cœur start-up de Paris
Une tribune d’Emmanuel Papadacci-Stephanopoli, Directeur Général Délégué, Le Village by CA Paris.
Surveillance des saumons par IA, élevages à terre… comment rendre l’aquaculture (un peu) plus durable
Face aux critiques croissantes contre l'aquaculture intensive des saumons, deux voies émergent pour rendre la filière plus responsable : la surveillance algorithmique poussée de Tidal et l'aquaculture terrestre durable de RE:OCEAN. Ces initiatives innovantes pourraient transformer durablement une industrie controversée.

Nos partenaires :

La Région Occitanie innove et accueille en résidence une philosophe
Depuis janvier 2024, la philosophe Gabrielle Halpern a pris ses quartiers à la Cité de l’économie et des métiers de demain en Occitanie. Objectif ? Réfléchir sur les défis à venir en promouvant l’hybridation des savoirs et des pratiques.
Les Napoleons : au-delà des sommets
Cette communauté de décideurs et d'acteurs du changement (innovation, environnement, social) organise, chaque année, deux sommets pour favoriser la collaboration et le partage d'idées novatrices. L'occasion aussi de proposer une plateforme pour les penseurs avant-gardistes et, ainsi, inspirer la transition.
“Plus de 1000 start-up françaises sont aujourd’hui des entreprises à impact”
DG de France Digitale, collectif de 2 000 start-up, Maya Noël est la marraine 2024 du Prix Entreprendre pour demain créé par la Fondation Sopra Steria- Institut de France et qui met en avant des start-up qui font sens. Le thème de cette édition ? "Une Tech responsable au service de l’environnement et de la solidarité."