Sora d’OpenAI : Entraîné sur des jeux vidéo et des streamers ?

Le 12/12/2024

Récemment, le modèle d'IA générative Sora d'OpenAI a suscité de nombreuses questions quant à ses sources d'entraînement. Bien que l'entreprise soit restée floue sur les détails. Plusieurs indices laissent penser que Sora aurait été formé à partir de divers contenus. Notamment des jeux vidéo et des streams de plateformes populaires comme Twitch.

Sora

Sora : Entraîné avec des séquences de jeux vidéo et des streamers ?

Bien qu'OpenAI n'ait pas confirmé officiellement les données exactes utilisées pour entraîner Sora. Plusieurs indices suggèrent que des contenus de jeux vidéo, tels que Minecraft, Super Mario Bros ou Call of Duty, ont joué un rôle important. Plus surprenant encore. Il semble que Sora ait appris à reproduire le style de streamers populaires sur Twitch. Tels que Raul Genes et Auronplay​.

Cela a conduit de nombreux observateurs à spéculer qu'OpenAI aurait utilisé des contenus issus de ces streamers, connus pour leurs diffusions en direct engageantes, pour entraîner son modèle.

Génération de Sora
© TechCrunch/Sora - Contenu généré par Sora

Les enjeux juridiques liés à l'utilisation de contenu pour Sora

La question de savoir si OpenAI a utilisé du contenu sous licence non acquise, provenant de sessions de jeux ou de streams Twitch, est essentielle. Si tel est le cas, la société pourrait faire face à des défis juridiques majeurs. Car l'utilisation de ce type de contenu sans autorisation pourrait entraîner des poursuites pour violation des droits d'auteur. OpenAI a affirmé que Sora a été formé à partir de données publiques et sous licence. Mais le manque de transparence concernant les détails précis de l'ensemble de données utilisé soulève des préoccupations​.

Génération Mario par Sora
© TechCrunch

Quelles implications pour l'avenir de l'IA ?

Sora marque une avancée significative dans la capacité des IA à générer des vidéos de haute qualité. La capacité du modèle à traiter des formats et résolutions variés, combinée à son apprentissage profond à partir de séquences de jeux vidéo et de contenus de streams. Ouvre de nouvelles perspectives pour les créateurs de contenu et les développeurs.

Cependant, cela soulève aussi d'importantes questions éthiques et juridiques concernant l'utilisation des données et les droits des créateurs dont le matériel a pu être utilisé sans autorisation.

Sora d'OpenAI pourrait redéfinir la manière dont l'IA génère du contenu vidéo. Mais les spéculations sur ses sources d'entraînement, notamment les jeux vidéo et les streams. Soulignent la nécessité d'établir des lignes directrices plus claires dans l'industrie de l'IA.

À mesure que les technologies d'IA évoluent, la transparence et les considérations éthiques joueront un rôle crucial dans la définition de l'avenir des modèles génératifs comme Sora.

💡Cet article vous a plu ? Lisez également : Patchwork : Le Nouveau Tableau Blanc de Midjourney