YouTube lance un avertissement à OpenAI : utiliser ses vidéos pour entraîner Sora est contraire aux règles
sora Il s’agit de loin du modèle texte-vidéo le plus efficace disponible aujourd’hui. L'intelligence artificielle de OpenAI Il n'est pas encore accessible au grand public, mais il y a déjà eu un vif débat sur les matériaux avec lesquels il a été formé. Spéculations autour de l'utilisation possible de vidéos de Youtube Cela ne s'est pas fait attendre, même si cela n'a pas été prouvé. Et le leader de la plateforme n'a pas hésité à lancer un avertissement à Sam Altman et compagnie : Si vous utilisez ses vidéos, vous enfreindrez les règles.
Dans une interview avec Bloomberg, Neal Mohan, PDG de YouTube, a averti que l'extraction de vidéos publiées sur la plateforme pour entraîner des modèles d'IA constitue une violation de ses conditions d'utilisation. Cependant, il a admis n'avoir aucune connaissance « directe » du fait qu'OpenAI avait utilisé le service Google pour former et perfectionner Sora.
L'exécutif a également indiqué que Même Google, sa société mère, n'a pas un accès illimité à YouTube pour former Gemini, son IA de nouvelle génération. Mohan a précisé que tous les créateurs ne publient pas de contenu selon les mêmes conditions de licence et qu'une plus petite partie des vidéos peut être utilisée par ceux de Mountain View. Mais tout dépend du type d’accord signé par les utilisateurs.
Concernant OpenAI et Sora, le successeur de Susan Wojcicki, elle a expliqué que les conditions d'utilisation n'empêchent pas seulement l'utilisation de vidéos complètes hébergées sur YouTube. Il est également interdit scrapper des parties de clips ou des transcriptions audio comme matériel de formation pour les modèles linguistiques.
Sora ne peut pas être entraîné à l'aide de vidéos YouTube
Même s'il ne sait pas qu'OpenAI utilise des vidéos YouTube pour entraîner Sora, il est clair que Neal Mohan ne reste pas indifférent aux rumeurs. « Du point de vue d'un créateur, lorsque vous téléchargez votre travail sur notre plateforme, vous avez certaines attentes. L'une de ces attentes est que les conditions d'utilisation soient respectées. Elles ne permettent pas de télécharger des éléments tels que des transcriptions ou des clips vidéo, qui représentent « une violation flagrante de ces directives. Ce sont les règles du jeu en termes de contenu sur notre plateforme », a noté l'exécutif.
Les soupçons selon lesquels OpenAI pourrait utiliser YouTube pour entraîner Sora se sont accrus après une interview de Mira Murati avec Le journal de Wall Street. Lorsqu'on leur a demandé s'ils avaient exploité cette plateforme pour perfectionner leur nouvelle IA, il a dit qu'il ne savait pas. Quelque chose d'assez curieux, étant donné qu'elle est la responsable technologique de l'entreprise.
L'équipe de Sam Altman a évité de fournir des détails sur ce que contiennent les ensembles de données utilisés avec Sora. Ils ont seulement indiqué qu'ils utilisaient des « informations accessibles au public » et du contenu sous licence. Concernant ce dernier, la seule chose que l’on sait c’est qu’OpenAI a noué une alliance avec Shutterstockl'un des principaux fournisseurs mondiaux de photos et de vidéos.
La méfiance envers OpenAI pour le développement de Sora n’est pas sans fondement. Au début de cette année, l'entreprise a déclaré que c'était impossible former de nouveaux modèles d’IA sans utiliser de matériel protégé par le droit d’auteur.
« Limiter les données de formation aux livres et dessins du domaine public créés il y a plus d'un siècle pourrait produire une expérience intéressante, mais cela ne fournirait pas de systèmes d'intelligence artificielle répondant aux besoins des citoyens d'aujourd'hui. »
OpenAI.
La firme californienne a de grands projets pour Sora. Récemment, OpenAI a commencé à faire hall d'entrée à Hollywood pour une utilisation dans les films et séries télévisées. Son utilisation a même été ouverte à certains réalisateurs et artistes de haut niveau afin qu'ils puissent l'essayer et constater son potentiel.