Google utilisera Reddit pour entraîner son intelligence artificielle

Google utilisera Reddit pour entraîner son intelligence artificielle

Après plusieurs jours de rumeurs, Google et reddit ont officialisé leur « partenariat élargi ». Grâce à ce nouvel accord, les utilisateurs de Mountain View auront accès à l’API de données du forum populaire et Ils pourront utiliser son contenu pour entraîner leurs modèles d’intelligence artificielleentre autres problèmes.

Les déclarations des deux sociétés sont assez brèves sur la portée de cette collaboration. Ce que Reddit a mentionné, c’est que l’intégration donnera à Google « des moyens plus efficaces de former ses modèles », sans s’étendre davantage sur le sujet.

En échange, Reddit pourra profiter de Vertex AI. La plateforme l’utilisera pour améliorer ses recherches internes et « d’autres capacités », ont indiqué les Californiens.

Mais l’accès de Google à l’API de données de Reddit ne lui permettra pas seulement d’utiliser son contenu pour « alimenter » ses modèles d’IA. Ceux de Sundar Pichai assurent également que cette alliance aidera faciliter l’affichage des résultats et des informations de Reddit dans ses différents services.

« En rendant le contenu et les communautés Reddit plus faciles à trouver, nous pouvons maintenir notre croyance dans un Internet ouvert tout en servant mieux les utilisateurs actuels et en atteignant de nouveaux publics », a déclaré la société par Steve Huffman.

Google entraînera son IA avec le contenu de Reddit

Même si le nouvel accord entre les entreprises ne révèle pas grand-chose, il fait du bruit depuis plusieurs jours. Il y a quelques heures, en fait, Reuters a signalé que Google le paierait 60 millions de dollars par an à Reddit pour obtenir une licence sur le contenu de leur site. Pour l’instant, les deux sociétés ont évité d’évoquer l’aspect monétaire de cette affaire.

Ce qui n’est pas clair, c’est comment Google utilisera les publications Reddit pour former ses modèles linguistiques. Plus précisément, si ceux de Mountain View effectueront un certain type de filtrage sur les publications. Ou s’ils jettent directement tout ce qui est inclus dans les différents subreddits à leur intelligence artificielle, sans aucun type de distinction.

Même si Reddit est extrêmement populaire, n’est pas étranger à la controverse. Notamment à cause du manque de modération des contenus dans certaines de ses communautés. Gardons à l’esprit qu’au-delà des mèmes et des divertissements, il existe des subreddits dans lesquels les femmes sont soumises à un chantage avec des photos et des vidéos sexuelles, ainsi que d’autres dans lesquels sont partagés de la violence graphique ou du matériel pro-nazi, pour ne citer que quelques exemples.

Cet accord constitue également une sorte de victoire pour Reddit. En octobre dernier, l’entreprise a menacé de bloquer les trackers de recherche Google et Bing pour empêcher son contenu d’apparaître sur leurs pages de résultats respectives. Il s’agissait d’empêcher des entreprises comme OpenAI d’utiliser le contenu du site pour entraîner leurs modèles d’IA sans licence préalable.

Selon Reutersl’argent de Google aidera Reddit générer de nouveaux revenus sans compter exclusivement sur les publicités en ligne. Quelque chose de crucial pour démontrer qu’elle est financièrement viable face à sa cotation imminente en bourse.

Pour l’instant, Reddit a commenté que l’accord avec Google ne modifie pas les conditions d’accès à son API de données. Cela signifie que son contenu ne peut être utilisé à des fins commerciales sans autorisation préalable.

A lire également