Apple teste les puces Amazon pour former Apple Intelligence

Apple teste les puces Amazon pour former Apple Intelligence

Apple a testé les puces d’intelligence artificielle d’Amazon pour savoir s’ils sont capables de former leurs modèles de langage. La société de Cupertino a révélé qu’elle évaluait la nouvelle puce Trainium2, développée par Amazon, pour les tâches de pré-formation de ses modèles propriétaires. Apple a ajouté que les premiers tests offraient des résultats positifs en termes d’efficacité.

Selon CNBCApple a eu une participation importante lors de la conférence AWS Reinvent, organisée par Amazon Web Services. Benoit Dupin, directeur de l’apprentissage automatique et de l’intelligence artificielle chez Apple, a révélé que la technologie utilise le cloud AWS pour alimenter des services comme Siri ou Apple Maps. Cependant, l’annonce qui a fait grand bruit concerne les puces d’intelligence artificielle développées par Amazon.

Dupin a déclaré que Apple en est aux premiers stades de l’évaluation de Trainium2une puce spécialement conçue pour prendre en charge des charges de travail d’IA générative plus importantes. Le directeur a ajouté que les premiers chiffres montrent un 50 % d’amélioration de l’efficacité avec la pré-formation.

La relation entre Apple et Amazon n’est pas nouvelle. Dupin a dit que Apple s’appuie sur AWS depuis une décennie pour améliorer ses services. De même, l’entreprise technologique a utilisé des puces telles qu’Inferentia et Graviton pour les services de recherche. Cela fait de la formation avec Trainium2 une étape logique pour Apple, qui a été l’un des premiers à tester la nouvelle puce d’Amazon.

Il s’agit de Trainium2, la puce Amazon qu’Apple utilise pour entraîner ses modèles d’IA

La puce Trainium2 (Trn2) est un élément matériel conçu spécifiquement pour accélérer la formation de modèles de langage à grande échelle (LLM). Selon Amazon, Trainium2 utilise une architecture basée sur MPU capable d’exécuter efficacement les opérations mathématiques requises pendant la phase de formation. la puce prend en charge des modèles avec des milliards de paramètres et utilise des techniques à faible consommation qui garantissent l’efficacité énergétique.

« Trn2 offre un rapport prix/performances 30 à 40 % supérieur à celui de la génération actuelle d’instances EC2 basées sur GPU. Une seule instance Trn2 combine 16 puces Trainium2 interconnectées avec une interconnexion puce à puce ultra-rapide et à large bande passante et une faible latence NeuronLink pour fournir 20,8 pétaflops maximum de calcul, idéal pour former et déployer des modèles de plusieurs milliards de paramètres.

Apple n’est pas le seul à utiliser Trainium2 pour former des modèles d’IA. Amazon a confirmé avoir conclu un accord avec Anthropic utiliser les jetons sur Claude. L’entreprise technologique a révélé qu’elle construisait un cluster appelé Projet Rainier, qui élargira la formation de Claude grâce à des centaines de milliers de puces Trn2 interconnectées aux réseaux EFA.

Utiliser Trainium2 pour alimenter l’IA d’Apple n’est pas déraisonnable. Outre l’association avec AWS, l’entreprise technologique s’est appuyée sur des puces développées par ses concurrents. Nous voyons l’exemple le plus évident avec le Processeurs Google pour former la famille de modèles fondamentaux d’Apple.

A lire également