C'est ainsi qu'Apple a créé les deux modèles d'IA qui pilotent Apple Intelligence
Vous êtes peut-être un peu confus au sujet d'Apple Intelligence, de la présence de Sam Altman dans le WWDC2024 et tout ce qui englobe nouvelle IA des appareils Apple. Après s'être remis de la gueule de bois de Discours d'ouverturel'entreprise a voulu expliquer comment fonctionne votre nouveau système d'intelligence artificiellequi est basé sur deux nouveaux modèles de langage créé et formé à partir de zéro.
Pourquoi pas, certaines fonctions Apple Intelligence sont liées à ChatGPT ne signifie pas que votre IA utilise des modèles OpenAI comme GPT-4. En fait, la société de Cupertino n'a même pas emprunté le potentiel de cette dernière pour créer la base capable d'offrir ses fonctions basées sur l'intelligence artificielle.
Une fois que cela est clair, Apple a cherché à disposer de deux modèles différents pour différentes tâches. Le premier est chargé de exécuter à l'intérieur des appareils —iPhone, iPad ou Mac—et ne « va » pas à l'extérieur ni ne communique avec des serveurs externes pour effectuer des tâches. Autrement dit, tout ce dont vous avez besoin est fourni par les performances des appareils eux-mêmes.
La seconde fait le contraire. Cela fonctionne sur les serveurs de l'entreprise, qui utilisent d'ailleurs des milliers de puces M2 Ultra pour créer un immense centre de données. Toutes ces fonctionnalités Apple Intelligence qui nécessitent plus de puissance de calcul sont résolus en externe avec un modèle de langage différent du précédent.
En fait, cette différence est l'une des rares que présentent les deux modèles, puisqu'ils ont été formé de la même manière en tenant compte de ses possibilités. Comme vous pouvez l'imaginer, le modèle fonctionnant sur les appareils est beaucoup moins puissant que l'autre, même s'ils suivent tous deux des règles très similaires en termes de confidentialité, données, gestion des informations personnelles ou contenu malveillant.
Avec quelles données les modèles Apple Intelligence sont-ils formés ?
Eh bien, nous devons commencer par le début. Afin de créer un modèle de langage, Apple a besoin de plusieurs éléments, parmi lesquels données. L'entreprise a appelé cette phase « pré-formation » et a expliqué plusieurs éléments fondamentaux à garder à l'esprit concernant le informations que vous utilisez pour fournir du contenu à vos modèles.
Le plus important c'est que Apple n'utilise aucune donnée personnelle ni interaction privée dans la formation. Auditez simplement les données sur Internet afin que rien ne soit divulgué aux utilisateurs. Selon l'entreprise de Cupertino, le volume de données est si massif qu'il permet d'accéder aux cartes de crédit ou aux comptes de sécurité sociale. Mais comme nous vous l'avons déjà dit, filtrer tout ce contenu pour le supprimer de votre modèle de langage.
De plus, dans cette phase de collecte de données, ils appliquent également des filtres pour les mots malveillants, informations en double et se concentre sur tout ce qui est considéré comme un contenu de haute qualité.
L'après-formation
Une fois la première phase terminée, Apple s'est rendu compte que le La qualité des données était essentielle pour obtenir un modèle linguistique efficace et avec une bonne évolutivité pour Apple Intelligence, il s'est donc mis au travail pour créer deux algorithmes qui auditeraient à nouveau toutes les informations collectées et seraient capables de conserver les données. C'est-à-dire, je peaufine toujours tout le contenu qui connaissait déjà les modèles.
La bonne nouvelle est que les deux algorithmes fondent leur fonctionnement sur apprentissage humain et offrent des capacités formées par des humains, qui, selon Apple, se traduisent par des instructions de modèle de langage de meilleure qualité. Ce qui, à son tour, donne à Apple Intelligence plus de capacités humaines.
Optimisation
Une fois que les modèles ont obtenu les données nécessaires et que celles-ci ont été auditées au millimètre près, il était temps de les optimiser pour que ses performances soient suffisamment puissantes. Apple s'est concentré sur la priorité vitesse de gros plan jeton, atteignant une latence sur l'iPhone 15 Pro de 0,6 milliseconde. De plus, ce même appareil offre un taux de génération de 30 jetons par seconde.
Les deux modèles responsables du déplacement d'Apple Intelligence utilisent des requêtes groupées, qui réduit la quantité de mémoire et les performances brutes et améliore considérablement l'efficacité.
Adaptation des modèles aux fonctions Apple Intelligence
Avec des performances optimisées, Apple a été chargé de ajuster les possibilités des deux modèles aux tâches de base d'Apple Intelligence. Et cela n'a pas été facile, puisque la plupart des entreprises ouvrent la porte à tout, mais quand l'idée est d'utiliser ces modèles sur un iPhone, un iPad ou un Mac, il faut les adapter aux tâches qu'ils peuvent accomplir de tels appareils.
Ces adaptations permettent aux modèles d'avoir le capacité à se spécialiser à la volée dans des tâches très spécifiques telles que des résumés par courrier électronique ou des recommandations Siri, en plus d'être évolutif de manière simple et efficace.
En bref, ils ont réussi à créer et à former deux modèles de langage d'IA complètement nouveaux et avec le capacité à améliorer la façon dont vous vous exprimez, travaillez et communiquez via les produits Apple.