Apple fait un pas de géant avec l'IA : elle surpasse déjà GPT-4 dans un aspect clé
Apple commence le deuxième trimestre de l'année en annonçant des nouvelles en intelligence artificielle. Des chercheurs basés à Cupertino ont révélé un nouveau modèle basé sur l'IA capable de fournir un contexte sur ce qui est affiché sur l'écran de l'appareil. Faites attention au nom de Royaume et, selon le rapport publié, il est capable de surpasser GPT-4.
L'objectif de ce nouveau système est d'améliorer la conversation, permettant des interactions plus naturelles grâce au contexte visuel. ReALM ajoute à l'équation le informations affichées à l'écranla voix n'est donc plus le seul élément avec lequel l'utilisateur peut communiquer.
En outre, les possibilités ne consistent pas seulement à fournir davantage d'informations, il serait également possible de faire des questions spécifiques sur ce que l'écran affiche. Les recherches d'Apple en sont à leurs débuts, mais elles sont déjà en mesure de publier un classement dans lequel ReALM surpasse ses concurrents directs.
L'IA d'Apple surpasse déjà le GPT-4 en termes de performances
Bien sûr, le pouvoir Voir, lire et comprendre des informations sur l'écran n'est pas quelque chose de nouveau. La plupart des langues et des entreprises travaillent sur quelque chose de similaire avec des objectifs très différents. Apple est l'un des plus intéressés, puisque son le catalogue est plein d'appareils avec panneaux et vous pouvez tirer beaucoup de profit de ce système.
Même si elle n’est pas la première à annoncer ses recherches, elle a réussi à être l’une des meilleures. Les chercheurs ont écrit que la version la plus avancée de ReALM est capable de surpasser GPT-4 pour capturer des références visuelles (références d'écran).
Le rapport publié par Apple présente un tableau de scores dans lequel RéALM-3B, sa version la plus puissante, est capable de surpasser MARRS, GPT-3.5 et GPT-4 en termes de frappes à l'écran. L'entreprise souligne que votre système est beaucoup plus petit et pourtant, il offre les meilleurs résultats.
La clé pour améliorer Siri
Que Siri, l'assistant virtuel d'Apple, ait un temps de retard sur la concurrence est un fait. ReALM permet entrevoir un avenir prometteur pour Siri sur tous les appareils de l'entreprise. Il contexte visuel de l'écran ouvre les portes à une nouvelle façon d’interagir avec l’IA et les assistants virtuels.
À l'avenir, lorsque ReALM s'intégrera à Siri, vous permettra de lire les informations affichées à l'écran pour résoudre les doutes ou même afficher des informations intéressantes sans que l'utilisateur ne le demande.
Un bon exemple pourrait être la visualisation automatique du site Web d'un restaurant et de l'iPhone. détecter une adresse sur l'écran pour fournir une notification Maps avec l'itinéraire de conduite.
Enfin, Apple a également commenté les limites de ce système. Selon le document, Passer du simple texte aux images est un processus complexe et cela nécessite des systèmes beaucoup plus avancés. Siri pourrait offrir un contexte lors de l'affichage du texte, mais différencier les images ou les analyser ne semble pas aussi proche.