Oubliez ChatGPT, la vraie révolution s’appelle Whisper V3 et vous pouvez l’utiliser sur votre iPhone
L’arrivée des intelligences artificielles génératives dans nos vies menée par ChatGPT a fait une évidence : de nombreuses autres entreprises ont pris le train en marche et il existe un bon nombre d’alternatives et d’outils similaires. Ideogram ou le Copilot de Microsoft en sont la preuve.
Et le rythme ne s’arrête pas, car il existe une IA que nous ne devons pas ignorer dans toute cette révolution. Il s’appelle Whisper V3, il est capable de transcrire tout audio que vous envoyez et nous pouvons l’utiliser sans problème même depuis l’iPhone.
Qu’est-ce que Whisper V3
Whisper V3 est un modèle de reconnaissance vocale basé sur l’IA, capable de transcrire l’audio là où il y a une conversation. Il est capable de le faire en plusieurs langues, y compris l’espagnol ; et contrairement aux autres moteurs, c’est Open source. Son code peut être consulté par n’importe qui depuis Github.
Le moteur Whisper V3 n’est pas une blague : il est le résultat de apprenez la reconnaissance vocale à partir de plus d’un million d’heures d’audio, et les corrections ont été si raffinées que dans le cas de l’espagnol, la marge d’erreur est désormais inférieure à 5 %. Il détecte même les pauses dans les conversations et les traduit en signes de ponctuation dans le texte.
Le potentiel est énorme : pour les professionnels, il peut être utilisé pour transformer une vidéo ou une interview complète en texte pur, transcrit automatiquement et éliminant ainsi beaucoup de travail mécanique. Au niveau national, cela pourrait être l’évolution d’outils comme LuzIA, qui nous proposent déjà de transcrire les audios qu’ils nous envoient en texte ; et un excellent outil de traduction multilingue. Car oui, Whisper V3 est aussi capable de traduire.
Comment utiliser Whisper V3 sur iPhone
Pour utiliser Whisper V3 depuis l’iPhone, il suffit d’ouvrir un navigateur depuis celui-ci et d’accéder à cette page Web. Nous y verrons une section à partir de laquelle nous pouvons télécharger un fichier audio, que nous aurons préalablement enregistré pour pouvoir y accéder depuis l’application fichiers. Vous pouvez faire un test rapide en enregistrant de l’audio avec l’application Voice Memos et en l’exportant avec l’option « Enregistrer dans des fichiers », par exemple.
Dans Whisper, appuyez sur la section « Audio » pour ajouter un fichier audio. Dans le menu qui apparaîtra, appuyez sur « Sélectionner un fichier » et sélectionnez le fichier audio que vous avez enregistré dans l’application Fichiers (le plus simple est de l’avoir dans iCloud Drive).
Une fois l’audio téléchargé, sélectionnez ‘es’ dans le menu ‘Langue’ pour que Whisper V3 voie que l’audio que vous avez téléchargé est en espagnol. Enfin, appuyez sur le bouton « Exécuter » :
Dans mes tests, Whisper V3 Il a fallu environ huit minutes pour transcrire presque parfaitement un audio de 22 minutes. Le texte apparaît sur le site Web lui-même une fois le processus terminé, et vous pouvez le copier et le coller dans l’application avec laquelle vous souhaitez travailler :

Bien entendu, puisqu’il s’agit d’un site internet, toute cette démarche peut également se faire depuis un iPad ou un Mac. Je ne pense plus avoir besoin de transcrire manuellement une interview..
Images | CDX