OpenAI lancera le mode vocal avancé en septembre 2024 pour tous les utilisateurs de ChatGPT Plus

OpenAI lancera le « Mode vocal avancé » dans ChatGPT Plus le 24 septembre 2024. En mai, juste avant le keynote de Google I/O 2024, OpenAI a volé la vedette avec un événement médiatique surprise. Dans ce document, ils ont présenté les capacités multimodales innovantes de ChatGPT, qui vous permettent d'interpréter et de répondre au contenu des photos, des vidéos et des écrans d'ordinateur.

Le point culminant a été l'introduction du mode vocal avancé, une fonctionnalité qui a amélioré les capacités conversationnelles de ChatGPT. Ce nouveau mode permettait des interactions plus humaines, dans lesquelles les utilisateurs pouvaient introduire de nouvelles informations sans interrompre le flux de la conversation. De plus, il a introduit des nuances émotionnelles et des variations tonales dans les réponses ChatGPT, reflétant l'expression humaine.

Un jour après les révélations d'OpenAI, Google a présenté des fonctionnalités similaires dans son Gemini AI, lors du keynote I/O. Cependant, aucune des deux sociétés n’était à l’époque prête à déployer à grande échelle ces fonctionnalités avancées. Cet événement a marqué une annonce importante d'OpenAI concernant ses avancées en mode vocal.

Initialement prévu pour juin, le déploiement du mode vocal avancé a été reporté à juillet pour garantir que la fonctionnalité réponde à toutes les normes de sécurité et fournisse des réponses fiables en temps réel. Le 13 août 2024, OpenAI a révélé que le chatbot avait subi des tests approfondis avec plus de 100 testeurs dans 29 régions et dans 45 langues, dans le but d'identifier et de résoudre tout problème potentiel.

Ce développement fait suite à l'annonce par OpenAI de son nouveau moteur de recherche basé sur l'IA, positionné comme un rival potentiel à la domination de Google sur le marché de la recherche en ligne.

Fin juillet, OpenAI a lancé le mode vocal avancé, initialement disponible pour un groupe sélectionné d'utilisateurs de ChatGPT Plus. La société a annoncé son intention d'étendre l'accès à tous les utilisateurs Plus à l'automne, bien qu'aucune date de lancement spécifique n'ait été fournie. Des fuites récentes sur Reddit, découvertes sur le

OpenAI a présenté GPT-4o lors de son événement Spring Update cette année, impressionnant le public avec ses vastes capacités « omni » couvrant le texte, l'image et l'audio. Les démonstrations des différentes fonctionnalités du modèle, notamment le traducteur en temps réel, l'assistant de codage, le tuteur IA, le sympathique compagnon, le poète et le chanteur, ont rapidement retenu l'attention. Malgré les attentes suscitées, le mode vocal avancé attendu n’a pas été lancé.

Plus tard, après l’introduction de o1, la question s’est posée de savoir quand les fonctionnalités vocales seraient disponibles. En réponse, Sam Altman a déclaré : « Que diriez-vous de quelques semaines à être reconnaissant pour l'intelligence magique du paradis, et ensuite vous pourrez bientôt avoir plus de jouets ? », sa réponse teintée de sarcasme.

OpenAI, dans son article sur X, a déclaré : « Pour l'instant, l'accès au mode vocal avancé est déployé dans une version alpha limitée à un groupe sélectionné d'utilisateurs. Bien que l'adhésion Plus de longue date et la sélection SearchGPT soient des indicateurs de votre engagement actif envers notre plateforme, l'accès à l'alpha Advanced Voice le 24 septembre 2024 dépendra d'un certain nombre de facteurs, notamment, mais sans s'y limiter : les invitations à participer et le critères spécifiques établis pour la phase de test alpha. »