L’API Realtime permet aux applications de traiter des commandes vocales et de fournir des réponses audio sans étapes intermédiaires, en utilisant directement les modèles d’IA. Cela devrait encourager la création d'applications proposant des interfaces vocales conversationnelles, dans les call centers comme dans les compagnons IA.
Des applications comme Healthify (entreprise indienne spécialisée dans le bien-être) et Speak (une application d'apprentissage des langues) testent déjà le moteur de reconnaissance vocale d’OpenAI. Mais la principale utilisation de cette technologie se trouve dans les smartphones : ChatGPT préfigure l’avenir de Siri.
À SURVEILLER : La capacité d'innovation d’OpenAI. Le contraste avec le DevDay 2023 est saisissant. Non seulement l’événement de cette année a eu lieu presque en catimini, mais ses annonces techniques ont été éclipsées par la présentation de GPT o1 deux semaines auparavant et la levée de fonds de cette nuit. De quoi faire oublier, peut-être, que la plateforme d’agents lancée au DevDay 2023 n’a pas été un franc succès. Et que GPT-5 semble encore au-delà de l’horizon, alors que nombreux modèles ont désormais atteint les performances de GPT-4.