OpenAI, le créateur de ChatGPT, a annoncé la publication d’un nouveau modèle d’IA appelé GPT-4o. Ce modèle est capable de mener des conversations vocales réalistes et d’interagir à travers du texte et des images. Il s’agit de sa dernière initiative pour rester en tête dans la course à la domination de cette technologie émergente.
Les chercheurs d’OpenAI ont montré lors d’un événement diffusé en direct que les nouvelles fonctionnalités audio permettent également aux utilisateurs de parler à ChatGPT et d’obtenir des réponses en temps réel sans délai, ainsi que d’interrompre ChatGPT pendant qu’il parle, deux caractéristiques des conversations réalistes que les assistants vocaux basés sur l’IA ont eu du mal à reproduire.
Dans un article de blog, le PDG d’OpenAI, Sam Altman, déclare que ça ressemble à de l’IA sortie tout droit des films, et que parler à un ordinateur n’a jamais semblé vraiment naturel , mais actuellement , c’est le cas.
Lors de l’événement live , les chercheurs d’OpenAI ont présenté les nouvelles capacités d’assistant vocal de ChatGPT. Dans une démonstration, ChatGPT a utilisé ses capacités de vision et de voix pour guider un chercheur dans la résolution d’une équation mathématique sur une feuille de papier.
Dans une autre démonstration, les chercheurs ont montré la capacité du modèle GPT-4o à traduire instantanément des langues en temps réel.
Le nouveau modèle sera disponible dans ChatGPT au cours des prochaines semaines, et serait proposé gratuitement car il est plus rentable que les modèles précédents de l’entreprise, selon la directrice de la technologie d’OpenAI, Mira Murati.