ChatGPT peut désormais voir, entendre et parler !!!
Publié le 29 septembre 2023, mis à jour le 16 mars 2024
OpenAI a franchi une étape majeure en intégrant de nouvelles capacités à ChatGPT, lui permettant de voir, d’entendre et de parler. Cette transformation n’est pas seulement une avancée technologique, mais elle redéfinit également la manière dont les utilisateurs peuvent interagir avec le modèle. L’ajout de ces fonctionnalités rend la communication avec ChatGPT plus fluide, intuitive et riche, ouvrant la porte à une multitude d’applications pratiques et innovantes.
Interactions visuelles et vocales avec ChatGPT
La capacité de ChatGPT à interpréter des images change radicalement la manière dont les utilisateurs peuvent solliciter des informations ou des conseils. Imaginons un utilisateur en voyage qui prend une photo d’un monument. Il peut désormais montrer cette image à ChatGPT et obtenir des informations détaillées sur ce qu’il voit. De même, à la maison, une photo du réfrigérateur peut conduire à des suggestions de repas, et une image d’un problème mathématique peut aider un élève à trouver la solution. Parallèlement à cela, la capacité vocale de ChatGPT offre une dimension supplémentaire à l’interaction. Les utilisateurs peuvent désormais parler directement à ChatGPT, que ce soit pour demander une histoire, obtenir des informations ou simplement discuter. Cette interaction vocale est rendue possible grâce à un modèle de synthèse vocale avancé, combiné à Whisper, le système de reconnaissance vocale d’OpenAI.
Cet article est réservé aux membres de nos formations. Pour en savoir plus, n’hésitez pas à nous contacter
Envie d’en savoir plus ou d’être accompagné sur ce type de problématiques digitales, n’hésitez pas à nous contacter !