ChatGPT peut désormais voir, entendre et parler !!!
Publié le 29 septembre 2023
Écouter une version audio de cet article
OpenAI a franchi une étape majeure en intégrant de nouvelles capacités à ChatGPT, lui permettant de voir, d’entendre et de parler. Cette transformation n’est pas seulement une avancée technologique, mais elle redéfinit également la manière dont les utilisateurs peuvent interagir avec le modèle. L’ajout de ces fonctionnalités rend la communication avec ChatGPT plus fluide, intuitive et riche, ouvrant la porte à une multitude d’applications pratiques et innovantes.
Interactions Visuelles et Vocales avec ChatGPT
La capacité de ChatGPT à interpréter des images change radicalement la manière dont les utilisateurs peuvent solliciter des informations ou des conseils. Imaginons un utilisateur en voyage qui prend une photo d’un monument. Il peut désormais montrer cette image à ChatGPT et obtenir des informations détaillées sur ce qu’il voit. De même, à la maison, une photo du réfrigérateur peut conduire à des suggestions de repas, et une image d’un problème mathématique peut aider un élève à trouver la solution. Parallèlement à cela, la capacité vocale de ChatGPT offre une dimension supplémentaire à l’interaction. Les utilisateurs peuvent désormais parler directement à ChatGPT, que ce soit pour demander une histoire, obtenir des informations ou simplement discuter. Cette interaction vocale est rendue possible grâce à un modèle de synthèse vocale avancé, combiné à Whisper, le système de reconnaissance vocale d’OpenAI.
Sécurité, Éthique et Déploiement
Avec de telles avancées, des préoccupations en matière de sécurité et d’éthique émergent naturellement. OpenAI est pleinement conscient des défis que ces nouvelles capacités peuvent poser. Par exemple, la technologie vocale, bien qu’offrant de nombreuses applications créatives, présente également des risques, tels que l’imitation de voix. De même, les modèles basés sur la vision peuvent parfois interpréter incorrectement une image ou être utilisés de manière inappropriée. C’est pourquoi OpenAI déploie ces fonctionnalités avec prudence, en mettant l’accent sur la sécurité et le respect de la vie privée. La mise à jour sera initialement disponible pour les utilisateurs Plus et Enterprise, avec un déploiement progressif pour garantir une expérience utilisateur optimale.

Nos formations ChatGPT
Optimisez votre temps de production et augmentez l’efficacité de votre équipe grâce à notre formation sur l’utilisation de ChatGPT pour la création de contenus éditoriaux, le référencement, la traduction, les réseaux sociaux et bien plus encore, tout en abordant les questions éthiques importantes liées à cette technologie.
Comment accéder à cette nouvelle fonctionnalité
Fonctionnalité vocale
Si vous utilisez ChatGPT sur iOS ou Android, accédez à « Paramètres » (ou « Settings » en anglais). Recherchez la section « Nouvelles fonctionnalités » (ou « New Features » en anglais). Activez l’option de conversation vocale. Une fois activée, vous devriez voir un bouton en forme de casque dans le coin supérieur droit de l’écran d’accueil. Cliquez sur ce bouton et choisissez votre voix préférée parmi les cinq voix différentes proposées.
Fonctionnalité d’images
Pour montrer une ou plusieurs images à ChatGPT, recherchez le bouton de photo. Si vous êtes sur iOS ou Android, vous devrez peut-être d’abord cliquer sur le bouton « + ». Après avoir cliqué sur le bouton de photo, vous aurez la possibilité de capturer ou de choisir une image depuis votre appareil. Si vous souhaitez mettre l’accent sur une partie spécifique de l’image, vous pouvez utiliser l’outil de dessin disponible dans l’application mobile.
Il est important de noter que ces nouvelles fonctionnalités sont en cours de déploiement et seront initialement disponibles pour les utilisateurs Plus et Enterprise au cours des deux prochaines semaines. Si vous êtes un utilisateur de l’une de ces catégories, vous devriez pouvoir accéder à ces fonctionnalités prochainement. Pour les autres groupes d’utilisateurs, y compris les développeurs, OpenAI prévoit de déployer ces capacités peu de temps après.
Exemples d’utilisation
You can give ChatGPT a picture of your team’s whiteboarding session and have it write the code for you.
This is absolutely insane. pic.twitter.com/bGWT5bU8MK
— Mckay Wrigley (@mckaywrigley) September 27, 2023
Yes ChatGPT, I am indeed entertained. pic.twitter.com/XcENUMVcBF
— Peter Yang (@petergyang) September 27, 2023
I gave ChatGPT a screenshot of a SaaS dashboard and it wrote the code for it.
This is the future. pic.twitter.com/9xFgFdv4MM
— Mckay Wrigley (@mckaywrigley) September 27, 2023
I will never get a parking ticket again. pic.twitter.com/yl7ND2rJeQ
— Peter Yang (@petergyang) September 27, 2023
ChatGPT image recognition vs "Crazy Pentagon PowerPoint Slides:"
(h/t @jonst0kes 🫡) pic.twitter.com/MX3NhTpG1n
— Sean Spriggens (@seanspriggens) September 26, 2023
Cette mise à jour de ChatGPT est une avancée significative dans le domaine des modèles de langage et de l’intelligence artificielle. Elle illustre la convergence entre différentes modalités d’interaction, rendant l’IA plus accessible et utile pour un public plus large. Alors que nous nous tournons vers l’avenir, il est passionnant de réfléchir aux possibilités infinies que ces innovations peuvent nous offrir !
Envie d’en savoir plus ou d’être accompagné sur ce type de problématiques digitales, n’hésitez pas à nous contacter !