Prestations

Conception de site web, optimisation du référencement, stratégie websociale… Quelle que soit votre problématique digitale, nous avons les experts et les garanties qu’il vous faut ! Nous consultants vous accompagnent avant, pendant et après la mise en place de votre projet pour un résultat à la hauteur de vos ambitions.

Formations

Organisme reconnu et certifié, Tous les Jeudis met en place des formations personnalisées en fonction de vos attentes. N’hésitez plus à faire appel à nos formateurs pour faire monter en compétence vos équipes sur des thématiques digitales variées.

Actualités

Are you ready ? Gemini évolue vers l’agent IA multimodal

Publié le 10 juin 2026

Actualités

Écouter une version audio de cet article

Google pousse Gemini dans une direction très lisible : celle d’un agent conversationnel capable de comprendre un contexte, de dialoguer dans la durée et d’agir à partir de consignes personnalisées. Dans une annonce publiée début juin 2026, Google présente Gemini Spark comme un agent personnel disponible 24/7, conçu pour aider l’utilisateur à avancer sur ses objectifs, sous sa direction, avec une intégration aux applications Workspace.

La formule est marketing, bien sûr. Mais elle traduit un déplacement concret : Gemini n’est plus seulement utilisé pour obtenir une réponse rapide, il devient un compagnon de travail paramétrable, connecté à des usages quotidiens. Ce glissement change la manière de se former à Gemini. La compétence clé n’est pas de connaître quelques prompts spectaculaires. Elle consiste à construire une conversation utile, à donner du contexte, à corriger la trajectoire, puis à transformer le résultat en action. Dans Gmail, Docs, Sheets ou Slides, l’intérêt de Gemini tient à sa capacité à intervenir au bon endroit du flux de travail. Google rappelle par exemple que Gemini dans Slides peut générer des images, créer de nouvelles diapositives, résumer une présentation et s’appuyer sur des fichiers Drive pour produire un contenu. Pour un professionnel, cela oblige à travailler autrement : mieux structurer ses documents, nommer clairement ses sources, formuler des demandes vérifiables.

Les Gems ajoutent une couche importante à cette logique. Google les définit comme des versions personnalisées de Gemini, créées pour jouer le rôle d’experts IA sur des sujets précis. Depuis leur lancement pour les utilisateurs Gemini Advanced, Business et Enterprise, les Gems permettent de stabiliser des consignes récurrentes : un assistant de veille, un relecteur de contenus, un coach de présentation, un préparateur de rendez-vous client, un analyste de documents. Une équipe peut formaliser une méthode de travail dans un Gem plutôt que repartir de zéro à chaque conversation.

C’est aussi le point qui rend essentiel une formation sur Gemini pour tous les utilisateurs de Google et de l’univers Workspace. Ils savent souvent discuter avec un chatbot. Ils savent moins concevoir un agent conversationnel personnel qui respecte un ton, une méthode, un niveau d’exigence et des limites. Un Gem mal cadré produit des réponses séduisantes mais fragiles. Un Gem bien construit devient un outil métier : il demande les informations manquantes, conserve une logique de traitement, s’adapte à un objectif et facilite la vérification humaine.

Le multimodal renforce encore cette évolution. Gemini a été conçu pour travailler avec plusieurs types d’entrées : texte, image, audio, vidéo, code ou documents. Google a rappelé que Gemini 3 Pro atteignait 81 % sur MMMU-Pro et 87,6 % sur Video-MMMU, deux évaluations liées au raisonnement multimodal. Ces chiffres ne suffisent pas à juger un usage métier, mais ils indiquent la priorité technique de Google : faire de Gemini un assistant capable d’interpréter des supports variés, pas uniquement des phrases tapées dans une fenêtre de chat.

Les annonces les plus récentes vont dans le même sens. Le 29 mai 2026, Google a présenté des démonstrations de Gemini Omni et Gemini 3.5, en insistant sur la combinaison d’images, d’audio, de vidéo et de texte comme entrées, avec une génération vidéo éditable par conversation. Quelques jours plus tard, Google a aussi annoncé que File Search dans l’API Gemini devenait multimodal, avec prise en charge de fichiers variés, métadonnées personnalisées et citations au niveau de la page. Pour les entreprises, l’enjeu est clair : la recherche documentaire assistée par IA va s’étendre aux présentations, captures, vidéos, comptes rendus et bases de connaissances visuelles.

Cette richesse crée pourtant un risque très simple : croire que l’agent comprend tout parce qu’il accepte tout. Le multimodal améliore l’accès à l’information, mais il ne remplace pas l’expertise humaine. Une capture d’écran peut être mal interprétée. Une vidéo peut manquer de contexte. Un document interne peut contenir une version obsolète. Le bon usage consiste à demander à Gemini d’expliciter son raisonnement, d’identifier les zones d’incertitude et de citer les éléments utilisés quand la fonction le permet.

Dans les organisations, la valeur viendra donc moins de l’accès à Gemini que de la discipline d’usage. Former les collaborateurs à créer des Gems, dialoguer avec un agent conversationnel et exploiter le multimodal revient à professionnaliser une pratique déjà présente. La différence se joue dans les détails : objectifs clairs, sources contrôlées, consignes stables, validation finale. C’est là que Gemini peut devenir un vrai levier de productivité, sans être transformé en solution magique.

Grégory JEANDOT

Consultant sr et Formateur IA

Avec un langage simple (et non simpliste), Grégory décrypte l’univers de l’IA générative. Pas de sémantique complexe ou d’approche trop verbeuse : l’objectif est de faire monter tout le monde en compétence !

Profil LinkedIn Contacter Grégory

Actualités

Publié le 17 juillet 2026

Le 7 juillet 2026, l’Europe a posé de nouvelles règles sur vos prompts

Actualités

Le 7 juillet 2026, le CEPD a publié ses lignes directrices sur la collecte de données pour l'IA générative. Quel impact pour un usage responsable ?

Publié le 17 juillet 2026

Dès le 2 août 2026, vos contenus IA devront porter une étiquette…

Actualités

Dès le 2 août 2026, l'AI Act impose l'étiquetage des contenus générés par IA. Ce que cela change pour les équipes qui produisent texte, image, audio et vidéo.

Publié le 17 juillet 2026

23 septembre 2026, la date qui rebat les cartes du SEO en France

Actualités

Google déploiera l'IA Overview en France avant le 23/09/26. Ce que ce chiffre change pour le SEO et comment s'y préparer ?

Publié le 16 juillet 2026

65% des chefs de projet utiliseraient déjà l’IA

Actualités

Le Baromètre PMI France 2026 révèle que 65% des chefs de projet utilisent l'IA, mais que la réussite des projets reste avant tout une affaire humaine.

Publié le 16 juillet 2026

AI Act et recrutement : ce qui change au 2 août 2026

Actualités

Le recrutement par IA passe en haut risque le 2 août 2026. Obligations, sanctions et ce que les entreprises doivent anticiper dès maintenant.

Publié le 16 juillet 2026

71% des managers utilisent déjà l’IA mais sans cadre clair

Actualités

71% des managers français utilisent l'IA générative, mais l'entreprise ne maîtrise pas ces usages. Ce que révèle l'Observatoire 2026 sur le rôle du manager.

Tous les articles

Mentions légales

Actualités

Are you ready ? Gemini évolue vers l’agent IA multimodal

Grégory JEANDOT

Le 7 juillet 2026, l’Europe a posé de nouvelles règles sur vos prompts

Dès le 2 août 2026, vos contenus IA devront porter une étiquette…

23 septembre 2026, la date qui rebat les cartes du SEO en France

65% des chefs de projet utiliseraient déjà l’IA

AI Act et recrutement : ce qui change au 2 août 2026

71% des managers utilisent déjà l’IA mais sans cadre clair

NEWSLETTER