Accueil Actu Magazine Hi-Tech

Google déploie enfin Gemini, son concurrent à ChatGPT: ce qu'il faut retenir

1 an et demi: c'est le temps qu'il a fallu à Google pour rassembler tout ce qu'il y a d'intelligent dans son énorme business afin de présenter une riposte digne de ce nom au fameux ChatGPT, qui redore l'image de Microsoft autant qu'il rempli son portefeuille. Après un rappel indispensable du contexte, on vous explique la stratégie de Google. 

Depuis plus d'un an, c'est l'effervescence totale autour de l'intelligence artificielle (IA). Le principe de base de cette technologie existe depuis longtemps, et peut être expliqué en modifiant légèrement une expression bien connue: donne un poisson à un logiciel, il remplira la fonction qui lui est assignée comme un brave soldat qui suit les ordres; apprends-lui à pêcher, il aura la puissance d'une armée dirigée par de fins stratèges. 

L'intelligence artificielle existe depuis une dizaine d'années du côté des géants de la tech, mais elle agissait en coulisses pour rendre votre utilisation de certaines fonctions plus intuitive. Exemple: un logiciel de navigation qui cumule les perturbations habituelles du trafic observées depuis des années le lundi à 9h30 avec la géolocalisation de certains smartphones indiquant un probable embouteillage. On n'a jamais parlé d'IA à ce moment-là, mais plutôt de la performance des algorithmes de Waze ou Tomtom. 

Ce qui a changé avec ChatGPT

En 2023, la donne a changé, car l'intelligence artificielle dite conversationnelle a franchi une grosse étape dans son niveau de performance, grâce à une nouvelle version de ChatGPT, propulsée par l'entreprise OpenAI. Pour faire simple: on a entraîné un robot conversationnel (chat bot) sur le langage humain, à travers des millions de documents écrits, et grâce à l'augmentation constante des puissances de calcul informatique, il est parvenu à maîtriser suffisamment ce langage pour comprendre nos questions et y répondre de manière naturelle et intelligible. C'est ce qu'on appelle un modèle de langage, ou Large Language Model (LLM). 

Et depuis lors, tout s'accélère ! D'innombrables entreprises se lancent dans l'IA, soit en développant leur propre LLM (énormément de travail et de ressources pour arriver aux performances de ChatGPT), soit en connectant leur logiciel à un LLM existant (typiquement, à ChatGPT via des "connecteurs"). Et le grand gagnant actuellement, c'est Microsoft. Car non seulement il détient 49% d'OpenAI et donc de ChatGPT, mais en plus il a tous les logiciels possibles et imaginables qui n'attendent qu'une connexion avec cette IA pour décupler la productivité du monde du travail (ça a l'air simple, mais le chantier en cours est immense, allez voir ce que propose Copilot). 

Et Google ?

Bien entendu, Google, un des précurseurs de l'intelligence en ligne (au sens large) à travers ses nombreux services (Gmail, Chrome, Maps, Search, etc), a été surpris par l'engouement mondial autour de ChatGPT et l'avance indéniable acquise par Microsoft. Ses fondations ont dû trembler. Le géant américain a été amené à bouleverser sa stratégie initiale qui, je pense, était de garder l'IA en coulisses pour améliorer constamment et graduellement tous ses outils. 

Février 2024, son armée d'ingénieurs et de stratèges a tranché: exit Bard (il a montré des capacités un peu décevantes en 2023), bienvenue à Gemini, dont on avait déjà un peu entendu parler. Toutes les capacités d'IA conversationnelle, que Google - comme Microsoft - va intégrer dans sa large suite de logiciels et service en ligne partiellement gratuits, s'articuleront autour du terme Gemini. 

A la base, Gemini était le nom du modèle de language (LLM) de Google, qui se voulait multimodal (donc comprenant et créant aussi bien du texte que de l'image, de l'audio et de la vidéo). "Gemini évolue pour être plus que ces modèles. Il supporte un écosystème entier, allant des produits utilisés quotidiennement par des milliards de personnes, à des API (les "connecteurs" dont je parle plus haut, NDLR) et des plateformes permettant à des développeurs et des activités économiques d'innover", a écrit le patron de Google, Sundar Pichai, dans un billet de blog officiel, jeudi après-midi. 

Concrètement, voici ce qui va changer: 

  • Bard (le concurrent moyen de ChatGPT qu'on pouvait déjà utiliser) va s'appeler Gemini. Il parle déjà 40 langues et reste gratuit. Une nouvelle application pour smartphone accompagne ce changement de nom (elle ne sera cependant pas disponible en Europe dès le départ car "Google adopte une approche réfléchie dans le déploiement de cette nouvelle expérience et d'autres pays et langues suivront bientôt", apprend-on dans une communication officielle). 
  • Gemini Advanced, qui intègre le nouveau modèle de langage 2.0 de Google (baptisé Ultra), prétend être beaucoup plus performant et avoir plus de fonctionnalité créative. Un abonnement de 21,99€ sera nécessaire (ChatGPT 4 coûte 20$, à titre de comparaison), et intégré dans les options d'abonnement de Google One (espace cloud pour document et photos, VPN, retouche photo avancée, etc). Attention, cependant, d'après le communiqué de Google, Gemini Advanced ne fonctionnera au départ qu'en anglais. 
  • Cet abonnement payant sera également nécessaire pour connecter cette intelligence artificielle (qui nécessite beaucoup de puissance de calcul et donc d'argent pour fonctionner) à la suite des logiciels de Google (le Workspace incluant notamment Google Docs, Sheets, Slides ainsi que le Cloud)
  • Gemini, et c'est sans doute le début d'un nouveau chapitre pour Google Assistant (amené à disparaître), va également s'intégrer à Android, donc dans tous les smartphones sur la terre (en dehors des iPhone et de la Chine ou Google n'opère pas). Comment ? Voici les explications du patron : "Sur Android, Gemini est un nouveau type d'assistant qui utilise l'intelligence artificielle générative pour collaborer avec vous et vous aider à accomplir vos tâches. Si vous téléchargez l'application Gemini ou si vous y accédez via Google Assistant, vous pourrez l'utiliser depuis l'application ou partout où vous activez normalement Google Assistant. Cela activera une nouvelle expérience superposée qui offre un accès facile à Gemini ainsi qu'une aide contextuelle directement sur votre écran — vous permettant, par exemple, de générer une légende pour une photo que vous venez de prendre ou de poser des questions sur un article que vous êtes en train de lire. De nombreuses fonctionnalités vocales de Google Assistant seront disponibles via l'application Gemini — y compris la mise en place de minuteries, passer des appels et contrôler vos appareils domestiques intelligents — et nous travaillons à en supporter davantage à l'avenir".

Reste à tester et comparer tout ça à ce que propose Microsoft autour de ChatGPT. Un énorme travail qui fera l'objet d'un prochain article ! 

À lire aussi

Sélectionné pour vous