Partager:
Google a annoncé aujourd'hui une série de nouvelles avancées en matière d'intelligence artificielle (IA), marquant une étape importante dans son parcours vers la création d'un assistant universel. Les annonces clés incluent le lancement de Gemini 2.0, la dernière version de son modèle d'IA multimodal, ainsi que de nouvelles fonctionnalités d'agent d'IA dans divers produits, dont la recherche Google.
L'intelligence artificielle est, selon certains, une révolution numérique aussi importante que l'arrivée d'Internet dans les années 1990. Et si pour l'instant, ça vous semble une simple tendance dont on parle trop, souvenez-vous que les générations précédentes disaient la même chose des emails et des sites web, il y a 30 ans. Les preuves de la révolution qui se prépare (et qui a déjà commencé dans certains secteurs professionnels) semblent discrètes aux yeux du grand public, mais elles sont nombreuses. Si je dois en retenir une, c'est l'accélération interminable de Google dans le domaine.
Garder le contrôle de la recherche
Distancé aux yeux de l'opinion publique par OpenAI et ChatGPT (alors que Google trônait au sommet de l'intelligence en ligne), le géant du numérique travaille sans relâche pour rattraper un retard - bien réel - au niveau de l'IA générative. Je suis le premier à en faire l'expérience régulièrement : ChatGPT nous comprend mieux et nous répond mieux que Gemini (qui n'est pas à une petite hallucination près). Et pour rechercher une information en ligne, je passe volontiers par Perplexity ou ChatGPT, plutôt que demander une liste de résultats à Google. Mais la situation pourrait évoluer rapidement. Google a fait de grosses annonces ce 11 décembre et vous devez retenir ceci: il va tout faire pour sauver et protéger son outil fondateur, Google Search (donc la recherche en ligne via Google), notamment en créant des "agents" qui vont tenter de comprendre et retenir ce que vous voulez faire ou savoir.
Vidéo: l'intelligence artificielle dans l'enseignement secondaire :
Gemini 2.0 : des capacités multimodales améliorées et une utilisation native des outils
Gemini couvre plusieurs notions d'intelligence artificielle au sein de Google, y compris la génération de contenu "à la ChatGPT". Gemini passe en 2.0 et s'appuie sur les capacités multimodales de son prédécesseur, Gemini 1.0, qui lui permettaient de comprendre les informations textuelles, vidéo, audio et le code. La nouvelle version est dotée de fonctionnalités améliorées, notamment la sortie d'images et audio natives, ainsi que l'utilisation native des outils, ce qui la rend plus polyvalente et plus efficace.
Applications de Gemini 2.0 : de la recherche aux jeux vidéo
Gemini 2.0 sera intégré à un large éventail de produits Google. Il alimentera les aperçus de l'IA dans la recherche Google, permettant aux utilisateurs de poser des questions plus complexes et multi-étapes, y compris des équations mathématiques, des requêtes multimodales et du code. Il sera également utilisé pour améliorer l'application Gemini, l'assistant d'IA de Google, en offrant aux utilisateurs des expériences plus conversationnelles et utiles.
Au-delà de la recherche et de l'application Gemini, Google explore également les capacités d'agent de Gemini 2.0 dans d'autres domaines. Par exemple, le projet Astra, un prototype de recherche sur les assistants d'IA universels, utilise Gemini 2.0 pour améliorer la compréhension multimodale du monde réel. Le projet Mariner, quant à lui, explore l'avenir de l'interaction homme-agent dans le navigateur, permettant aux agents d'IA d'aider les utilisateurs à accomplir des tâches complexes en ligne.
Enfin, Google utilise Gemini 2.0 pour développer des agents d'IA dans le domaine des jeux vidéo. Ces agents peuvent raisonner sur le jeu en se basant uniquement sur l'action à l'écran et offrir des suggestions aux joueurs en temps réel.
Deep Research : un nouvel outil de recherche d'IA
En plus de Gemini 2.0, Google a également annoncé Deep Research, une nouvelle fonctionnalité de l'application Gemini qui utilise l'IA pour explorer des sujets complexes et fournir des résultats sous forme de rapports faciles à lire. Deep Research analyse les informations pertinentes sur le web pour le compte de l'utilisateur, créant ainsi des rapports complets avec des liens vers les sources originales.
Trillium : la sixième génération de TPU de Google
Un peu de technique et de grosses machines, pour terminer. Les progrès de Google en matière d'IA sont également soutenus par des investissements importants dans l'infrastructure. L'entreprise a annoncé la disponibilité générale de Trillium, sa sixième génération de Tensor Processing Unit (TPU). Trillium offre des améliorations significatives en termes de performances d'entraînement, de débit d'inférence et d'efficacité énergétique, ce qui le rend idéal pour un large éventail de charges de travail d'IA.

Conclusion
Les annonces de Google prouvent que le géant américain continue d'investir massivement dans l'IA ; ce qu'il a, en réalité, toujours fait (mais de manière moins démonstrative). Avec Gemini 2.0, Deep Research et Trillium, Google espère rivaliser avec la concurrence (OpenAI en tête) et proposer des expériences d'IA plus puissantes, plus polyvalentes et plus utiles, y compris pour le grand public. Reste à voir comment ces avancées se traduiront dans les produits Google, si elles pénétreront le marché et bouleverseront nos usages numériques à long terme. Une chose est sûre : peu d'entreprises ont autant d'utilisateurs actifs, de services numériques installés, d'infrastructures et de budget que Google.



















