Gemini, l'outil d'IA générative de Google, enfin déployé au Canada

8 Feb 2024

ICI.Radio-Canada.ca

Après des mois d’attente, Google donne finalement le coup d'envoi à ses outils d’intelligence artificielle (IA) générative au Canada. Le géant de l’informatique annonce par la même occasion fusionner son robot conversationnel Bard à son logiciel d’IA le plus avancé, Gemini, lancé en décembre.

Gemini - Figure 1 — Photo ICI.Radio-Canada.ca

Nous sommes très contents d’annoncer qu’à partir de jeudi, Bard sera appelé Gemini, a annoncé Jules Walter, chef de produit de Google, lors d’une démonstration devant des membres de la presse mercredi.

Gemini, décrite comme l’IA la plus puissante de Google à ce jour, est désormais offerte au pays en anglais et en français québécois dans sa formule de base. Celle-ci est accessible gratuitement sur le site de Google Gemini, et comprend le robot conversationnel, la génération d’images photoréalistes et l’extension avec certains services du géant californien.

Un outil anti-hallucination

Lors de la démonstration, Google a demandé par écrit à Gemini d’expliquer à un enfant de 4 ans comment se forme un arc-en-ciel.

Gemini prend cette question, la décompose en pensées plus faciles à absorber pour un enfant, et offre des suggestions pour pousser la réflexion plus loin que la question, a expliqué Jules Walter, en direct de la Californie.

On peut également demander à Gemini de lire la réponse en français québécois. Pour le moment, seule une voix d’homme est offerte, mais Google assure travailler sur différents types de voix – féminines et masculines – qui seront intégrées plus tard à l’outil.

Jules Walter, chef produit de Google.

Photo : Scott Schiller

Gemini n’est toutefois pas à l'abri des hallucinations de l’IA, ce terme utilisé pour décrire les fausses informations générées par les robots conversationnels lorsqu’on leur pose des questions. Et Google en est bien consciente : Le quart de l’utilisation de Gemini sert à des fins de recherche. Nous voulons que les gens fassent confiance aux informations que fournit l’outil, a indiqué Jules Walter.

Si l’utilisateur ou l’utilisatrice a un doute sur la véracité de certaines informations, un bouton en forme de G pour Google, situé au bas de l’écran, permet de vérifier si les propos rapportés sur la formation de l’arc-en-ciel sont corroborés par des informations que l’on retrouve en ligne, à l’aide du moteur de recherche Google. Les propos dont les sources sont insuffisantes seront aussi identifiés. Et les URL des sources pourront être consultées par les internautes.

Étant donné que Gemini est un outil d’IA, certains sites – dont le quotidien américain The New York Times – ont demandé à être exclus de l’entraînement de modèles d’intelligence artificielle. On va respecter ces demandes, a précisé Jules Walter, ce qui signifie que l’outil de double vérification exclura, par exemple, des sites de nouvelles crédibles tel celui du New York Times.

À la question à savoir pourquoi cette fonctionnalité de double vérification doit être activée manuellement, l’équipe de Google répond que les questions posées à Gemini ne s’y prêtent pas toujours. Par exemple, on ne souhaiterait pas corroborer les faits d’un conte de fées généré par l’outil pour divertir son enfant.

Gemini - Figure 2 — Photo ICI.Radio-Canada.ca

Un outil de travail

Gemini communique également avec les différentes applications et services de Google, ce qui permet de répondre à des questions complexes en plusieurs étapes, à l’aide de l’application de navigation Maps de Google Flights, ou encore de YouTube.

Lors de la démonstration, Google a demandé à Gemini de planifier un voyage en famille à Montréal, et de chercher un vol, un hôtel et des activités à faire avec des enfants. L’outil a ainsi proposé une liste de vols offerts, d’hébergements à réserver, et des vidéos YouTube d’activités à faire dans la ville pour les jeunes.

Normalement, planifier ce voyage me prendrait des dizaines de minutes, des heures, voire des jours. Là, on peut le faire en quelques minutes.

L’outil offre également la possibilité de générer des images photoréalistes. On peut lui demander de générer une poutine, par exemple, et apporter une correction si l’image contient par exemple du fromage râpé au lieu du fromage en grains.

Le générateur d’images de Gemini sera offert au Canada en anglais seulement pour le moment, le français et d'autres langues sont prévus bientôt.

Une approche responsable

Google insiste : elle adopte une approche responsable afin d’éviter de générer des images violentes, offensantes ou explicites sexuellement.

On compte aussi sur un filtre pour nous assurer que les gens ne puissent pas générer des personnes en particulier, ajoute Jules Walter.

Gemini permet aux utilisateurs et aux utilisatrices d’avoir des « conversations plus longues et significatives, car il comprend mieux leurs demandes », dit Google.

Photo : Google

Ces dernières semaines, des images pornographiques de la chanteuse Taylor Swift générées sans son consentement par l’IA ont inondé le réseau social X (ex-Twitter), mettant en lumière les problèmes de modération du réseau social, mais aussi la possibilité pour certains logiciels d’IA de générer ce type d’images.

Par ailleurs, une grande partie du travail de Google en recherche fondamentale et en utilisation responsable de l’intelligence artificielle se fait au Canada. Nous sommes vraiment contents de voir le leadership en IA qui se passe au Canada, et encore plus contents de voir ce produit être amené au pays, a insisté Jules Walter.

Pourquoi un lancement aussi tardif?

Dévoilé début 2023, le robot conversationnel Bard a été offert en 40 langues dans plus de 230 pays et territoires avant d’atteindre le Canada.

L’outil d’IA Gemini de Google, qui permet de générer du texte, des images et des vidéos, a pour sa part été lancé en décembre, toujours en excluant le Canada.

Questionné par Radio-Canada à ce sujet, Google indique qu’avant de lancer un produit, il doit s’entendre avec des spécialistes et le gouvernement afin de s’assurer que ses outils répondent aux exigences du pays et qu'ils sont adaptés à sa population.

Les discussions avec le gouvernement ont pris du temps, mais nous sommes contents que le gouvernement canadien ait proposé une solution beaucoup plus raisonnable et ça nous a permis d’accélérer le lancement du produit.

Google a été au cœur d’un bras de fer avec le gouvernement canadien, qui souhaite que les géants du web négocient des compensations financières avec les médias du pays pour la diffusion des nouvelles en ligne.

Après des mois de menaces de retirer les nouvelles canadiennes de son moteur de recherche, Google s’est finalement entendu avec Ottawa fin novembre pour verser un montant annuel de 100 M$ aux médias.

Une version avancée en chantier

Si le modèle de base de Gemini est lancé au Canada jeudi, il faudra toutefois attendre pour accéder à Gemini Advanced, un modèle payant plus efficace pour effectuer des tâches complexes qui s’adresse davantage aux pros, comme un informaticien qui veut générer des exercices de codes compliqués, ou encore faire du raisonnement logique, détaille Google.

Cette formule est déployée jeudi en anglais aux États-Unis, mais sera étendue plus tard à d’autres langues et pays.

C’est également dans cette version de l’outil que les utilisateurs et les utilisatrices pourront voir les logiciels de Google (Docs, Présentation, Gmail, Feuille de calculs, etc.) être pleinement intégrés dans ce qui était autrefois appelé Duet AI, mais adopte depuis jeudi le nom de Gemini seulement.

Une application mobile est également dans les cartons. Alors que les propriétaires d’appareil fonctionnant avec le système Android auront droit à une application mobile indépendante de Gemini, les propriétaires d’appareils de la marque Apple verront l’outil d’IA être intégré à même l’application de Google.

Ce n’est toutefois pas pour tout de suite : Google se contente de dire que l’application et la fonctionnalité seront lancées bientôt au Canada, et en anglais pour commencer.