Google teste Remy, un nouvel agent personnel IA pour Gemini, selon Business Insider. L’outil est conçu pour prendre des mesures pour les utilisateurs dans le cadre de leur travail et de leurs tâches quotidiennes.
Rémy est testé dans une version réservée au personnel de l’application Gemini. Le rapport indique avoir examiné un document interne et s’être entretenu avec deux personnes proches du dossier. La description interne présente Rémy comme un « agent personnel 24h/24 et 7j/7 », destiné à faire de Gemini un assistant pouvant agir au nom d’un utilisateur.
Deux personnes proches du projet ont déclaré que les employés de Google testaient actuellement Remy. Un porte-parole de Google a refusé de commenter. Le rapport ne précise pas quand ni si Google envisage de rendre public Rémy. Il n’a pas non plus identifié quels services Google sont inclus dans le test actuel des employés.
Assistante à la prise de tâches
Remy fait partie du travail plus large de Google visant à étendre Gemini au-delà des réponses basées sur le chat. Google propose déjà des fonctionnalités liées aux agents, notamment le mode Agent, bien que l’accès varie selon le niveau d’abonnement et la région.
Le rapport décrit Remy comme étant plus avancé et est conçu pour s’intégrer aux services Google et surveiller les éléments les plus pertinents pour les utilisateurs, en gérant des tâches complexes et en apprenant les préférences des utilisateurs.
Surface d’application connectée de Gemini
La documentation d’assistance Gemini de Google montre la portée actuelle des services connectés de Gemini, qui peuvent se connecter à d’autres services pour répondre aux demandes des utilisateurs et fournir des réponses plus pertinentes. Les applications connectées incluent les services Google Workspace (Gmail, Calendrier, Docs, Drive, Keep et Tasks) et – selon. Documentation d’aide de Google – utilitaires GitHub, Spotify, YouTube Music, Google Photos, WhatsApp, Google Home et Android.
Questions de contrôle
Le Gemini Privacy Hub de Google fournira du contexte en travaillant avec des applications connectées, notamment des applications Google et des services tiers. Les utilisateurs peuvent consulter et supprimer l’activité de Gemini Apps, modifier les paramètres de suppression automatique et déterminer si les données sont utilisées pour améliorer l’IA de Google. Il permet également aux utilisateurs de gérer l’accès à d’autres applications et données, ainsi qu’aux informations qu’ils ont demandé à Gemini de sauvegarder.
La documentation Gemini existante de Google couvre les actions ayant différents niveaux d’impact sur l’utilisateur, notamment la récupération d’informations à partir des applications Workspace, la création d’événements de calendrier, l’envoi de messages, l’ouverture d’applications et le contrôle des fonctions d’un appareil ou d’une maison intelligente.
Google Research affirme que les agents d’IA devraient avoir des contrôleurs humains bien définis, des pouvoirs soigneusement limités, des actions observables et la capacité de planifier.
Google Cloud a également déclaré que les activités des agents devraient être transparentes et vérifiables grâce à la journalisation et à une caractérisation claire des actions. Ses orientations mettent l’accent sur la limitation des pouvoirs des agents en fonction de l’objectif visé et de la tolérance au risque des utilisateurs, en utilisant le principe du moindre privilège.
La fonction d’apprentissage des préférences signalée par Remy met également l’accent sur les contrôles de la mémoire. Le Privacy Hub de Google indique que les utilisateurs peuvent gérer les informations qu’ils ont demandé à Gemini de sauvegarder et couvre les contrôles de personnalisation basés sur les discussions passées et l’intelligence personnelle.
Le rapport ne fournit pas de détails techniques sur l’architecture de Remy, la version modèle qui la sous-tend ou le niveau d’autonomie testé. Il ne précise pas non plus si Rémy peut agir de manière indépendante sans la confirmation de l’utilisateur. Ces points sans réponse signifient qu’il n’est pas clair comment Rémy gère les approbations et enregistre les actions terminées.
Le document interne décrit Remy comme un projet de dogfooding, un terme couramment utilisé dans les entreprises technologiques lorsque les employés testent des produits avant toute sortie plus large. Le rapport compare le concept de Rémy avec OpenClaw, un agent d’IA qui a attiré l’attention plus tôt cette année pour sa capacité à répondre de manière autonome aux messages, à mener des recherches au nom des utilisateurs et à prendre des mesures autonomes.
Le PDG d’OpenAI, Sam Altman, a déclaré en février qu’OpenAI embauchait le créateur d’OpenClaw, selon le rapport. Demis Hassabis, PDG de Google DeepMind, a déjà évoqué l’objectif de créer un assistant numérique, mais Google n’a pas confirmé si Remy deviendrait une fonctionnalité publique de Gemini.
(Photo de Kai Wenzel)