Operator : Le nouvel agent d’OpenAI
Le 24/01/2025
OpenAI dévoile Operator, un agent innovant capable de naviguer sur le web pour effectuer des tâches à votre place. Disponible en version d'aperçu pour les utilisateurs Pro aux États-Unis, Operator marque une étape majeure dans l'évolution des agents numériques.
Qu'est-ce qu'Operator ?
Operator est propulsé par le modèle Computer-Using Agent (CUA), une technologie combinant les capacités visuelles avancées de GPT-4o et un raisonnement renforcé. Ce modèle peut comprendre et interagir avec les interfaces graphiques (boutons, menus, champs de texte) comme un utilisateur humain.
L'objectif principal d'Operator est de simplifier les tâches répétitives sur le web, qu'il s'agisse de remplir des formulaires, de commander des produits en ligne ou même de créer des mèmes. Grâce à ses capacités de vision et de raisonnement, Operator peut :
- Naviguer sur des sites web sans API spécifiques.
- Effectuer des tâches multi-étapes en s'auto-corrigeant en cas d'erreur.
- Demander l'intervention de l'utilisateur pour des actions sensibles, comme les paiements ou la résolution de CAPTCHA.
Performances exceptionnelles d'Operator
CUA établit de nouveaux standards dans les benchmarks d'utilisation d'ordinateurs et de navigation web :
- OSWorld : 38,1 % de succès pour des tâches sur des systèmes d'exploitation comme Ubuntu ou Windows (contre 72,4 % pour un humain).
- WebArena : 58,1 % de succès pour des scénarios web complexes.
- WebVoyager : 87 % de réussite sur des tâches en ligne plus simples.
Malgré ces performances prometteuses, il reste des marges de progression, notamment pour atteindre une performance humaine sur des tâches complexes.
Cas d'utilisation et personnalisation
Operator s'adresse à un large éventail d'utilisateurs :
- Particuliers : automatisation des tâches répétitives comme le réapprovisionnement ou la gestion de formulaires.
- Entreprises : amélioration des expériences clients et des taux de conversion grâce à des intégrations avec des partenaires comme DoorDash, Instacart et Uber.
Les utilisateurs peuvent personnaliser Operator en ajoutant des instructions spécifiques pour certains sites, rendant l'outil encore plus flexible et adapté à leurs besoins.
Un engagement envers la sécurité
OpenAI met un point d'honneur à garantir un usage sûr d'Operator :
- Blocage des sites sensibles : l'agent ne peut accéder à certains sites jugés à risque (jeux d'argent, contenu adulte, etc.).
- Refus de tâches illégales ou nuisibles : grâce à un entraînement spécifique du modèle.
- Supervision et retours d'utilisateur : une approche itérative pour améliorer constamment l'outil.
Une vision pour l'avenir
Operator n'est qu'un début dans la création d'agents capables d'agir de manière autonome dans l'écosystème numérique. Cette technologie pourrait transformer des secteurs comme l'administration publique, où elle simplifierait des démarches complexes, comme l'inscription à des services municipaux.
Bien qu'encore en phase préliminaire, Operator ouvre de nouvelles perspectives pour l'IA, en permettant aux modèles de travailler comme des humains dans des environnements numériques.
💡Cet article vous a plu ? Lisez également : Project Moohan : Samsung et Google s’unissent
ribesteban Il y a 6 jours
Hâte que ça arrive en France pour le coup !