Inventer

Dresseur d’intelligence artificielle, métier de demain ?

Nouveau message sur la boîte mail de Bendaoud. Et nouvelle mission. Elle lui est proposée par l’une des plateformes de micro-jobs où est inscrit ce jeune homme de 20 ans, étudiant en gestion d’entreprise à Tarbes (Hautes-Pyrénées). Une société recherche des volontaires pour une tâche dont la durée est estimée à une heure. La mission : répéter oralement des phrases affichées sur un écran. Comme “Ok, fais-moi faire l’entraînement avec de la musique de fond”. La proposition tombe bien, l’étudiant vient de finir les cours.

Tout sourire derrière des lunettes cerclées or, Bendaoud exerce une profession accessible à tous à partir de quelques clics : dresseur d’intelligence artificielle. Amazon Mechanical Turk, Appen ou encore Foule Factory… ces plateformes de microtravail, ouvertes sur simple inscription, ont pour credo le renforcement humain des intelligences artificielles qui ont envahi notre quotidien : reconnaissance des images, de la parole ou de l’écriture. Par l’intermédiaire de sous-traitants, Apple emploie même pour cela des salariés à plein temps. Un univers méconnu, sur lequel les géants du numérique restent discrets. Car il froisse l’image d’une technologie qui, en réalité, a besoin de petites mains pour fonctionner.

Cet article a initialement été publié dans WE DEMAIN n°35, paru en août 2021. Un numéro toujours disponible sur notre boutique en ligne.

“Elles ne comprennent rien”

Lorsqu’elle vivait en Thaïlande, Lena *, une étudiante de 20 ans, a elle aussi participé au renforcement d’intelligences artificielles. Inscrite sur une plateforme, sa principale tâche consistait à transcrire des messages vocaux que la machine n’avait pas su reconnaître. “C’était, par exemple, des bruits de poche, un son que l’assistant vocal n’avait pas identifié, explique-t-elle. Mais cela pouvait être un accent mal compris. Ou les paroles d’une personne qui n’avait pas articulé.” Mathilde, traductrice free-lance parisienne, propose, elle, “des suggestions, par écrit, de phrases, souvent banales, pour parler à une machine”. Bendaoud a également été sollicité pour corriger la retranscription automatique d’un texte écrit par un assistant vocal. Ou pour comparer les résultats de deux moteurs de recherche, et se prononcer sur le meilleur résultat.

Si les dresseurs d’IA sont indispensables, c’est parce que les intelligences artificielles sont bêtes. “Elles n’ont strictement rien d’intelligent : elles ne comprennent rien et ne perçoivent aucun contexte”, explique l’ingénieur Luc Julia, l’un des concepteurs de l’assistant vocal Siri. Selon ce spécialiste, les assistants vocaux, grands consommateurs de dresseurs d’IA, ne reconnaissent ainsi que 80 à 85 % de ce que nous leur demandons. Un mauvais résultat : imaginez un livre où 20 % des mots manqueraient. “La limitation de la technologie actuelle, basée sur les réseaux de neurones, c’est qu’elle a besoin de voir des exemples assez proches des situations qu’elle connaîtra ensuite lors de son fonctionnement. Il lui faut donc beaucoup de données pour qu’elle atteigne tout son potentiel”, ajoute Emmanuel Vincent, chercheur à l’Inria (Institut national de recherche en informatique et en automatique), spécialiste du traitement de la parole.

Dresseur d’intelligence artificielle, le coup de pouce humain nécessaire

Pour réussir à accomplir les tâches que nous leur demandons, les intelligences artificielles ont besoin d’un sérieux coup de pouce humain. D’abord à leur création, en étant alimentées par une foultitude d’exemples. “Pour qu’un assistant vocal comprenne mes questions sur la météo, il faut lui faire entendre différentes manières de faire cette demande”, souligne Paola Tubaro, directrice de recherche au CNRS (Centre national de recherche scientifique).

Ensuite, une fois entrées en fonctionnement, pour corriger leurs erreurs. Pourquoi cette demande sur le temps qu’il fera demain n’a pas été comprise ? Est-ce à cause d’un accent différent ou d’une voix trop atypique pour le programme ? En réalité, le traitement de la parole est un assemblage complexe entre des tâches de perception (la transcription textuelle), de raisonnement (l’analyse de cette transcription) et de génération (la réponse à la demande). “Nous avons encore besoin d’annoter humainement les données pour les tâches de la perception, explique Emmanuel Vincent. C’est difficile à automatiser car il y a beaucoup de sources de variabilité. Nous avons des voix différentes, jeunes, âgées, des accents régionaux ou étrangers. C’est donc compliqué de programmer cela.”

À lire aussi : Cet article a été écrit par une intelligence artificielle

Un complément de revenu

Ce chercheur a beau travailler à réduire cette part d’annotation humaine, à moins d’une révolution technologique, elle sera toujours indispensable dans les années à venir. À la satisfaction de certains dresseurs d’intelligence artificielle. “Avec le développement de cette technologie, il y a du travail dans le domaine”, observe Bendaoud, flatté de travailler indirectement pour les géants du numérique. “Les utilisateurs ne se rendent pas compte que les progrès des assistants vocaux sont gagnés millimètre après millimètre, grâce à un travail de fourmi permanent”, complète Lena.

Pour ces deux dresseurs d’intelligence artificielle, ce travail à temps partiel est synonyme de complément de revenu très flexible. “Je ne pouvais pas prendre un travail à mi-temps, cela aurait été trop prenant par rapport à mes études”, raconte Lena, qui gagnait ainsi entre 100 et 200  euros par mois, en plus de sa bourse étudiante.

“Particulièrement abrutissant”

Mais tous les dresseurs d’IA ne sont pas aussi élogieux. Matt, qui a renforcé des intelligences artificielles pendant plusieurs mois, cela reste un “travail à la chaîne particulièrement abrutissant, même si certaines tâches sont plus amusantes que d’autres”. Cet ancien étudiant en développement web à Namur (Belgique), alors tout juste majeur, a corrigé des reconnaissances manuscrites et orales d’intelligences artificielles : “Le taux de rémunération horaire n’était pas à la hauteur du Smic mais pas non plus ridicule, cela reste une bonne solution pour arrondir des fins de mois si l’on a du temps à perdre.”

Sur certaines plateformes, les rémunérations peuvent également être très faibles. Ce qui alimente la crainte de l’émergence d’un prolétariat des travailleurs du clic. “Avec ces tâches, il y a plusieurs problèmes de fond : la transparence des employeurs, la concurrence internationale effrénée qui tire vers le bas les rémunérations, et l’isolement au travail, avec ces tâches qui se font tout seul”, résume Paola Tubaro, directrice de recherche au CNRS. 

L’éthique du job de dresseur d’intelligence artificielle a été dénoncée il y a un an par un jeune Français. Thomas Le Bonniec s’était envolé pour l’Irlande pour rejoindre un sous-traitant d’Apple. Sa mission ? Retranscrire des échanges enregistrés par Siri, par exemple des déclenchements intempestifs du programme ou une mauvaise compréhension de la demande des utilisateurs. “Pendant cette période, j’ai écouté environ 46 000 enregistrements”, confie-t-il au site d’info Le Média. Un volume impressionnant, synonyme, pour l’ancien étudiant en sociologie, d’un espionnage de masse. Ce dernier est approuvé par les “écoutés”, sans vraiment qu’ils en aient conscience. Les conditions générales d’utilisation de la plupart des assistants vocaux – si on les a lues – précisent en effet que des enregistrements peuvent être collectés à des fins d’amélioration du service. 

Tous dresseur d’intelligence artificielle

Un problème de données personnelles qui concerne aussi les dresseurs d’IA, quand on leur demande de se filmer avec leur chien dans certaines situations ou d’enregistrer une conversation téléphonique de trente minutes avec un complice, sans savoir vraiment ce qu’il adviendra de l’enregistrement.

Des inquiétudes qui médiatisent un métier de niche, destiné demain à être pratiqué beaucoup plus largement. “Nous devenons tous des dresseurs d’IA car il va y avoir de plus en plus d’interactivité”, prévient Luc Julia. Les intelligences artificielles devraient ainsi davantage nous demander de les corriger. Que l’on soit dresseur d’IA professionnel ou pas. “L’annotation pourra également passer par la science participative, par exemple en collectant de la donnée à travers des jeux éducatifs, comme ZombiLingo, permettant l’apprentissage de la grammaire”, espère Emmanuel Vincent. Autre piste : le projet Common Voice, une base de données libre pour la reconnaissance de la parole créée par la fondation Mozilla.

En attendant, revenons à Tarbes. Bendaoud vient de finir sa lecture de questions. Elle lui a rapporté 30  dollars (25 euros). La suite ? Il attend la prochaine proposition. Mais l’étudiant a déjà une autre idée en tête. De dresseur d’intelligence artificielle, il se verrait bien data scientist. Un autre nouveau job, encore plus près des intelligences artificielles. 

* À la demande des interviewés, les prénoms ont été changés.

Recent Posts

  • Déchiffrer

Christophe Cordonnier (Lagoped) : Coton, polyester… “Il faut accepter que les données scientifiques remettent en question nos certitudes”

Cofondateur de la marque de vêtements techniques Lagoped, Christophe Cordonnier défend l'adoption de l'Éco-Score dans…

3 heures ago
  • Ralentir

Et si on interdisait le Black Friday pour en faire un jour dédié à la réparation ?

Chaque année, comme un rituel bien huilé, le Black Friday déferle dans nos newsletters, les…

9 heures ago
  • Partager

Bluesky : l’ascension fulgurante d’un réseau social qui se veut bienveillant

Fondé par une femme, Jay Graber, le réseau social Bluesky compte plus de 20 millions…

1 jour ago
  • Déchiffrer

COP29 : l’Accord de Paris est en jeu

À la COP29 de Bakou, les pays en développement attendent des engagements financiers à la…

2 jours ago
  • Déchiffrer

Thomas Breuzard (Norsys) : “La nature devient notre actionnaire avec droit de vote au conseil d’administration”

Pourquoi et comment un groupe français de services numériques décide de mettre la nature au…

3 jours ago
  • Respirer

Les oursins violets, sentinelles de la pollution marine en Corse

Face aux pressions anthropiques croissantes, les écosystèmes côtiers subissent une contamination insidieuse par des éléments…

3 jours ago