Duolingo est célèbre pour ses phrases loufoques, comme celle-ci en espagnol : A mi caballo le gusta la tele (« Mon cheval aime la télé »). Vous vous demandez peut-être...

« Elles ont certainement été générées par un algorithme informatique. Ça ne viendrait à l’idée de personne d’utiliser ces phrases pour enseigner une langue ! »

Alors, ces phrases sont-elles générées par l'IA ? Ou est-ce que d’autres facteurs entrent en jeu dans les coulisses de Duolingo pour créer l’expérience d'apprentissage agréable et efficace qui a fait toute notre réputation ? Lisez la suite pour le découvrir !

Illustration d'un cow-boy assis sur un canapé et avec une télécommande dans la main. Un cheval se tient derrière le canapé. L'homme mange le foin dans un seau et le cheval mange le coin du canapé.

La recette de Duolingo : experts humains + IA

Chez Duolingo, nous recherchons toujours des solutions optimales. Nous avons compris l’importance d’associer l'expertise humaine et l'intelligence artificielle pour tirer parti de leurs atouts respectifs et réussir à proposer un enseignement de qualité.

Notre processus de création de cours est divisé en quatre étapes, dont chacune implique à la fois des humains et de l’IA. Les étapes qui nécessitent de la personnalisation et de l’évolutivité sont davantage réalisées par l'IA, tandis que les étapes initiales reposent principalement sur nos équipes d’experts !

Graphique présentant les étapes de la création d’un cours de Duolingo. Pour chaque étape, les lignes vertes indiquent la quantité de travail fournie par des humains et les lignes violettes indiquent la quantité de travail fournie par l'IA. L'étape 1, « Conception du programme », est presque entièrement réalisée par des humains. L'étape 2, « Création de contenu brut », est principalement réalisée par des humains. L'étape 3, « Création des exercices », est principalement réalisée par l'IA. L'étape 4, « Personnalisation des leçons », est presque entièrement réalisée par l'IA.

Passons en revue chaque étape !

Étape 1 : Conception du programme

La conception du programme est la première étape de la création d'un cours, et c'est là que nos experts humains excellent. Chez Duolingo, des concepteurs de programmes expérimentés planifient soigneusement ce qu'il faut enseigner dans un cours donné, et dans quel ordre. Ils élaborent la structure globale du cours et y ajoutent des objectifs d'apprentissage afin d’aligner le cours sur les normes du CECR et de le personnaliser selon les connaissances linguistiques spécifiques de nos apprenants. Nos experts choisissent également des scénarios pertinents tirés de la vie réelle pour illustrer les objectifs d'apprentissage du cours. Enfin, ils décident de la répartition des mots, des phrases et des concepts grammaticaux dans les leçons afin d’éviter que les apprenants soient submergés par trop de choses à la fois, et pour qu'ils puissent s'appuyer sur ce qu'ils apprennent pour progresser.

Revenons-en à notre exemple : A mi caballo le gusta la tele (« Mon cheval aime la télé »). À ce stade précoce de la création du cours, les phrases ne sont pas encore écrites, mais les concepteurs du programme ont maintenant élaboré un plan précis pour savoir quand enseigner les mots caballo (cheval), tele (télé) et gustar (aimer). Ce dernier mot, gustar, est complexe pour les francophones, car en espagnol, l’idée d’aimer quelque chose est structurée différemment. Au lieu de dire « J'aime la télé », on dira plutôt « La télé me plaît ». Lors de la conception d'un cours d'espagnol pour les francophones, les concepteurs du programme attendront un peu avant d’enseigner ce concept grammatical et y consacreront un nombre suffisant de leçons. Tout cela pour dire qu'un concepteur de programme examine les concepts, le vocabulaire et les structures qui composent une phrase, sans pour autant créer les phrases… du moins, pour l'instant.

Étape 2 : Création de contenu brut

La deuxième étape consiste à concevoir le contenu « brut » de chaque leçon, qui rejoint ensuite l’ensemble de contenu enseigné à partir duquel sont créés les exercices. Cette étape est réalisée par nos experts humains dont l'expérience pédagogique et les compétences créatives sont essentielles à la construction de notre contenu. Mais l'IA leur apporte un soutien essentiel pour les aider à travailler de façon efficace.

Pour chaque leçon du cours, les concepteurs de contenu de Duolingo rédigent d’abord du contenu « brut » correspondant à l'objectif d'apprentissage spécifié dans le plan de cours, comme par exemple « passer une commande » ou « parler de ses hobbies ». Cela inclut des phrases, paragraphes ou mini-dialogues dans le contexte de la vie courante et qui illustrent bien les nouveaux mots et concepts. Nous ajoutons aussi une petite touche d'humour pour faire sourire les apprenants et continuer de captiver leur attention tout au long de leur apprentissage. Enfin, nous rédigeons des traductions pour tous les mots et toutes les phrases afin d’aider les apprenants à comprendre leur signification. Si nos experts humains possèdent des atouts uniques pour la réalisation de toutes ces tâches, l'IA demeure un partenaire puissant ! Nous construisons des outils alimentés par des algorithmes d'IA pour aider les concepteurs de contenu à travailler plus rapidement et à commettre moins d'erreurs, en concentrant leur énergie cérébrale sur ce qu'ils font le mieux. Par exemple, nous utilisons l'IA pour créer un éventail de traductions possibles pour toutes les phrases afin de pouvoir accepter les réponses des apprenants lorsqu'il existe plusieurs façons correctes de dire la même chose.

C'est durant cette étape que notre phrase d'exemple serait rédigée. Dans une leçon sur les loisirs, un concepteur de contenu écrit de nombreuses phrases courantes telles que « J'aime le sport » ou « Mon père aime lire » mais il inclut également quelques phrases plus loufoques telles que « Mon cheval aime la télé ». L'équipe en charge du contenu crée ensuite des indices (traductions) pour chaque mot (par exemple, caballo = cheval), ainsi qu'une liste de toutes les façons possibles d'exprimer la phrase « Mon cheval aime la télé » (par exemple, l'utilisation du mot « télévision » au lieu de « télé »). Et tout cela se fait à l'aide d'outils alimentés par l'IA.

Une fois les phrases, les paragraphes et les dialogues rédigés, il est temps de les intégrer à une leçon !

Étape 3 : Création des exercices

À ce stade, nous disposons d'un plan pour le cours et de beaucoup de contenu « brut » pour chaque leçon. La troisième étape consiste à utiliser ce contenu pour créer un ensemble d'exercices interactifs. Ce processus est mené par nos experts pédagogiques pour certains exercices, mais la plupart du temps, nous utilisons des algorithmes informatiques pour créer automatiquement des exercices à partir du contenu « brut ».

Revenons-en à la phrase : A mi caballo le gusta la tele. Voici des exemples d’exercices que nous pourrions créer grâce à l’IA à partir de cette phrase :

  • L’utilisateur doit compléter l’espace vide de la partie la plus importante d'une longue phrase en espagnol. L’IA identifie automatiquement où placer l’espace vide afin de cibler la structure le gusta.
  • L’utilisateur doit reconstituer une phrase en espagnol à partir d'une banque de mots comprenant tous les mots de cette phrase, ainsi que des mots-pièges générés automatiquement (des mots enseignés récemment que l’utilisateur ne maîtrise pas encore totalement).
  • L’utilisateur doit écouter une phrase et identifier quel mot est prononcé dans cette phrase à partir de deux enregistrements similaires (par exemple, gusta et cuesta)
3 captures d'écran montrant différents types d’exercices avec la phrase « My horse likes TV. » / « A mi caballo le gusta le tele. » La première image montre la phrase complète en anglais et la phrase en espagnol avec un mot manquant, que l'apprenant doit écrire. Sur la seconde image, l’utilisateur doit appuyer sur les mots en espagnol pour reconstituer la phrase. La troisième image montre une leçon de compréhension orale. La phrase en espagnol est affichée à l'écran avec un mot manquant, suivie de deux boutons pour écouter des enregistrements audio. L’utilisateur doit choisir lequel des deux enregistrements correspond au mot manquant.
Exemples de trois leçons visant à enseigner gustar

L'IA est un élément essentiel dans notre façon d’évaluer les réponses à de nombreux types d'exercices. Par exemple, nous pouvons demander à l’utilisateur de prononcer une phrase à voix haute et utiliser l'IA pour évaluer la qualité de la prononciation. L'IA nous permet également de générer l'audio des exercices, et nous avons même commencé à utiliser dans nos cours les voix de nos personnages de l’univers Duolingo !

Mais nos experts humains jouent aussi un rôle dans la création des exercices. Certains types d'exercices sont difficiles à réaliser par l'IA seule, donc les humains lui ouvrent la voie. Par exemple, quand un exercice demande de lire ou d'écouter un texte puis de répondre à une question à son sujet, nos concepteurs de contenu rédigent eux-mêmes ces questions pour s'assurer qu'elles correspondent à l'objectif d'apprentissage de la leçon et qu'elles nécessitent la bonne compréhension des parties importantes du texte.

Étape 4 : Personnalisation des leçons

La dernière étape consiste à assembler les leçons personnalisées que voient les utilisateurs de Duolingo. Comme expliqué ci-dessus, les cours Duolingo ont une structure prédéterminée, avec une séquence spécifique de leçons et un ensemble d'exercices disponibles pour chacune de ces leçons. Mais chaque leçon rencontrée par un apprenant est unique. Afin de proposer une expérience adaptée aux besoins spécifiques de chaque utilisateur, nous faisons appel à l’IA pour déterminer quels exercices doivent être présentés à l’utilisateur à un temps donné, parmi l’ensemble des exercices disponibles pour cette leçon. C'est là toute la force de l’IA !

Plusieurs modèles d'IA distincts travaillent ensemble pour créer une expérience d'apprentissage personnalisée. Dans la plupart des cas, nous utilisons notre modèle Birdbrain pour déterminer quels exercices correspondront le mieux au niveau de l'apprenant. Par exemple, si un apprenant a du mal à exprimer l’idée qu'il aime quelque chose en espagnol, notre algorithme lui proposera un exercice qui se concentre spécifiquement sur le verbe gustar (aimer). Avec notre phrase d'exemple, A mi caballo le gusta la tele (Mon cheval aime la télé), nous pourrions proposer un exercice demandant de sélectionner la forme de gustar qui convient pour compléter la phrase.

Capture d’écran d’une leçon de grammaire en espagnol avec la phrase « A mi caballo le gust_ la tele ». L’utilisateur doit appuyer sur « a » ou « an » pour compléter le mot correctement.
Une leçon de Duolingo qui enseigne les terminaisons de gustar

Nous disposons aussi d'un modèle pour déterminer le meilleur moment de faire réviser les mots déjà appris, et nous l'utilisons pour ajouter des exercices de révision ciblant ces mots dans une leçon. L’objectif est de maintenir la motivation des apprenants en leur présentant différents types d'exercices et une variété de phrases et de contenu.

Le résultat de ces quatre étapes, ce sont des leçons Duolingo personnalisées qui (1) vous enseignent un ensemble de concepts choisis avec soin, (2) utilisent du contenu linguistique riche, utile à la communication et parfois un peu décalé, (3) présentent des exercices interactifs qui ciblent ce qui est le plus important à apprendre, et (4) s'adaptent à votre niveau.

Comme vous pouvez le constater, il se passe beaucoup de choses dans les coulisses de Duolingo. Nos experts en chair en os et l’IA travaillent main dans la main pour créer l'expérience Duolingo, y compris nos célèbres phrases décalées ! Continuez de vous entraîner pour voir tout ce travail en action !