Duolingo ist für seine ulkigen Sätze bekannt, wie zum Beispiel diesen spanischen Satz: A mi caballo le gusta la tele (My horse likes TV“ – „Mein Pferd sieht gern fern). Vielleicht denkst du:

„Diese Sätze wurden bestimmt von einem Computerprogramm erstellt. Kein Mensch würde auf die Idee kommen, mit solchen Sätzen eine Sprache zu unterrichten!“

Werden sie also mittels KI automatisch generiert? Oder geschieht hinter den Kulissen noch mehr, um das unterhaltsame und effektive Lernerlebnis zu schaffen, für das Duolingo bekannt ist? Lies weiter und finde es heraus!

Abbildung eines Cowboys, der auf einer Couch sitzt und eine Fernbedienung in der Hand hält. Ein Pferd steht hinter ihm. Der Mann isst Heu aus einem Futtereimer und das Pferd frisst eine Ecke der Couch.

So macht es Duolingo: Menschliches Know-How + KI

Bei Duolingo suchen wir immer nach den besten Lösungen. Wir haben herausgefunden, dass es für ein hochwertiges Lernerlebnis am besten ist, menschliches Fachwissen mit KI zu kombinieren und so die Stärken beider Faktoren zu nutzen.

Wir erstellen unsere Kurse in vier Schritten, wobei in jeder Phase eine Kombination aus Mensch und KI zum Einsatz kommt. In den späteren Phasen, die Gewichtung und Personalisierung erfordern, wird dabei naturgemäß mehr KI verwendet als zu Beginn des Kurses, wo unsere Lernexperten stärker beteiligt sind.

Diagramm, das die Phasen der Kurserstellung bei Duolingo zeigt, wobei die grünen Balken für jede Phase den Anteil der von Spezialisten übernommenen Arbeit angeben, während die lila Balken den Anteil der Arbeit in jeder Phase zeigt, der mittels KI erledigt wird. Phase 1 ist die Lehrplangestaltung, die fast ausschließlich menschliche Arbeit erfordert. Phase 2 ist die Erstellung von Rohinhalten; sie besteht zum größten Teil aus menschlicher Arbeit, die KI leistet hier den kleineren Teil. Phase 3 ist die Erstellung von Übungen; sie besteht zum Teil aus menschlicher Arbeit, der größere Teil ist jedoch Beitrag der KI. Phase 4 beinhaltet die Personalisierung der Lektionen, die fast ausschließlich durch KI erfolgt.

Sehen wir uns die einzelnen Phasen etwas genauer an!

Phase 1: Lehrplangestaltung

In der ersten Phase der Kurserstellung wird der Lehrplan entwickelt und hierbei kommen unsere Spezialisten mit ihrem Fachwissen zum Zug. Erfahrene Curriculum Designer bei Duolingo planen sorgfältig, was im jeweiligen Kurs wann unterrichtet werden soll. Sie entwerfen die Kursstruktur und legen die Reihenfolge der Lernziele fest, die dem CEFR-Standard entsprechen, aber auch dem spezifischen Sprachhintergrund unserer Lernenden angepasst sein müssen. Außerdem wählen unsere Spezialisten reale Alltagssituationen aus, um jedes Lernziel im Kurs bestmöglich zu veranschaulichen. Sie entscheiden auch darüber, wie die Wörter, Sätze und Grammatikkonzepte optimal über die Lektionen verteilt werden sollten, damit die Lernenden nicht von zu viel Neuem auf einmal überwältigt werden und stattdessen schrittweise auf dem zuvor Gelernten aufbauen können.

Was bedeutet das für unser obiges Beispiel A mi caballo le gusta la tele (Mein Pferd sieht gern fern)? Nun, in diesem frühen Stadium der Kurserstellung gibt es noch keine konkreten Sätze, aber die Lehrplangestalter folgen einem Plan, der genauestens vorgibt, zu welchem Zeitpunkt im Kurs die Wörter für Pferd, Fernsehen oder gern mögen unterrichtet werden sollen. Die Wiedergabe von Letzterem, gern mögen, im Spanischen ist für deutsche Muttersprachler schwierig, da im Spanischen die Sätze, in denen es um Vorlieben oder Abneigungen geht, anders aufgebaut sind als im Deutschen. Anstatt Ich sehe gern fern zu sagen, würde man im Spanischen so etwas sagen wie Fernsehen gefällt mir. Bei der Gestaltung eines Spanischkurses für Deutschsprachige würden die Lehrplangestalter dieses grammatikalische Konzept also erst etwas später in den Kurs einbauen und mehrere Lektionen dafür vorsehen.

Ein Lehrplangestalter betrachtet in dieser frühen Phase also einzelne Konzepte wie den Wortschatz und Satzstrukturen, verknüpft diese aber nicht miteinander … zumindest noch nicht!

Phase 2: Erstellung von Rohinhalten

Die zweite Stufe der Kurserstellung ist das Schreiben der „Rohinhalte“ der Lektionen, die später als Teil des Pools an verfügbarem Material dienen, aus dem spezifische Übungen erstellt werden. Dieser Teil wird von unseren Spezialisten erledigt, deren Lehrerfahrung und Kreativität für die Erstellung unserer Inhalte unerlässlich sind. Die KI ist jedoch nützlich, da sie unseren Spezialisten dabei hilft, ihre Arbeit effizient zu erledigen.

Für die Lektionen der Kurse schreiben die Content Developer von Duolingo „rohe“ Inhalte, die zu den im Kursplan angegebenen Lernzielen passen, z. B. über Hobbys zu sprechen. Dazu gehört alles von Sätzen über Absätze bis hin zu Mini-Dialogen über alltägliche Situationen, die neue Wörter und Konzepte besonders gut veranschaulichen. Es sollen auch komische Sätze dabei sein, um die Lernenden zum Lachen zu bringen und den gesamten Lernprozesses etwas lockerer und unterhaltsamer zu gestalten. Zum Schluss schreiben wir Übersetzungen für alle Wörter und Sätze, damit die Lernenden ihre Bedeutung verstehen. Und während menschliche Experten bei all diesen Aufgaben einzigartige Kenntnisse einbringen, ist die KI ein starker Partner: Wir entwickeln Tools auf der Grundlage von KI-Algorithmen, damit die Content Developer schneller und mit einer geringeren Fehlerquote arbeiten und sich auf das konzentrieren können, was sie am besten können. Die KI kommt beispielsweise dann zum Einsatz, wenn eine Reihe möglicher Übersetzungen pro Satz erstellt werden soll, um später die unterschiedlichen korrekten Antworten unserer Lernenden automatisch zu akzeptieren.

An diesem Punkt würde unser Beispielsatz entstehen. In einer Lektion über Hobbies beispielsweise würden unsere Content Writer viele Sätze aus dem Alltag schreiben, wie zum Beispiel „Ich mache gern Sport“ oder „Mein Vater liest gern“, aber auch ungewöhnliche Sätze wie unser Beispiel „Mein Pferd sieht gern fern“. Das Content Team erstellt anschließend auch Wörterbuchhilfen für jedes Wort, (z. B. caballo = „Pferd“) sowie alle verschiedenen Möglichkeiten, „Mein Pferd sieht gern fern“ auszudrücken, indem sie beispielsweise für „Pferd“ auch „Ross“, und für „Fernsehen“ auch „TV“ zulassen. Und genau in diesem Prozess findet die KI ihren Einsatz.

Sobald die Sätze und Dialoge geschrieben sind, ist es an der Zeit, sie in einer Lektion einzusetzen!

Phase 3: Erstellung der Übungen

Zu diesem Zeitpunkt haben wir einen Kursplan mit vielen „rohen“ Inhalten für jede Lektion. In der dritten Phase nutzen wir diese Inhalte, um einen Pool an interaktiven Übungen zu erstellen, die in die Lektionen für unsere Lernenden eingebettet werden. Während einige dieser Übungen von unseren erfahrenen Lehrplan- und Content Developern erstellt werden, verwenden wir die meiste Zeit Computeralgorithmen, um automatisch Übungen aus den „rohen“ Inhalten zu erstellen.

Sehen wir uns erneut unser Beispiel an: A mi caballo le gusta la tele. Im Folgenden listen wir nur eine kleine Auswahl der Aufgabentypen auf, die wir mithilfe von KI zu diesem Satz erstellen.

  • Die Lernenden füllen Lücken im Text aus, um den wichtigsten Teil eines längeren spanischen Satzes zu vervollständigen. Dabei identifizieren wir automatisch die Stelle im Satz, die die Lernenden vervollständigen sollen, um gezielt die Struktur von „le gusta“ zu üben.
  • Die Lernenden kombinieren spanische Wörter aus einer Wortsammlung zu einem vollständigen Satz. Unter den Wörtern in der Wortsammlung befinden sich auch automatisch generierte falsche Alternativen, die aus anderen kurz zuvor gelernten Wörtern bestehen, bei denen die Lernenden noch unsicher sein könnten.
  • Die Lernenden wählen aus zwei Tonaufnahmen das Wort aus, das sie zuvor in einem Satz gehört haben, wobei die KI automatisch ein Distraktor-Wort wählt, das ähnlich wie das korrekte Wort klingt (z. B. „gusta“ und „cuesta“).
3 Screenshots zeigen verschiedene Übungstypen zum Satz „My horse likes TV.“ / „A mi caballo le gusta la tele.“ aus dem Spanischkurs für Englischsprachige. In der ersten Übung wird der vollständige englische Satz und anschließend der spanische Satz mit einem fehlenden Wort angezeigt, das der Lernende eintippen soll. Die zweite Übung fordert die Lernenden dazu auf, spanische Wörter aus einer Wortsammlung anzutippen, um einen vollständigen Satz zu bilden. Bei der dritten Übung handelt es sich um eine Tonübung, bei der der spanische Satz mit einem fehlenden Wort auf dem Bildschirm angezeigt wird, gefolgt von zwei Schaltflächen, die kurze Tonabschnitte enthalten. Der Lernende muss auswählen, welcher der beiden Tonabschnitte das fehlende Wort darstellt.
Beispiele von drei Übungen in einer Lektion des Spanischkurses für Englischsprachige, mit der die Lernenden gezielt die spanische Struktur mit „gustar“ trainieren.

KI ist auch ein wichtiger Bestandteil der Bewertung vieler Übungstypen. In einer Übung sollen die Lernenden zum Beispiel einen Satz laut nachsprechen und mittels KI wird automatisch festgestellt, ob die Aussprache dabei korrekt war oder nicht. KI ermöglicht es uns auch, den Ton für die Übungen automatisch zu generieren: Wir haben vor Kurzem damit begonnen, in einigen Kursen individuell erzeugte Stimmen für unsere Duolingo-Charaktere zu verwenden!

Aber auch unsere Spezialisten spielen beim Erstellen von Aufgaben eine wichtige Rolle – vor allem dort, wo die Aufgabentypen von der KI allein nur schwer zu bewältigen sind. Eine Aufgabe besteht beispielsweise darin, dass Lernende einen Absatz lesen oder anhören und dann eine Frage dazu beantworten sollen. Unsere Content Writer verfassen diese Fragen selbst, um sicherzustellen, dass das Abgefragte auch tatsächlich mit dem Lernziel der Lektion übereinstimmt und das Verständnis der wichtigsten Teile des Textes erfordert.

Phase 4: Personalisierung der Lektionen

Im letzten Schritt werden die Lektionen, die die Lernenden auf Duolingo sehen, personalisiert. Wie oben beschrieben, haben Duolingo-Kurse eine vorgegebene Kursstruktur mit einer spezifischen Abfolge an Lektionen und einem Pool an Übungen für jede dieser Lektionen. Jede Lektion, die die Lernenden zu sehen bekommt, ist jedoch einzigartig: Wir nehmen den Pool der verfügbaren Übungen für diese Lektion und verwenden KI, um herauszufinden, welche dieser Übungen wem und zu welchem Zeitpunkt gezeigt werden sollen, damit die Lektion so personalisiert wie möglich und auf die spezifischen Bedürfnisse jedes Lernenden zugeschnitten ist. Und hier kann KI glänzen!

Für ein möglichst individuelles Lernerlebnis auf Duolingo werden verschiedene KI-Modelle zusammen verwendet. In den meisten Fällen nutzen wir unser sogenanntes Birdbrain-Modell, um herauszufinden, welche Übungen einer Lektion am besten zum Kenntnisstand des jeweiligen Lerners passen. Wenn sich ein Lerner beispielsweise noch schwertut mit dem spanischen Verb „gustar“, so könnte dieser Algorithmus ihm eine Übung aussuchen, die gezielt darauf eingeht. Bei unserem Beispielsatz „A mi caballo le gusta la tele“ („Mein Pferd sieht gern fern“) könnte dies bedeuten, dass wir den Lernenden eine Übung anbieten, in der die richtige Form von „gustar“ auszuwählen ist, um den Satz zu vervollständigen.

Ein Screenshot einer Übungslektion zur Grammatik, die den spanischen Satz „A mi caballo le gust_ la tele.“ anzeigt. Der Lernende muss auf eine der zwei darunter befindlichen Schaltflächen „a“ oder „an“ tippen, um das Wort richtig zu vervollständigen.
Eine Spanischlektion für Englischsprachige auf Duolingo, die darauf abzielt, die korrekte Form von „gustar“ zu verwenden

Wir haben auch ein Modell, das bereits gelernte Wörter automatisch zu einem bestimmten Zeitpunkt in eine Lektion einbaut, um sie mit einer Übung zu festigen. All diese KI-Modelle und Übungstypen haben ein Ziel: die Motivation der Lernenden aufrechtzuerhalten, indem wir ihnen eine Mischung aus verschiedenen Übungstypen und eine Vielzahl von Sätzen und anderen sprachlichen Aspekten zeigen.

Das Ergebnis dieser vier Schritte der Kurserstellung ist eine personalisierte Duolingo-Lektion, die 1. unseren Lernenden eine sorgfältig ausgewählte Reihe von Konzepten beibringt, 2. reichhaltige, kommunikativ hilfreiche und manchmal auch alberne Sprachinhalte verwendet, 3. interaktive Übungen beinhaltet, die gezielt auf bestimmte sprachliche Aspekte eingehen und 4. für jeden Lerner individuell angepasst sind.

Wie man sehen kann, geschieht eine ganze Menge hinter den Kulissen, wenn Spezialisten aus Fleisch und Blut gemeinsam mit KI das einzigartige Lernerlebnis schaffen, für das Duolingo bekannt ist – einschließlich unserer berühmten ulkigen Sätze! Übe gleich weiter und sieh dir all das in Aktion an!