近頃、インターネット上ではAI(人工知能)が盛んに取り上げられています。AIは、私たちが日々使っているテクノロジー製品にも浸透しており、それをご存知の方も多いことでしょう。Duolingoでは何年も前からAIを活用しており、最近ではDuolingo Max*という、AIの力で学習を強力にバックアップする購読プランも発表しました。また、AIはDuolingoの舞台裏でも活躍し、より高スピードで、より内容の優れたコースの構築に役立っています。
(*2023年8月31日現在、英語話者向けのスペイン語コースとフランス語コースのみ。日本語話者向けは近日開始予定です。)

Duolingoで使われているAIは、「大規模言語モデル」と呼ばれる種類のもので、「ある言葉に対し、次にどのような言葉を配置すれば、文章として成立する可能性が高くなるか」を予測するのが得意なモデルです。これは、皆さんが携帯電話で文章を入力するときの、予測変換機能と同じような仕組みです。

大規模言語モデルは次のように「考えて」います。

文章の一部 次に配置される可能性の高い言葉 確率
私が好きな映画 非常に高い
監督 高い
低い
技術 非常に低い
ショッピング ほぼありえない

Duolingoの教育専門家の手元には、大規模言語モデルを利用した強力なツールがあり、ボタンをクリックするだけで、レッスン作成用の膨大な量のコンテンツを生成することができます。

AIはレッスン作成時にどのように役立っているのか?

AIはDuolingoにとって目新しいものではありません。これまでにも、「バードブレイン」と呼ばれるAIモデルを使い、学習者の得意・不得意に応じた最適な難易度の練習問題を提供してきました。もっとも、バードブレインのAIとしての役割は練習問題の選択のみであり、その練習問題自体を作ってきたのはあくまで人間です。人間の専門家が「Duolingoレッスンをできるだけ楽しく、かつ効果的にするにはどうしたらよいか」を考えながら一つずつ練習問題を書き起こし、さらに見直し・修正・翻訳などのプロセスを行っていました。

現在ではこのような練習問題の作成にも、AIを活用するようになってきています。この大規模言語モデルは、学習の専門家が以前に作成したDuolingoコンテンツの例文から多くのことを学ぶことができます。とはいえ、人間のサポートがないときちんと機能しません。実際には、人間がAIモデルに与える指示をその都度必要に応じて調整しています。例えるなら、AIはぜんまい仕掛けのおもちゃのようなもので、ぜんまいを巻き上げれば必ず動きますが、正しい方向に進ませるには、人間がガードレールを敷いてあげる必要があるのです。

ではAIをきちんと機能させるには、どのような仕組みが必要なのでしょうか?まず、「プロンプト」つまり、Duolingoのある練習問題の書き方をAIモデルに「説明」する、一連の詳細な指示を書きます。「プロンプト」とは、「Duolingoレッスンを自動生成させるための文章作成指示」のようなものだと考えるとよいでしょう。ここで実際のプロンプトがどのような仕組みをしているか、簡単な例と一緒にみてみましょう。


GOという単語を使った練習問題を英語で書きなさい。

ルール
1. 練習問題には、2つの解答選択肢があること。
2. 練習問題の文字数は、75文字未満であること。
3. 練習問題は、CEFRレベルA2英語で書かれていること。
4. 練習問題には、過去形現在完了形が含まれていること。

実行!

練習問題のタイプによっては、指示は同じものとなることがあります。例えば、ルール1とルール2は常に同じです。その他の指示は、新しい練習問題を作成するたびに変わり、 ルール3であれば対象とするコースの種類や難易度によって、そしてルール4は、レッスンが何に焦点を当てているかによって異なります。「固定の情報」と「場合によって変わる情報」をすべて1つのプロンプトの中にまとめ終わったら、ワンクリックするだけで、あとはAIが練習問題を作成してくれます。

このようなプロンプトを開発し、出力された文章を編集する作業と組み合わせることで、AIは強力な武器となります。AIと、それを使いこなす技術者の助けによって、Duolingoの教育専門家はより便利により速く、そしてより生産的に仕事ができるようになりました。これがどれだけ革新的な変化であるかは、以下のようにテクノロジーの変遷を追うと、想像しやすいかと思います。

  • より便利に:かつて車で長距離ドライブに出るときには、必ず地図帳を持っていったものです。その後プラグイン式のカーナビが普及しましたが、ダッシュボード上でかさばるという欠点がありました。それが今や、スマートフォンの地図アプリで事が足りるようになりました。
  • より速く:電卓のおかげで、どんな計算でも、暗算や筆算に比べ格段に速くできるようになりました。電卓が教室に導入されたときには「こんな強力なツールがあったら、生徒が数学を覚えなくなってしまう!」と、パニックが起きました。もっともその後、電卓で正しい答えを導き出すには、その基礎となる数学的プロセスを理解する必要があることがわかりました。電卓という道具は、それを使う人の理解度に応じて、その威力を発揮するのです。
  • より生産的に:ビジネスツールは、さまざまな用途で生産性を高めてくれます。例えばスプレッドシートは、会計のみを目的とし紙面で計算するものから始まり、長い間利用されてきました。しかしデジタルフォーマットに移行すると、多種多様な場面で便利なツールとして使われるようになりました。私のDuolingoでの仕事でも、同僚からのフィードバックの整理や、担当するコースの語彙の管理に使っていますし、数年前にはアプリに関するコンテンツを書くのもスプレッドシート上で行っていました!

これらの技術革新はすべて、私たちの働き方や課題への取り組みに変化をもたらし、その結果仕事をより便利に、より速く、そしてより生産的にしています。

AIは、具体的にはどのような作業をしているのか?

ステップ1:カリキュラム設計
カリキュラム設計者が、レッスンのテーマ、文法、語彙、練習問題の種類などを計画します。ここでは例として、英語の過去形と現在完了形の使い分けについて焦点を当て「懐かしい思い出」をテーマとしたレッスンを考えます。

ステップ2:AIツールの準備
次に、プロンプトを作成します。プロンプトの一部はエンジニアの助けによって、プログラミングで自動的に書き出されます(言語、CEFRレベル、懐かしい思い出のテーマなど)。これに対しカリキュラム設計者は、練習問題の種類や文法の焦点などの必要項目をいくつか追加し、AIを正しい方向に導きます。

ステップ3:生成と微調整
AIモデルが数秒のうちに、難易度、文法、テーマに合った10個の練習問題を出力します。

出力例:

1. I went to the amusement park last summer. I have gone to the amusement park many times.
2. She has eaten her grandmother's apple pie since she was a child. She ate her grandmother's apple pie yesterday.
3. They swam in the lake every summer when they were young. They have swum in the lake recently.
4. We saw the old tree where we carved our names. We have seen the old tree several times.
5. He caught fireflies with his friends last night. He has caught fireflies many times before.
6. She had her favorite childhood book read to her. She has had it read to her numerous times.
7. They sang their favorite songs around the campfire. They have sung those songs together many times.
8. We threw snowballs during the snowstorm last year. We have thrown snowballs every winter.
9. He told me about the time he met his childhood hero. He has told me that story several times.
10. She bought her favorite childhood candy at the store. She has bought that candy whenever she finds it.

カリキュラム設計者はこの中から気に入った文章を3つ選びますが、アプリに入れる前に手作業で編集することもできます。英語をある程度ご存知の方は、これらの練習問題は文法的には正しいものの、中には自然さに欠けるものもあることにお気づきでしょう。その場合、カリキュラム設計者が自然さ、学習上の価値、語彙の適切さを考慮したうえで、調整を行います。最後にDuolingoの英語教育専門家が、最終的な判断を下します。

レッスン作成にAIを活用するメリット

本記事を書いている時点(2023年6月)でのDuolingoの従業員数は1,000人未満ですが、1日のアクティブユーザー数は2,100万人を超えています。この限られた人的資源で「世界最高の教育を開発し、誰もが利用できるようにする」という理念を実現するには、人の力を最大限活用しなければならないのです。

現時点ではDuolingoのコースの構築、更新、維持にかなりの時間がかかっており、多くのコースでは、年に数回しか新しいコンテンツをリリースできません。コンテンツの質は高いまま作成スピードを上げることができれば、次のことが可能になります。

  1. より高度な概念を教えるために、より高いCEFRレベルも対象とする。
  2. ストーリー、ポッドキャスト、そして現在構想中の沢山のアイデアに対し、人的資源を割り当てる。
  3. 注目度が低く学習者が少なめでも熱心なDuolingoファンのいるコースに、より力を入れる。

Duolingoは常にコンテンツ作成スピードの向上に努めています。また、人間の教育専門家の能力を大規模言語モデルのようなツールによって強化することによって、Duolingoを「より便利に」「より速く」「より優れた内容で」お届けしていきます!