Duolingoのレッスンに、「A mi caballo le gusta la tele(私の馬はテレビが好きです)」のようなちょっとヘンテコな文があることはよく知られています。もしかすると、「これは、コンピューターのアルゴリズムが生成したに違いない。人間の専門家が言語を教えるときに、こんなものを思いつくわけがない」と考えている人もいるかもしれません。

果たしてこのような文章は、AI(人工知能)が生成しているのでしょうか?それとも、Duolingoならではの楽しく効果的な学習体験を生み出すため、念入りに計画されたものなのでしょうか?今からその種明かしをしましょう!

カウボーイの男性が、テレビのリモコンを持って、ソファに座っているイラスト。その後ろには馬がいる。男性は馬のえさ用のバケツから干し草を食べ、馬はソファの背もたれを食べている。

Duolingo Way:人間の専門家+AI

Duolingoでは、常に最良の結果が得られる方法を探しています。そして、優れた学習体験を生み出すには、人間の専門知識と高性能AIのそれぞれの強みを活かし、これらを組み合わせるのが最適な方法であることを学んできました。

Duolingoのコースを作成する際には、プロセスを4つの段階に分け、どの段階でも人間とAIの共同作業を行います。ただし、コンテンツの大量作成やパーソナライゼーション(個人最適化)を必要とする段階では、当然ながらAIを使用する割合が高くなります。一方それ以前の段階では、社内の言語学習専門家の役割がより大きくなります。

Duolingoでのコース作成時の各段階に関するグラフ。緑色の棒グラフが、各段階での人間による作業の量を示し、紫色の棒グラフが、各段階でのAIによる作業の量を示している。第1段階のカリキュラムデザインは、ほぼすべてが人間による作業。第2段階のコンテンツ素材作成は、大部分が人間による作業で、一部がAIによる作業。第3段階の練習問題作成は、一部が人間による作業で、大部分がAIによる作業。第4段階のレッスンのパーソナライゼーションは、ほぼすべてがAIによる作業。

ここで、各段階を詳しく見てみましょう。

第1段階:カリキュラム設計

コース作成の最初の段階は、カリキュラム設計です。これは人間の専門家が得意とする分野です。Duolingoでは、どんなコースでも、経験豊富なカリキュラム設計者が「何をどのタイミングで教えるか」をきめ細かに計画します。設計者は、学習目標の順序を決めながら、コースの全体的な構成を設計します。コースはCEFRの基準に従ったものとするのが前提ですが、学習者のすでに持っている言語の知識に合わせてカスタマイズできるような配慮も、同時に行います。さらに、コースで使用するためのシーンを選びます。その際には、身近な説得力のある題材を使って、学習目標がうまく表現されるようにします。そして最後に、単語、フレーズ、文法的概念をレッスン全体にうまく分散させる方法を決定します。これは学習者が大量の新しい知識を前に圧倒されることがないようにし、また、すでに学んだことの上に、徐々に知識を積み重ねていけるようにするためです(このプロセスについては、こちらで詳しく説明しています)。

では、コース作成のこの初期段階で、先ほどの例文「A mi caballo le gusta la tele(私の馬はテレビが好きです)」は、どのような位置づけにあたるのでしょうか?実のところ、このような具体的な文章はまだできていません。ただしカリキュラム設計者は、「馬」「テレビ」「好きです」の単語をいつ教えるか、という計画をあらかじめ立てています。最後の 「好きです」は、英語話者にとって厄介な言葉です。なぜならスペイン語の好き嫌いを表す文の構造は、英語の構造と完全に異なり、「私はテレビが好きだ」ではなく「テレビは私の気に入る」と表現するからです。そのため、英語話者向けのスペイン語コースを設計するときには、この文法概念がコースの後のほうに来るようにカリキュラムを作り、そのために十分なレッスン数を確保できるようにします。

つまり現時点では、カリキュラム設計者は文章を構成する文法概念、語彙、構造をバラバラの状態で扱っており、後の工程で、これらをつなぎ合わせることになります。

第2段階:コンテンツ素材の作成

コース作成の第2段階は、各レッスンの「コンテンツ素材」を作成することです。このコンテンツ素材は、後に具体的な練習問題を作成する際のストックとして、備蓄されます。コンテンツをきちんと作るには、人間の指導経験や創造的スキルが不可欠です。そのため、この工程は人間の専門家が担当します。ただしAIも、専門家が効率的に作業できるようにサポートするという、重要な役割を担っています。

Duolingoのコンテンツ開発者は、コース内で順番に進めていく各レッスンに対し、コース計画で指定された学習目的(趣味について話す、など)に合うコンテンツ素材を書き起こします。これには、日常的なコミュニケーションでよく使われ、かつ新しい単語や文法概念をうまく説明できるような文章や会話を含めます。さらに、学習者を笑わせる「ヘンテコ文」も少々仕込んでおきます。そうすることで、長期にわたる学習の旅の間、学習意欲が持続するからです。最後に、学習者が意味を理解できるように、すべての単語と文の翻訳を行います。これらの作業すべてにおいて、人間の専門家が果たす役割はかけがえのないものですが、AIが優秀なパートナーであることも事実です。たとえばDuolingoでは、コンテンツ開発者がより速く作業でき、さらにミスも防げるような、AIアルゴリズムを搭載したツールを作っています。これによって開発者は、能力を100%発揮できるようになります。また、同じことを表現するのに言い方がいくつもあるような場合には、AIを使って翻訳を何通りも作成して準備しておくことで、学習者のどんな解答もきちんと評価できるようにしています。

コンテンツ開発者が例文を書く際、たとえば趣味についてのレッスンならば、まず「私はスポーツが好きです」「私の父は読書が好きです」といった、一般的な文章を大量に書き起こします。しかしその一方で、「私の馬はテレビが好きです」といった変わり種も、いくらか含めておきます。続いてコンテンツチームは、すべての単語(たとえば「caballo=馬」)の翻訳ヒントを作成し、私の馬がテレビ好きであることを表現できるような他の言い回し(「テレビ」の代わりに「TV」を使うなど)をすべて、リストアップします。以上の工程全体に、AIを組み込んだツールが活用されています。

このようにして文章や会話が書き上がると、次は、これらがレッスンとして機能するように作り上げる段階に移ります。

第3段階:練習問題の作成

これまでの段階で、コース計画と、各レッスン用のコンテンツ素材の準備が完了しました。第3段階では、これらのコンテンツを「質問→解答→答えあわせ」という練習問題に仕上げて、レッスンで学習者に提示できるようにします。練習問題の一部には、カリキュラム専門家やコンテンツ開発者がこのプロセスを担当するものもありますが、ほとんどの場合では、コンピューターのアルゴリズムが自動的に、コンテンツ素材から練習問題を作成します。

ここで例文「私の馬はテレビが好きです」をもう一度見てみましょう。この文章をもとに、AIを使って作成できる練習問題をいくつか紹介します。

  • スペイン語の文章の最も重要な部分だけを空欄とし、学習者に空欄を埋めてもらう練習問題:「好きです」構文を学習目的とし、どこに空欄を置くのがよいかを、AIに自動的に判断させる。
  • 学習者に、スペイン語の単語リストの中からいくつかの単語を選択させ、文章を組み立ててもらう練習問題:単語リストには、正解の文に含まれる単語だけでなく、AIに自動生成させた無関係の単語を含める。無関係の単語の中には、学習者が習ったばかりで、よく覚えていなさそうな単語も入れる。
  • 学習者に文章の音読を聞いてもらい、文章中に含まれていた言葉を候補の中から選んでもらう練習問題:候補となる「音が似ている」2つの音声ファイルを、AIに自動的に見つけてもらう(たとえばgustacuestaなど)。
英語とスペイン語の「私の馬はテレビが好きです」という文を使った、3種類のレッスンの例。左の画面では、完成された英語の文と、単語が1つ欠けているスペイン語の文が表示されている。学習者は、この空欄に単語を入力する。中央の画面は、スペイン語の単語をタップして、文を作る練習問題。右の画面は音声レッスンで、表示されたスペイン語の文には、単語が1つ欠けている。文の下に2つのオーディオクリップのボタンがあり、学習者は、この2つのオーディオクリップのうち、欠けている単語に相当するほうを選択する。
動詞「gustar」を教えることを目的とした、3種類のレッスン例

AIは、アプリが練習問題の答えあわせをする際にも、重要な役割を果たします。たとえば、学習者に文章を音読してもらい、正しく発音できたかどうかをAIが判定します。さらにAIは、練習問題の音声を生成することもでき、最近では色々なコースで、Duolingo各キャラクターの独自の声が使われ始めています!

その一方で、練習問題の作成には専門家の知識や経験が不可欠です。練習問題の種類によっては、AIだけではきちんと作成できないものもあり、その場合は人間が主に作業を行います。たとえば、ある文章を学習者に読んだり聞いたりしてもらい、それについての質問に解答してもらう場合です。質問内容は、レッスンの学習目標と一致し、さらに文章の最も重要な部分が理解できたかどうかを試すものでなければなりません。これを確実に行うため、コンテンツ開発者は自分で質問を書き起こします。

第4段階:レッスンのパーソナライゼーション

最終段階は、学習者がDuolingoの使用中に目にする、パーソナライズされたレッスンの組み立てです。これまで説明したように、Duolingoのコースではコースの構造があらかじめ設計され、レッスンを進める順番も決まっており、各レッスン用に一定量の練習問題が準備されています。しかし、実際に表示されるレッスンは、学習者一人ひとりで異なります。Duolingoアプリは「この学習者には、どの練習問題を、どのタイミングで表示するのが良いか」をAIを使って判断したうえで、レッスン用の練習問題を選び、学習者一人ひとりのニーズに合わせた体験を提供します。これこそが、AIの本領発揮です!

さらにDuolingoでは、カスタマイズされた学習体験を生み出すため、複数のAIモデルを連携させています。ほとんどのケースではバードブレインというモデルが使われ、「このレッスンの中で、学習者の知識レベルに最も適しているのは、どの練習問題か」を判断しています。たとえば、ある学習者がスペイン語の「好きです」という表現が身につかず困っている場合、AIのアルゴリズムは、特に「gustar(気に入る)」に焦点を置いた練習問題を出す可能性があります。このタイミングで、おなじみの例文「A mi caballo le gusta la tele(私の馬はテレビが好きです)」を使った、「gustarの適切な活用形を選んで文を完成させてください」という練習問題が出るかもしれません。

「私の馬はテレビが好きです」というスペイン語の文を使った、文法レッスンの画面。学習者は、「好きです」というスペイン語に対し、正しい活用語尾を選択しなければならない。
動詞「gustar 」の正しい活用形を教えるためのDuolingoレッスン例

また、以前に習った単語を適切なタイミングで復習させるモデルも存在し、これは単語の復習問題をレッスンに追加するために使われています。これらすべてをうまく組み合わせることによって、さまざまな種類の練習問題と、バラエティに富んだ文章や言語の素材を提示し、学習者のモチベーションを維持するしくみとなっています。

このように4つの段階を経て、Duolingoのレッスンは、
(1) 考え抜かれた一連のテーマを用いた学習内容
(2) コミュニケーションに役立ち、時には笑いもある豊富なコンテンツ
(3) 学習内容の最も重要な部分に焦点をあわせた、インタラクティブな練習問題
(4) 一人ひとりの学習状況に合わせたレッスン内容の最適化

これらすべてを兼ね備えた「パーソナライズドレッスン」として完成します。
このように、Duolingoの舞台裏では人間の専門家とAIが協力し、有名なヘンテコ文も含めたDuolingo独自の学習体験を作り出しています。これからもDuolingoで学習を続けて、新しくお目見えするコンテンツでどんどんスキルアップしてください。