私たちの脳は学習するように作られており、このブログの読者の皆さんの中には、脳の学習プロセスについて興味をお持ちの方も多いことでしょう。学習は、人間が自然に(ときには気づかないまま無意識に)行うもので、そして私たちの脳には、生まれた瞬間から学習を開始するのに役立つ数多くのパターン発見ツールが備わっています。これらの精巧な学習ツールのひとつが「統計的学習」と呼ばれる機能で、私たちの脳を最高のコンピューターにするために、見えないところで絶えず稼働しています! 今回のブログでは、私たちの学習の過程で「統計的学習」がどのように働くのかを見ていきましょう。

統計的学習とは何か?

💡
統計的学習は、私たちの脳が自分を取り巻く世界について学習する方法のひとつです。人間の脳は生まれた直後からこれを行っています!

あなたが言語を聞いたり、音楽を聴いたり、周囲を観察したりするたび、脳は何が起こっているかを観察したり、回数を数えたりしています。そして「あることが起きたら、その前または後に、特定の別のことが起こる」という場合、脳はその頻度を計算し、その組み合わせが起こる頻度を学習します。そして複数のことがらがいつも一緒に起こるのであれば、それは重要な組み合わせである可能性が高く、あなたの記憶にも残ります。これが「統計的学習」です。

そして脳には「パターンの追跡」をするという性質があります。統計的学習と同様に、自然な脳の働きの一部であるため、自分ではやっていることにさえ気づきません。脳は「統計からXXが判明しました」とか「XXという仮説を立てて検証しました」といった発表を行ってくれるわけではないので、私たちには、「こう来たら次はこうなるはず」とか「正しいパターンのような気がする」といった直感や推測、本能のように感じられることがほとんどです。

脳は決して監視の目を緩めず、データにパターンがあるかもしれないと考えるたびに、その分析に取りかかります👀 たとえば生後数日の赤ちゃんでも、いろいろな音色を聞かせると、音程のパターンを追跡するということがわかっていますが、これは、音楽にも独自の「文法」があり、私たちの脳はパターンの統計的分析をするようにできているからです。

このような背景を知れば、脳が言語を聞いてパターン分析するというのも納得ですね!

母語の統計的学習

言語というデータは、脳の注意を常に引きつけており、聞く・話す・読む・書くのいずれを行っても、追跡と分析が行われます。

人間の脳は、母語の習得過程で「共起(何と何が一緒に起こるか)」を常にチェックしています(実は大規模言語モデルのようなAIも、このようなパターン探しによって学習しています!)。そして、どのような構成が単語や文章となる可能性が高いかを理解するために、ある文字や言葉の次に特定の文字や言葉が出現する頻度を数え、推移確率を計算します。

たとえば赤ちゃんの頃から英語を聞いている人は、「baby(赤ちゃん)」という単語をよく耳にしたはずです。「こんにちは、赤ちゃん」「なんて可愛い赤ちゃん!」「あら、赤ちゃんはお昼寝が必要かしら?」「赤ちゃんを見にいかなきゃ!」といった具合です。

そこでこの赤ちゃんの脳は「『ba-』が聞こえたら次は『-by』が来ることが多い」と学習し、さらには「『ba+by』はセットで覚えるべき重要な単位かもしれない」と推測し始めます。

とはいっても「ba-」の後に他の音が続く「bagel」などの単語もあります。そこで脳は言語について大量の統計処理を行い、それぞれの組合せがどれだけの頻度で出現したか、そしてその状況ではどんなことが起こっていたかを学習します(ベーグルが名物のニューヨーク育ちの赤ちゃんは、「bagel」という単語の「ba」の音を聞くたびに、「あれ?『Baby』じゃないの?」と混乱したかもしれませんね🥯)。

赤ちゃんの脳が英語を観察しながら行う計算の例を、もう2つ紹介してみましょう。

  • 「the」の後にはどんな単語が来るか。英語では、名詞(「the shoe(靴)」)に対し、形容詞や副詞が「the」の後に付きます(「the old shoe(古い靴)」や「the really old shoe(本当に古い靴)」など)。しかし「the」の後に「my」のような所有代名詞が来ることはないので(他の言語ではあり得ても、英語では「the my shoe」とは言えません!)、脳にそのようなデータは記録されていません。
  • 一部の母音は、その後に必ず子音が付く。たとえば英語の「put」の「u」の音(国際音声記号では[/ʊ/])は、単語中で子音が後に続く場合にのみ、存在します。一方で「do」(「o」の発音は[/u/])や「me」(「e」の発音は[/i/ ])の最後の母音は、母音で終わることができます。よって[/ʊ/]を持つ単語では、[/ʊ/]の後に必ず子音があるということが予想できます(「good」「put」「book」など)。

たとえあなたがこういったルールを意識していなくても、あなたの脳は幼児期からパターンを追跡し続けていて、それを毎日使っているのです!

新しい言語の統計的学習

人間の脳は、外国語を学習するときにも、同じような追跡と分析を行います。

  • スペイン語学習者の脳は、文法上の性を追跡しているはずです。たとえば男性形(「el」「alto」「rojo」など)と結びつく名詞はどれで、女性形(「la」「alta」「roja」など)と結びつく名詞はどれか、などを分析しています。
  • ドイツ語学習者の脳は、動詞がどこに置かれるのかを分析しているはずです。ドイツ語の文の中で動詞がどこに入るかにはいくつかのパターンがあり、脳は新しい文を見るたびに、その文の中に動詞がいくつあったか、どのような順番だったか、活用していたかどうかなどを記録します。
  • 英語学習者の脳は、疑問文の語順を分析しているはずです。英語の疑問文にはいくつかのパターンがあり、脳は新しい疑問文に出くわすたびに、質問の種類、疑問代名詞「why」「when」「which」が使われていたかどうか、疑問文で言葉がどんな順番で並んでいるかなどを記録しています。

大人の学習者にとって問題となるのは、脳がパターンを学ぶのに必要なデータを、十分な量や適切な種類で得るのがより難しいということです。母語を覚えるときには、何年もかけて言葉の使われ方に関する膨大な知識を蓄積しますが、大人になってから外国語を学ぶ場合、一度にほんの少しの量のデータを取ることしかできないことがほとんどです。そのため、言語の習得に必要なパターンをすべて把握するだけの材料を脳に与えることができないのです!

だからこそ、しっかりとした学習習慣を身につけることがとても重要なのです。Duolingoのレッスンをはじめ、音楽テレビや映画、さらにはビデオゲームなどの自分が最も楽しめる方法で毎日言語に触れることで、貴重な言語データを得ることができます。

あなたの脳は究極のAIだ!

あなたの脳は、目に見えないところでひっそりと、周囲のあらゆるものを数え、追跡し、分析しています。あなたが毎日何気なく使っている母語も、脳が言語の複雑なパターンを解明してくれたおかげで身に着いたもの。そして今は、新しい言語も懸命に学習しようとしてくれています。だから、できるだけ多くのデータを与えてあげましょう! 🤓