21 ポイント 投稿者 xguru 2022-10-21 | 8件のコメント | WhatsAppで共有
  • 実際に使われる日常言語は規則的ではなく、混沌としている
  • 言語学者たちは、このような気まぐれな性質を抑えるために、一種の接着剤の役割を果たす「文法」が必要だと考えてきた
  • しかし大規模AI言語モデルは、膨大な量の言語データを基盤に言語を操り、驚くべきことにその大半は文法の助けなしに可能である
  • 生成された文では単語の選び方が不自然だったり無意味だったりする場合もあるが、ほとんどは文法的に正確である
  • 次の単語を思い浮かべる能力において、このAIモデルと人間の脳は似たように動作する
  • GPT-3は人類2万年分の言語経験で訓練されているからだと考えることもできるが、研究によれば約1億語で訓練されたGPT-2も、人間の脳が次の単語を思い浮かべるのと似た形で可能である
    (1億語は、平均的な子どもが10年間で聞く語数とほぼ同じである)
  • これが示しているのは、単なる曝露だけでも、十分に良い文法の文を生成できるほど言語をうまく学び、人間の脳の処理に近い方法で学習できるということだ
  • 長年にわたり、多くの言語学者は、あらかじめ備わった文法テンプレートなしでは言語学習は不可能だと信じてきた
    • しかし新しいAIモデルは、そうではないことを証明している。文法的な言語を生成する能力が、言語経験から学べることを示している
    • つまり、子どもが言語を学ぶうえでは、文法よりも言語経験のほうが重要だということ

8件のコメント

 
wooseop 2022-10-23

AlphaGoが囲碁に強いからといって、囲碁にルールがないわけではありません。

 
jujuhkhkkim 2022-10-22

その通りです。言語を学ぶ最も正確な方法は、多くの経験が重要ですよね。ただ、人工知能が示しているように、基本前提は「途方もなく多くの経験」です。人工知能の基準では、なんと10年間にわたる曝露です。人間はここまでではないにしても、その国の人でもない外国の環境で、こうした言語経験を作るのは難しいです。
その通りです。英語を最も速く、正確に、効率よく勉強するには、ただ数年間留学して学べばいいのです。でも、ほとんどの人は経済的な事情なども含めて、こうしたことができない家庭環境のほうが多いですよね。だから文法を学ぶのです。
ただ、韓国の教育では文法があまりにも強調されすぎていて、言語を学習するための道具として活用するのではなく、学校の成績の文法問題のために文法を勉強しているのは、少し改めるべきではないかと思います。

 
budlebee 2022-10-22

むしろ私は、単純な露出戦略は10年分の露出を必要とする非効率な方法だと思います。

 
bandoche 2022-10-21

| 単なる露出だけでも十分に優れた文法の文章を生成できるほど言語をよく学習していて
この部分は、私がGPTの出力結果を見ながら感じた点そのものですね。

 
humblebee 2022-10-21

興味深いですね! 言語をはじめ、ほかの分野の知識にもこの文脈と似た形で応用できるのではないかと思います。それに比べて、私たちの国の教育は、みんなが知っているように、画一的な知識を暗記する方式が主流になっている現実が残念です。システムの側面から構成員それぞれに適した経験を提供するのは難しく、コストも高いですが、今回の結果のように、脳細胞を模倣して生まれたAIの成果を見て、より良い方向を目指してほしいです。
何より、大人たちによって憂うつな気持ちで学習している子どもたちがあまりにもかわいそうです 😢 学習の本質は楽しいものなのに、と思います!

 
tttttaa 2022-10-21

実は子どもの頃に英語教育を受けたときから疑問でした。私たちはハングルを学ぶとき、文法から先に習ったでしょうか。

今でも外国人が韓国語教育を受けるときの文法の内容を見ると、何を言っているのか分かりにくく不自然です。それでも韓国語はちゃんと話せるんですよね。

 
525hm 2022-10-21

興味深いですね。チョムスキーの時代は終わりを迎えつつあるのでしょうか。

 
orthonormalist 2022-10-23

私の考えでは、むしろチョムスキーの時代が来ているように思います。チョムスキーにとって文法は学ぶものではなく、むしろ生得的なもの、正確には生まれつき備わった能力によって生み出されるものだからです。そして現在の人工知能は、チョムスキーから見ればコンピューターにしかできないぜいたくな学習です。チョムスキーは、幼児が何十万語もの単語を覚えて言語を習得するわけではないと指摘しています。機械学習と比べればはるかに乏しい1〜2年の言語経験だけでも言語を身につける幼児の能力を説明するためのものがチョムスキーの理論であり、現在の機械学習は、コンピューターは人間ですらないのだから、あえて幼児のように言語を学ぶ必要があるのかとしつつ、10年分のデータで言語を学ばせているのです。