あなたは言語モデルより次の単語を予測するのが得意ですか?
(joel.tools)"言語モデルより賢いですか?"
多くのベンチマークは、言語モデルが人間の作業をどれほどうまくこなせるかを評価しようとしています。
しかし、次の単語を予測するという典型的な言語モデルのタスクでは、あなたはどれくらいうまくできるでしょうか?
15問に挑戦してみてください
"言語モデルより賢いですか?"
多くのベンチマークは、言語モデルが人間の作業をどれほどうまくこなせるかを評価しようとしています。
しかし、次の単語を予測するという典型的な言語モデルのタスクでは、あなたはどれくらいうまくできるでしょうか?
15問に挑戦してみてください
3件のコメント
4点…結果がイラッとしますね
ああ、まいった。英語の問題を解くみたいにやったら、点数が全然出ませんね……
Hacker Newsの意見
タイトルの「スマート」から期待したものとは違うが、興味深いアイデアではある
Hacker Newsのコメントで次の単語を当てるゲーム/クイズを作成した
logit_biasを設定し、許可された回答のうち1つだけを選ぶようにした言語モデルが最も選びそうにない単語を選ぶのが勝つための戦略である
結果を見ると、与えられた情報だけで次の単語を正確に予測するのは不可能である
このゲームは、HNのコメントを読みすぎているかどうかを確認するよいテストである
毎回ランダムなクイズが出るため、結果を比較できない
HNで過ごした時間のおかげで、AIより少しだけ良い予測ができた
100問クイズに挑戦する人へ: 伝統的な統計基準では、3分の1超を当てて初めて単なる当てずっぽうより良いと見なされる
サンプルがHN由来なら、そのテキストがすでにデータセットの一部である可能性がある
一部はより大きな文脈から抜粋されており、LLMが予測で有利な立場にある