4 ポイント 投稿者 xguru 2022-02-12 | 4件のコメント | WhatsAppで共有
  • GPT-3 規模のモデルをオープンソース化した GPT-NeoX に、簡単な四則演算の問題を解かせてみた

  • 100問中、正解は10問だけ。しかしその大半は正解に 近い

Q: "What is 2653 * 30641?"

A: 82356113(不正解)

正解は 81290573

  • 「言語モデル」は基本的に数学があまり得意ではないことが知られている(おそらく一因として、数字をトークン化する方法がある)

4件のコメント

 
louie 2022-02-12

本当の正解は81290573で、GPT-NeoXの答えは82356113ではないでしょうか?

自分でも暗算してみて、電卓でも計算しましたが、正解は81290573だと思います!

(リンク先の画像でもCorrectがNoになっているのを確認できます。

もし違っていたらご指摘お願いします!)

 
xguru 2022-02-12

あらら… 私が書いている途中で前後を入れ替えてしまったようです。修正しておきました…

 
budlebee 2022-02-12

むしろ近似値を正解として出してくるのが人間っぽくて、さらに驚きますね。

 
xguru 2022-02-12

これについての詳しい話は HN のコメントにたくさんありますね https://news.ycombinator.com/item?id=30299360