LIMA - 65B LLaMAモデルと1000個のプロンプトだけでGPT-4に迫る性能を実現

xguru · 2023-05-23T09:36:28+09:00

"Less Is More for Alignment" 強化学習や選好モデリングなしで、厳選された1000個のプロンプトだけを用いてファインチューニングしたLLaMAモデル 43%のケースでGPT-4と同等またはそれ以上に好まれ、Bardと比べると58%、人間のフィードバックで訓練されたDaVinci003と比べて65%高い論文の仮説は、LLMの知識のほぼすべては事前学習中に獲得され、Alignmentはユーザーとやり取りするためのフォーマットやスタイルを学ぶ単純なプロセスだというもの Meta AIの新しい論文

(arxiv.org)

24 ポイント投稿者 xguru 2023-05-23 | 4件のコメント | WhatsAppで共有

"Less Is More for Alignment"
強化学習や選好モデリングなしで、厳選された1000個のプロンプトだけを用いてファインチューニングしたLLaMAモデル
43%のケースでGPT-4と同等またはそれ以上に好まれ、Bardと比べると58%、人間のフィードバックで訓練されたDaVinci003と比べて65%高い
論文の仮説は、LLMの知識のほぼすべては事前学習中に獲得され、Alignmentはユーザーとやり取りするためのフォーマットやスタイルを学ぶ単純なプロセスだというもの
Meta AIの新しい論文

4件のコメント

merong 2023-05-23

セジョンプロジェクトを継続して、韓国語言語モデルのデータをオープンソースとして蓄積していくべきだった。本当に惜しいプロジェクトだった……

kuroneko 2023-05-23

英語の性能はこんなに急速に進歩しているのに、GPTを除くほとんどのモデルは韓国語があまり得意ではなくて残念ですね……

dulco 2023-05-23

Anthropicのclaudeの韓国語学習はかなり高い水準ですが、まだChatGPTより表現力が一部劣っていました。

test4458 2023-05-23

うう、そのとおりです。韓国語はGPT API以外だと全部ゴミみたいなレベルです…

LIMA - 65B LLaMAモデルと1000個のプロンプトだけでGPT-4に迫る性能を実現

関連記事

4件のコメント