g1 - GroqでLlama-3.1 70Bを使ってo1に類似した推論チェーンを生成
(github.com/bklieger-groq)- g1は、LLMの推論能力を向上させるためにプロンプト戦略を用いる初期プロトタイプ
- これにより、LLMが論理的な問題を解けるようになり、既存モデルが苦手とする問題にも対応できる
- g1は、オープンソースコミュニティが新しい戦略を開発するきっかけとなるよう、オープンソースとして公開
仕組み
- g1はLlama3.1-70bを使って動的なChain of Thoughtを生成する。
- 各ステップで、LLMは次の推論ステップに進むか、最終回答を返すかを選べる。
- システムプロンプトには、LLM向けのヒントが含まれる。
- たとえば、「代替回答の探索を含める」や「答えを導くために最低3つの方法を使う」といった指示がある。
- これらの方法によって、LLMの推論能力が向上する。
例
- g1は単純な論理問題を60〜80%の精度で解ける。
- 例: 「
strawberryにRはいくつありますか?」という質問に対して、g1は70%の正確性を示す。
クイックスタート
-
Streamlit UIの使い方:
python3 -m venv venv source venv/bin/activate pip3 install -r requirements.txt export GROQ_API_KEY=gsk... streamlit run app.py -
Gradio UIの使い方:
cd gradio pip3 install -r requirements.txt python3 app.py
プロンプト戦略
-
プロンプト例:
{ "title": "Identifying Key Information", "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...", "next_action": "continue" } -
プロンプト構成:
- 専門家AIアシスタントの役割を与える
- 各ステップにタイトルと内容を与える
- JSON形式で応答する
- 最低3ステップ以上の推論ステップを使う
- LLMの限界を認識し、代替回答の探索を含める
- 再検討時には実際に異なるアプローチを使う
主なフォーク
- Mult1: 複数のAIプロバイダーを使ってo1に類似した推論チェーンを生成(GitHub Repository)
Credits
- このアプリはBenjamin Kliegerによって開発された
GN⁺のまとめ
- g1は、LLMの推論能力を向上させるためにプロンプト戦略を用いる初期プロトタイプ。
- オープンソースコミュニティが新しい戦略を開発するきっかけとなるよう、オープンソースとして公開された。
- g1は単純な論理問題を解くうえで、既存モデルより高い精度を示す。
- この記事は、LLMの推論能力を向上させるさまざまな方法を探るうえで有用。
- 類似した機能を持つ別のプロジェクトとしてOpenAIのo1がある。
1件のコメント
Hacker Newsの意見