2 ポイント 投稿者 GN⁺ 2024-09-17 | 1件のコメント | WhatsAppで共有
  • g1は、LLMの推論能力を向上させるためにプロンプト戦略を用いる初期プロトタイプ
  • これにより、LLMが論理的な問題を解けるようになり、既存モデルが苦手とする問題にも対応できる
  • g1は、オープンソースコミュニティが新しい戦略を開発するきっかけとなるよう、オープンソースとして公開

仕組み

  • g1はLlama3.1-70bを使って動的なChain of Thoughtを生成する。
  • 各ステップで、LLMは次の推論ステップに進むか、最終回答を返すかを選べる。
  • システムプロンプトには、LLM向けのヒントが含まれる。
  • たとえば、「代替回答の探索を含める」や「答えを導くために最低3つの方法を使う」といった指示がある。
  • これらの方法によって、LLMの推論能力が向上する。

  • g1は単純な論理問題を60〜80%の精度で解ける。
  • 例: 「strawberryにRはいくつありますか?」という質問に対して、g1は70%の正確性を示す。

クイックスタート

  • Streamlit UIの使い方:

    python3 -m venv venv  
    source venv/bin/activate  
    pip3 install -r requirements.txt  
    export GROQ_API_KEY=gsk...  
    streamlit run app.py  
    
  • Gradio UIの使い方:

    cd gradio  
    pip3 install -r requirements.txt  
    python3 app.py  
    

プロンプト戦略

  • プロンプト例:

    {  
      "title": "Identifying Key Information",  
      "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...",  
      "next_action": "continue"  
    }  
    
  • プロンプト構成:

    • 専門家AIアシスタントの役割を与える
    • 各ステップにタイトルと内容を与える
    • JSON形式で応答する
    • 最低3ステップ以上の推論ステップを使う
    • LLMの限界を認識し、代替回答の探索を含める
    • 再検討時には実際に異なるアプローチを使う

主なフォーク

  • Mult1: 複数のAIプロバイダーを使ってo1に類似した推論チェーンを生成(GitHub Repository)

Credits

  • このアプリはBenjamin Kliegerによって開発された

GN⁺のまとめ

  • g1は、LLMの推論能力を向上させるためにプロンプト戦略を用いる初期プロトタイプ。
  • オープンソースコミュニティが新しい戦略を開発するきっかけとなるよう、オープンソースとして公開された。
  • g1は単純な論理問題を解くうえで、既存モデルより高い精度を示す。
  • この記事は、LLMの推論能力を向上させるさまざまな方法を探るうえで有用。
  • 類似した機能を持つ別のプロジェクトとしてOpenAIのo1がある。

1件のコメント

 
GN⁺ 2024-09-17
Hacker Newsの意見
  • ChainOfThought手法は単純で、より洗練された手法はTreeOfThoughtsである
    • OpenAIに関連するヒントはツリー探索に関係している
    • CoTをツリーとして構築し、最適な解を見つけることが重要である
  • 指示事項を大文字で強調するのは面白い
    • AGIを成功させる最初の人物は、LLMの信頼性を高める方法を見つけるだろう
  • o1の革新はChain-of-Thoughtではなく、CoTをうまく実行するようモデルに教えることにある
    • 単純なプロンプトエンジニアリングだけではo1の性能は得られない
  • LLMは入力を異なる形で「拡大」して問題を解決できる
    • テキストを文字ごとに入力したり、画像形式に変換して細部を確認したりできる
  • optillmプロジェクトと似た作業を行っている
    • 複数の最適化技術を使ってLLMを改善できる
  • ollama:8bを使って100%ローカルで実行できるように変更した
    • Readmeはまだ更新されていない
  • 「推論」の定義を見つけることが重要である
    • LLMの推論問題は古典的アルゴリズムと組み合わせて解決できる
    • 思考過程を二つの部分に分け、適切なモデルで実行する必要がある
  • .9と.11のどちらが大きいかを尋ねるプロンプトに対して、.9のほうが大きいと回答した
    • これは単純なシステムプロンプトである
  • 面白半分で、Llama-3.1 7Bモデルをローカルで実行できるようにプロジェクトをフォークした
    • いちご問題は解けないが、0.9のほうが大きいことは見抜ける