1 ポイント 投稿者 GN⁺ 2025-04-30 | 1件のコメント | WhatsAppで共有
  • CoRTは、AIモデルが自らの応答を繰り返し見直し、代替案を生成して最適な回答を選ぶようにするアルゴリズム
  • Mistral 3.1 24Bモデルに適用したところ、特にプログラミング作業で性能が大きく向上
  • AIは初期応答を生成し、複数回の「思考ラウンド」を通じて代替案を評価し、最終応答を選択
  • この過程には、自己評価競争的な代替案生成反復的改善動的な思考の深さが含まれる
  • CoRTはMITライセンスで提供されており、改善のための貢献を歓迎

CoRT (Chain of Recursive Thoughts) 🧠🔄

要約

  • AIが自分自身と議論して、より良い回答を見つけるためのアルゴリズムであるCoRTを紹介
  • AIモデルが応答を繰り返し見直し、代替案を生成して最適な回答を選択
  • Mistral 3.1 24Bモデルに適用したところ、特にプログラミング作業で性能が大きく向上

CoRTの動作方式

  • AIが初期応答を生成
  • AIが必要な「思考ラウンド」の数を決定
  • 各ラウンドで:
    • 3つの代替応答を生成
    • すべての応答を評価
    • 最適な応答を選択
  • 最終応答は、このAIバトルロイヤルの生存者となる

秘密のソース

  • 自己評価
  • 競争的な代替案生成
  • 反復的改善
  • 動的な思考の深さ

貢献

  • 改善方法を見つけたなら、PRを歓迎

ライセンス

  • MITライセンスで自由に利用可能

1件のコメント

 
GN⁺ 2025-04-30
Hacker Newsのコメント
  • ある問題についてAIチャットモデルに回答を出させ、その回答がなぜ正しいのかを説明するレポートを書かせる

    • 2つ目のAIモデルにこのレポートを評価させ、元のモデルが提供していない情報や論理的不整合を指摘するレポートを書かせる
    • このプロセスを、2つ目のAIモデルが1つ目のAIモデルの説明に満足するか、1つ目のAIモデルが要求されたすべての変更を実装するまで繰り返す
    • この方法はやや複雑だが、試した際にはかなり良い結果が得られた
  • より大きな規模で、常時稼働モードの「上院」のような討論を試してみたい

    • 個々の問題に応答する代わりに、タスクリストを与えて上院にそれを解決させる
    • 多様な視点と批判的分析によって印象的な結果が得られるのではないかと思う
    • 大量のトークンが必要だが、トークン単価はますます下がっているので可能性はある
    • AI専用のIRCサーバーを立てて、誰でも自分のモデルを接続できる共有の討論空間を作ることもできるかもしれない
  • シンプルな戦略として、メッセージの締めに「思考タグで一度考え、批判タグで一度自己批判し、最後に思考タグでもう一度考えてから返答してください」と依頼する

    • うまく機能する
    • 提案の最大の問題点を5つ見つけるよう頼むのも効果的
  • タイトルから予想していたものとは違った

    • 補助役、クロスチェッカー、判定役を設定し、それぞれの役割に応じて質問と回答を進める
    • ChatGPTに「XYZが事実なら説明してください」と「XYZが事実でないなら説明してください」と依頼し、より説得力のあるほうを探す
  • Unreal EngineのBlueprintスタイルのグラフエディタを作って、ユーザー入力を起点に複数のエージェントが作業するよう設計している

    • Mistral small 3.1とgemma 3モデルは、ローカルで動かせる最初の「半ば有能な」モデルのように感じる
    • ループ内でPython実行を試させて世界を探索するよう指示すると、ニュースなどをダウンロードして読み始める
  • AIエージェントのチームがスクラムチームを運営し、数時間ごとにスタンドアップミーティングを行うようになるのか気になる

    • 政府の官僚制を、エージェントたちが一日中トピックを議論して最善の意見を見つける形で再現するようになるのか気になる
  • MLモデルに新しいアイデアを出させる方法として、すでに試して捨てたアイデアに対して斜めからアプローチしつつ、一定の一貫性制約を維持する

  • すべてのGPUを急いでグリーンエネルギーに切り替えなければ、AIが自力で最適解を見つけるために議論しているうちに地球が熱くなってしまう

  • CoRTを使った例と使わない例があるが、使わない例のほうがはるかに良い

    • 奇妙な例の選び方だ
  • このアプローチはYouTubeクリエイターを思い出させる

    • ゲームをレースコースのようにスクリプト化して目標地点に到達させ、最速の解決策が見つかるまで繰り返す
    • それを機械学習または強化学習と呼ぶ
    • AIについての無知な理解はだいたい似たようなものだ