- CoRTは、AIモデルが自らの応答を繰り返し見直し、代替案を生成して最適な回答を選ぶようにするアルゴリズム
- Mistral 3.1 24Bモデルに適用したところ、特にプログラミング作業で性能が大きく向上
- AIは初期応答を生成し、複数回の「思考ラウンド」を通じて代替案を評価し、最終応答を選択
- この過程には、自己評価、競争的な代替案生成、反復的改善、動的な思考の深さが含まれる
- CoRTはMITライセンスで提供されており、改善のための貢献を歓迎
CoRT (Chain of Recursive Thoughts) 🧠🔄
要約
- AIが自分自身と議論して、より良い回答を見つけるためのアルゴリズムであるCoRTを紹介
- AIモデルが応答を繰り返し見直し、代替案を生成して最適な回答を選択
- Mistral 3.1 24Bモデルに適用したところ、特にプログラミング作業で性能が大きく向上
CoRTの動作方式
- AIが初期応答を生成
- AIが必要な「思考ラウンド」の数を決定
- 各ラウンドで:
- 3つの代替応答を生成
- すべての応答を評価
- 最適な応答を選択
- 最終応答は、このAIバトルロイヤルの生存者となる
秘密のソース
- 自己評価
- 競争的な代替案生成
- 反復的改善
- 動的な思考の深さ
貢献
ライセンス
1件のコメント
Hacker Newsのコメント
ある問題についてAIチャットモデルに回答を出させ、その回答がなぜ正しいのかを説明するレポートを書かせる
より大きな規模で、常時稼働モードの「上院」のような討論を試してみたい
シンプルな戦略として、メッセージの締めに「思考タグで一度考え、批判タグで一度自己批判し、最後に思考タグでもう一度考えてから返答してください」と依頼する
タイトルから予想していたものとは違った
Unreal EngineのBlueprintスタイルのグラフエディタを作って、ユーザー入力を起点に複数のエージェントが作業するよう設計している
AIエージェントのチームがスクラムチームを運営し、数時間ごとにスタンドアップミーティングを行うようになるのか気になる
MLモデルに新しいアイデアを出させる方法として、すでに試して捨てたアイデアに対して斜めからアプローチしつつ、一定の一貫性制約を維持する
すべてのGPUを急いでグリーンエネルギーに切り替えなければ、AIが自力で最適解を見つけるために議論しているうちに地球が熱くなってしまう
CoRTを使った例と使わない例があるが、使わない例のほうがはるかに良い
このアプローチはYouTubeクリエイターを思い出させる