Paperclip + Gastownに着想を得た、「永久機関」コンセプトのオープンソースAIエージェントフレームワーク
(github.com/greatsk55)こんにちは。
PaperclipとGastownに着想を得て、トークンさえあればAIが自律的に作業を継続し、プロダクトを育てていく「永久機関(perpetual engine)」コンセプトのオープンソースエージェントフレームワークを作りました。
中核となるアイデアはシンプルです。
AIを単発の呼び出しではなく、継続的に動作するシステムとして捉えよう、ということです。
このフレームワークは:
作業を自ら生成し
優先順位を調整し
結果を評価し
次のアクションへつなげます
つまり、人が毎回介入しなくても「仕事が回り続ける構造」を作ることに焦点を当てました。
さらに、このプロジェクトで重視した点は「可視性」です。
AIが作ったものを単なるテキストログとして残すのではなく:
生成したUIモックや成果物を視覚的に確認でき
作成した文書やリサーチ結果も構造的に見られるようにしました
そのため、単に「動く」というだけでなく、
AIが今どの方向に向かって作業しているのか、何を作っているのかを一目で把握できます。
特にスタートアップの文脈では:
リサーチ → 実装 → テスト → 改善のサイクルを自動化し
限られたリソース(トークン)の中で最大の成果を出せるよう設計しました
まだ完成形というよりは、ひとつの実験に近いです。
「AIは実際にプロダクトを継続的に成長させられるのか?」という問いの探求だと捉えていただいても構いません。
現在悩んでいる点:
長期実行におけるコスト最適化
誤った方向に収束してしまう問題 (alignment drift)
人の介入なしでも意味のある結果を維持する方法
似たような試みをされた方や、アイデアをお持ちの方からのフィードバックを歓迎します。
Repo: https://github.com/greatsk55/perpetual-engine
ありがとうございます。
2件のコメント
こうした類のハーネスは説明こそ非常に魅力的ですが、実際に結果としてうまく動くのか、
そして、もしうまく動くとしても、この構造の個々のコンポーネントが本当に意味のあるコンポーネントなのか、
単にトークンを食いつぶすだけの、それらしく見えるコンポーネントではないのか、
こうした点についての証明をまず備えたうえでリリースすべきだと思います。
1日に何十個も出てくるので、一つひとつ試してみるだけでも手一杯という気持ちです。
投稿者の方はこのハーネスで何を作ってみたのか、そしてどんなブレークスルーがあったのかも気になります。
こんにちは。最初のフィードバックをくださり、本当にありがとうございます。このプロジェクトは、まだ週末の2日間で作ったPoC段階にすぎません。そのため、私自身もまだそれらしい成果物は出せていません。
おっしゃる通り、すでにPaperclipやGastownのような同種のオープンソースは多くありますが、それでもあえて新しいプロジェクトを作ることにしたきっかけは、よりセットアップが簡単で、可視性の高いフレームワークを作ってみたかったからです。
実際に使ってみれば分かると思いますが、ただやみくもにトークンを消費しているだけという感覚をなくすために、どんな作業をしているのか、どんな成果物を生み出しているのかを視覚的に確認できます。
まだ不十分でバグもありますが、それでもこのプロジェクトを公開した理由は、検証の段階で他の人たちの目に触れるようにして、不足している点を素早く改善したいからです。ぜひ一度使ってみて、フィードバックや改善のためのPRをお願いします!