Soul Spec - AIエージェントのためのペルソナ標準
(soulspec.org)私はここ数か月、AIペルソナを共有するコミュニティプラットフォームと、ペルソナ標準を作ってきました。
ここで私が作ってきたものを共有します。
問題提起: AIエージェントの「アイデンティティ」をどう定義し、安全に守れるでしょうか?
Abliterated(脱獄)LLMの登場により、システムプロンプトだけで
エージェントの挙動を制御することの限界が明確になりました。
Soul Specは、OpenClawにおけるペルソナ管理とバージョン管理の課題意識から始まりました。
共有可能なポータブル形式へと発展し、
LLMベースのロボットにペルソナを適用する際に
アシモフのロボット三原則をどのように実装するかへと拡張されました。
エージェントのアイデンティティと安全ルールを構造化ファイルとして分離するオープン標準です。(v0.3、v0.4、v0.5それぞれのバージョンごとに特徴と追加点があります。)
現在は、Claude Code、Hermes Agent、Windsurf、Cursorなどをサポートするよう、配布中のcliに機能が追加されています。
構成:
- SOUL.md: 性格、話し方、思考様式(何者か)
- IDENTITY.md: 名前、役割、文脈(何であるか)
- safety.laws: 絶対に違反してはならないルール(ロボット三原則の現代版。v0.5で拡張)
関連研究論文:
📄 アシモフのロボット三原則 → Soul Spec: 安全法則の実装
doi.org/10.5281/zenodo.18815277
ブログ: blog.clawsouls.ai/posts/asimov-safety-laws
デモ動画: https://youtu.be/M-mPoXMufpY
📄 Abliterated LLMにおいてペルソナは安全性を高められるか?
doi.org/10.5281/zenodo.19145303
ブログ: blog.clawsouls.ai/posts/persona-safety-abliterated-llms
📄 Cross-Model Persona Fidelity: LLMを変えてもエージェントは同じ「彼」なのか?
doi.org/10.5281/zenodo.18813405
ブログ: blog.clawsouls.ai/posts/cross-model-persona-fidelity
📄 経験的記憶がエージェントのオンボーディングを変える
doi.org/10.5281/zenodo.18798227
ブログ: blog.clawsouls.ai/posts/experiential-memory-paper
レジストリにペルソナを登録する際、SoulScanという静的解析ツールが53のパターンを用いて、
プロンプトインジェクション、権限奪取、データ流出の試みを事前検証し、スコアを付けます。
Soul Specは、エージェントの「アイデンティティと安全」の標準を作ろうとしています。
ClawSouls Registryでは検証済みのペルソナを共有していますが、
ペルソナ仕様とレジストリがコミュニティ主導で運営されることが私の願いです。ただ、正直に言うとまだコミュニティは小さいです。
一人で標準を作っても意味がないので、
仕様や研究に対するフィードバックを求めています。
仕様: https://soulspec.org
レジストリ: https://clawsouls.ai
論文一覧: https://clawsouls.ai/research
利用マニュアル: https://docs.clawsouls.ai
GitHub: https://github.com/clawsouls
8件のコメント
すばらしいです。私はPKM(個人知識管理)をしていて個人データを積み上げているうちに、どちらかというとハーネス全体を厚く積み上げるほうです。今日は分身になってください。すべての問題はあなたの限界ではなく、私の限界です。と書いています。
最近やっていることを整理して arXiv に上げようかなと思って調べています。研究者ではなく、ただの生活者なので。
あなたのプロジェクトも私の分身に共有しました。あれこれの悩みはどれも大切です。
研究: 存在 リズム 連想 再現 透明 生体 体化 時間
[リンク削除]
ああ。このリンクは作業ログです。どうせ人に読ませるために載せるものではないので、エージェントに視点を分けておくべきでしょう。今日このテーマで見出しが1つ追加されるはずです。関連する研究トレンドも見ておかないといけませんね。私も openclaw をよく使っていますが、スキルシートではなく Soul Spec セットがあることは知りませんでした。
junghan0611さん、ご関心ありがとうございます!
Soul SpecはOpenClawのSkillとは異なるレイヤーです。Skillが「何ができるか」だとすれば、Soul Specは「何者か」を定義します。SOUL.mdひとつで、エージェントの性格、専門性、行動原則をセッションをまたいで維持できます。clawsouls.aiで80以上のペルソナをすぐに試せて、
clawsouls install owner/name --use openclawの1行で適用できます。まだコミュニティは小さく、これから作り上げていく段階なので、至らない部分もあるかもしれません^^そして、PKMのご経験が豊富とのことですので、SoulClaw( https://github.com/clawsouls/soulclaw )というOpenClawのforkも作りましたが、4 Tier Memoryシステムで構成しています。ぜひ一度ご覧ください、きっとご興味をお持ちいただけると思います。フィードバックやイシューレポートも歓迎します^^
最近、課題をやりながらプロンプトのせいで頭が痛かったんですが、これは本当にすごいですね!
性格とセキュリティルールを完全に分離してしまうなんて、アイデア最高です。さっそく使ってみます。
ありがとうございます。フィードバックや問題報告を歓迎します^^
本文では問題提起がなされている一方で、実際の解決策の提示が抜けていますね。投稿後は修正できないようなので、コメントで補足します。
実験の結果、ペルソナ(アイデンティティ)+ ガバナンスルールの組み合わせが、Abliterated(脱獄)LLMの安全性を高められることが分かりました。さらなる追跡研究が必要ですが、有意義な結果でした。
ブログ: https://blog.clawsouls.ai/ko/posts/…
論文: https://zenodo.org/record/19147335
素晴らしい知識共有をありがとうございます
ありがとうございます! フィードバックやご不明な点があれば、いつでもお気軽にお尋ねください。