ClaudeのメモリアーキテクチャはChatGPTと正反対
(shloked.com)- Claudeのメモリシステムは、ユーザーが明示的に呼び出したときにのみ有効になり、実際の会話履歴をリアルタイムで検索して情報を返す
- 一方でChatGPTは会話のたびにユーザープロフィールと履歴を自動で読み込み、即座にパーソナライズされた体験を提供する
- この2つのアプローチは、ターゲットユーザー層と製品開発思想の違いを反映している
- Claudeのユーザーは開発者や専門家が中心で、透明性と直接的な制御、そしてプライバシー保護を重視する
- 最近ではClaudeにもChatGPTに似た自動メモリ機能がチームおよびエンタープライズアカウント向けに導入されるなど、AIメモリ設計の領域が急速に拡大している
Claudeのメモリシステムの仕組み
Claudeのメモリシステムには2つの中核的な特徴がある
- 各会話の開始時には空の状態から始まり、ユーザープロフィールや過去の会話履歴を事前に読み込まない
- メモリ機能は、ユーザーが「以前話した内容を教えて」「前回の続きから進めて」などの明確な呼び出し文句を使ったときにのみ有効になる
Claudeは、AIが生成した要約や圧縮されたプロフィールではなく、実際の過去の会話履歴だけをリアルタイムで検索してその情報を活用する
検索が完了すると、Claudeは検索結果を統合してユーザーのリクエストに答えたり、議論を続けたりする
Conversation Searchツール
- conversation_searchツールは、会話履歴全体をキーワードやトピック別に検索する
- たとえば「Chandni Chowkについて話していた内容を覚えてる?」と依頼すると、Claudeはそのトピックに関連する複数の会話を見つけて統合し、要約を提供する
- 複数のトピック(例: Michelangelo, Chainflip, Solana)を同時に質問すると、それぞれを個別に順次検索して、該当内容をリンク付きで返す
- conversation_searchのパラメータには、検索結果の最大件数や検索クエリなどが含まれる
- 例: max_results(1~10), query(検索キーワード)
Temporal Chat Retrievalツール
- recent_chatsツールは、時間基準で会話履歴にアクセスする
- 「最近10回の会話内容を教えて」のように依頼すると、最新の会話を順に見つけて要約を提供する
- 特定期間を指定して「2024年11月の最終週に話した内容は?」のように、時点ベースで検索することもできる
- recent_chatsのパラメータには after/before(開始・終了時点)、n(会話数、1~20)、sort_order(昇順/降順)がある
ChatGPTとClaudeの比較
昨年まではChatGPTとClaudeが提供する主要機能は似ていたが、現在では製品の方向性が大きく異なっている
- ChatGPTは大衆市場向けのコンシューマー製品として発展してきており、学生、親、趣味層など多様な背景のユーザーが利用している
- すべての会話でメモリ構成要素が自動的にロードされ、即時で手軽なパーソナライズ体験を提供する
- 詳細なユーザープロフィールをもとに、将来の機能推薦、カスタマイズ機能、収益化に活用できる
- Claudeは開発者、エンジニア、専門家中心のユーザー層をターゲットに開発されている
- ユーザーはアルゴリズムの動作を理解しており、いつメモリを呼び出すかを明確に選択する
- プロファイリングや自動化よりも、ツールとしての機能性、予測可能性、プライバシー保護により大きな価値を置く
このように、両サービスのメモリシステムはユーザー層と開発思想の違いを直接的に反映している
AIメモリ設計の多様性
ChatGPTとClaudeの正反対のメモリシステムは、AIメモリ設計の領域が非常に多様であることを示している
- メモリアプローチに正解や普遍的な解法はなく、実際のユーザーニーズや目的に応じて設計を逆算していくことが不可欠である
- AIツール活用の歴史はまだ3年にも満たず、同じAIアシスタントを長期間利用する際の蓄積データ処理やプライバシー管理について、確立されたベストプラクティスが存在しない状況にある
- 現在、さまざまなAIアプリがそれぞれ独自のメモリアプローチを実験しており、基盤モデルも毎週のように強力になっている
- その過程で最適な方法に唯一の正解はなく、多様な試みと実験が続いている
最近のアップデート: Claudeへの自動メモリ機能導入
この記事が掲載された日、Anthropicは**Claudeのチーム/エンタープライズアカウント向け自動メモリ機能** を発表した
- この機能はChatGPT方式に似ており、作業コンテキスト、業務パターン、プロジェクトごとの情報をもとに自動でメモリ要約を構築する
- Claudeの各プロジェクトごとに独立したメモリが生成され、ユーザーはClaudeが記憶している内容を確認・編集できる
- 筆者の個人Pro Maxサブスクリプションにはまだこの機能が導入されておらず、機能評価前の段階
- 今後は既存の検索ベースのメモリとの比較や、ChatGPTとの違いについて追加レビューを行う予定
2件のコメント
Hacker Newsの意見
実装の違いは、結局のところビジネス目標に由来している
ChatGPTは明らかに広告とアフィリエイトリンクによる収益化を目指しており、メモリ実装もユーザープロファイルの作成に重点を置いている
一方でClaudeのメモリ実装は、過去の相互作用と抽象化へのアクセスという長期的な目標により近い
人間の記憶の扱い方に似た形で会話を検索できるように設計されており、将来的には強化学習を通じて、ユーザーが指摘したミスを記憶したり、過去の会話から抽象化を導き出して能動的に作業を処理したりもできるようになるのではないかと思う
結局、ChatGPTはユーザーそのものを記憶しようとしているのに対し、Claudeは個々の相互作用の履歴に集中している
言っていることと実際の行動が一致していない部分があるように感じる
b、c、fのような一部のトピックでは、OpenAIはインタースティシャル広告(全画面、30秒以上)で収益化できる
これは単にトピックを分析するだけで可能だ
もしOpenAIがチャットやコーディングのセッションを1000件ほど分析して、ユーザーを特定の企業に就職させたり、別の企業で車を買わせたりすることで収益を最大化できるなら、その過程でインタースティシャル広告だけでなく、応答の質や内容まで調整できるかもしれない
こうした点は十分に現実的でありながら、ディストピア的でもある
一方、DeepSeekが広告なしで運営されるなら、クローズドソースLLMが市場シェアを獲得するための基準ははるかに高くなるだろう
結局LLMは、あらゆる商品と同じように、ユーザーが品質に応じて対価を支払うものになり、それぞれ異なるレベルの品質を求めるようになる
広告はAIの回答の信頼性を損なう可能性があるため、全画面広告が最も現実的な帰結だと思う
ChatGPTはSNSではないので、同じやり方で収益化する必要はない
サブスクリプション、エンタープライズ、ビジネス、APIなどで、すでに十分な収益を上げている
ChatGPTのメモリ実装に関する分析記事のリンクが誤っていることを指摘し、正しいリンクを共有している
ChatGPTのメモリ実装方式が気になっていたが、Claudeとはまったく異なるアプローチを見ると非常に興味深い
Claudeの方式は技術的課題の解決により適しているように見え、ChatGPTは日常会話や広告統合に有利そうに見える
いずれこのような言語ベースのメモリ方式は時代遅れになり、誰かが言語表現を超えるエンコードされた記憶の保存・検索方式を見つけるだろう
それがAGIに至る最後のブレークスルーになるのかもしれない
現在のLLMは概念を理解しておらず、実際には「理解」という機能を持たず、本質的には高度化されたマルコフ連鎖にすぎない
本物のインテリジェンスこそがAGIの前提条件だと思う
ChatGPTのメモリは、エンティティごとの要約である本来のMemoryだけを文脈に入れられるようにしているようだ
そして、過去の会話要約やEmbedding方式も、エンコード方式のメモリ保存と見なせるのではないかという意見を述べている
どうやってAGIが命令に従うようにできるのかという懸念がある
Claudeのメモリ実装には満足しているが、ChatGPTのメモリはオフにしていると述べている
ChatGPTはあまりにも多様な用途に使っているため、つながっていない内容を無理に結びつけようとするのが不自然だったからだ
パーソナライズと必要な情報の参照を求めている
たとえばあるプロジェクトの情報を記憶させておけば、その後は毎回コンテキストを説明する必要がなくなり、生活の質が大きく向上する
ただし、自分で直接コントロールできないバックグラウンドでの会話メモリ生成方式はあまり好きではない
ChatGPTは望まない古い会話内容が不要に混ざってきて無駄だ
語学学習目的でさまざまなAIチューターを使ってみたが、ChatGPTが最も良かった
しかし「ゆっくり話して」と何度も繰り返しお願いしなければならず、このルールを会話全体に適用してくれと言ってもできなかった
このほかにも、記憶がきちんと機能していない部分がある
近いうちにChatGPTのメモリ方式は変わるだろう
参考リンク: X.com - メモリ変更の知らせ, Anthropic公式発表
ChatGPTのメモリとチャット履歴について、自分で記事を書いた経験を共有している
直接情報をダンプするプロンプトも含まれている
関連リンク
常に正確な入力コントロールを求めているので、メモリは完全にオフにしている
すべてのシステムプロンプトやトレーニングなどを取り除き、自分が直接書いたプロンプトだけを使いたい
ChatGPTに直接質問して明らかにした情報が信頼できるのか、それとも生成的幻覚(hallucination)なのか疑問だ
LLMが自分自身の仕組みを知っている理由はなく、そのような学習資料を与えられているとも思えない
なぜなら、その種のツール情報はシステムプロンプトに非常に詳しく書かれているからだ
Claudeは、原本の会話履歴だけを参照して記憶を呼び出すという
AIが生成した要約や圧縮プロファイルはなく、実際の過去会話だけをリアルタイム検索する
要約、プロファイル、知識グラフなどがないのは、高度な機能ではなく、うまく動作していないことを意味する
たとえば「Chandni Chowk」のような具体的なものは記憶できるかもしれないが、「問題があった私の同僚」のような曖昧な表現はうまく見つけられない
外部メモリストアをツールコーリングやMCP経由で使う場合の障害が何なのかを尋ねている
RLによってメモリ使用パターンを強化しているのか気にしている
データプライバシーの観点では、推論時にLLMがどうせ情報を知ることになるとしても、直接入力したくはない
例: "関心事: MacOS, bondage, discipline, Baseball"
当時のClaudeは、プロンプトで何度も誘導してもメモリを自発的に活用しようとしなかった
毎回、明示的に記憶の確認や保存を指示しなければならず、実用性が低かった
関連リポジトリ
この記事を見て混乱した
著者が、メモリがオフの状態でもプロンプトが挿入されると考えているのかが明確ではない
自分の場合、メモリをオフにしている状態では、最近の会話や好みの情報が挿入されるメタデータはまったくなく、完全に独立した会話のままになっている
実験中にメモリのオン・オフを行き来していたことが混乱の原因だったのか、それとも自分が記事をきちんと読めていないのかは分からない
突然、すべての句点が消えました