Claudeの新しいCode Interpreterレビュー、非常に紛らわしい名前で公開

(simonwillison.net)

7 ポイント投稿者 GN⁺ 2025-09-10 | まだコメントはありません。 | WhatsAppで共有

Anthropicの**「Upgraded file creation and analysis」**機能を実際に使ってみた結果に基づき、コード実行型の分析ツールとしての性格を検証する Simon Willison によるレビュー
この新機能はサーバーサイドのコンテナでPython・Node.jsコードを実行し、ファイルの作成・編集をサポートしており、従来の**ブラウザ内JSベースの「Analysis tool」**とは実装がまったく異なる
コンテナはUbuntu 24.04.2、Python 3.12.3、Node v18.19.1、約9GB RAM/5GBディスクを提供し、EnvoyプロキシベースのネットワークホワイトリストおよびPyPIパッケージのインストール許可という特徴を持つ
実際のテストとしてSQLiteスキーマ図のPDF生成、ApolloのAI導入率チャートの再現を行い、プロンプト設計と可視化補正を通じて結果の品質を高められることを示した
部分的なインターネットアクセスはプロンプトインジェクションやデータ流出のリスクを内包するためユーザーモニタリングが必要であり、同時に機能の命名・説明の失敗が業界全体の課題として残っている

機能概要

AnthropicはClaudeがファイルの作成および編集機能をサポートすると発表
- Excelスプレッドシート、Word文書、PowerPointスライド、PDFを Claude.ai およびデスクトップアプリで生成
- ユーザーはデータをアップロードするか要件を説明するだけで、すぐに使えるファイルを取得できる
Max、Team、Enterpriseプラン向けのプレビューで、Proプランは数週間以内に対応予定
主な機能:
- データ分析: 生データを整形し、統計分析、チャート、主要なインサイトを提供
- スプレッドシート作成: 財務モデル、プロジェクトトラッカー、予算テンプレートなどを数式付きで生成
- クロスフォーマット作業: PDFをPowerPointに変換したり、会議メモを文書に整理したりできる
著者のSimon WillisonはこれをChatGPT Code Interpreterに対応する機能と位置づけ、公式名称である**「Upgraded file creation and analysis」を不適切なネーミング**だと評価
以前の機能との違い
- 2024年10月のAnalysis tool: ユーザーのブラウザでJSを実行する方式の軽量分析ツールだった
- 2025年9月の新機能: サーバーサイドのコンテナでシェルコマンド・Python・Node.jsを実行し、ファイルの読み取り・生成を行う本格的なコードインタープリターである
- 同社APIのCode execution toolと似ているが、エンドユーザーが任意のコードをサーバーコンテナ上で実行するのは今回が初めて

新しいCode Interpreterの特徴

ClaudeのCode InterpreterはChatGPT Code Interpreterに近い
PyPIからPythonパッケージをインストール可能（例: pip install sqlite-utils）
- Node.js v18.19.1がプリインストールされており、npmのグローバルパッケージも利用できる
環境の詳細:
- OS: Ubuntu 24.04.2 LTS、Linuxカーネル 4.4.0
- アーキテクチャ: x86_64、シェル: GNU Bash 5.2.21
- Python: 3.12.3、pip: 24.0
- ディスク: 4.9GB（使用可能 4.6GB）、RAM: 9.0GB
制約: ファイルのアップロード/ダウンロードは30MBまでで、ChatGPTの512MBと比べると容量は限定的
- インターネットアクセス: Envoyプロキシ配下で厳格なホワイトリストが適用される
- 一般的なサイト（例: google.com）へのcurlは403 Forbiddenエラーになる
- 許可ドメイン: api.anthropic.com、github.com、registry.npmjs.org / npmjs.com、pypi.org / files.pythonhosted.orgなど、パッケージ管理・バージョン管理中心のホワイトリストになっている
- pip install sqlite-utilsのようにPyPIパッケージのインストールが可能で、Nodeランタイムもすぐ利用できる
- web_fetch、web_searchコンテナ経由で限定的なWebコンテンツアクセスが可能

設定と使い方

有効化: claude.ai/settings/features でUpgraded file creation and analysisのトグルを有効にする
- Analysis Toolとは同時に有効化できず、混乱防止が目的
簡単な課題: SQLite → 結合ダイアグラムPDF
- 入力: **TILサイトのSQLite DB（約21.9MB）**をアップロードし、テーブル結合ダイアグラムのPDF生成を指示
- 結果: PDF/PNGの生成に成功し、線の接続の見やすさにはやや難があったものの、プロンプトの補強で改善できる可能性を確認
- 意味: アップロードしたDBファイルをPythonで分析し、画像/PDFを生成する標準的なCode Interpreterワークフローがスムーズに動作した
難易度の高い課題: AI導入率チャートの再現
- 課題: スクリーンショット + XLSXを入力として、元の図に近い時系列ラインチャートの再現を指示
- 過程:
  - 初回結果では直線接続・ラベルの重なりなどの視覚的な粗さがあった
  - 6回分の調査移動平均を適用するよう指示してトレンドラインを改善
  - 「直線ではなく曲線補間」という要求を明示して滑らかな曲線でレンダリングさせ、タイトルの重なりは追加指示で補正
- 示唆: モデルに優しいプロンプトと可視化パラメータの調整を併用すれば、ChatGPTに近い生産性を確保できる

セキュリティとプロンプト注入リスク

インターネットアクセスによりプロンプトインジェクション攻撃のリスクが存在
- 悪意ある命令がファイルやWebサイトを通じて挿入される可能性がある
- 例: 信頼していないコードの実行、機密データの流出
Anthropicはレッドチーミングおよびセキュリティテストを実施し、ユーザーモニタリングを推奨
- GitHubが許可されていることで、データ流出ベクトルが増える懸念がある
推奨事項: 機密データを使う際は注意し、想定外のデータアクセスがあれば直ちに中断すること

使い勝手・品質評価

Claude Code InterpreterはChatGPT Code Interpreterを上回る機能を提供している
利点
- PyPIインストール許可 + Node対応によりツールエコシステムの拡張性が高い
- ファイル生成・変換・可視化まで対話型パイプラインとして一度に実行できる
限界
- 30MBのファイル制限は大規模データセットやDBアップロードの制約になる
- 特定の可視化では微調整のために追加のプロンプト反復が必要になる場合がある
価値: Code InterpreterはLLMの最も有用な機能の1つであり、Claudeのアップグレードによって期待が高まる

命名・コミュニケーションの難題

Anthropic: 過去のAnalysis toolという名称に続き、「Upgraded file creation and analysis」というさらに紛らわしい名前を採用し、コード実行能力をリリース文書の中に埋もれさせている
OpenAI: Code Interpreter ↔ Advanced Data Analysisの間で名称が揺れた事例があり、公式ランディングページの視認性も低い
結論: コード実行型のファイル生成・分析という中核的価値の伝達に業界は一貫して失敗しており、ユーザーの理解と信頼形成のために用語とガイドの改善が必要である

Claudeの新しいCode Interpreterレビュー、非常に紛らわしい名前で公開

機能概要

新しいCode Interpreterの特徴

設定と使い方

簡単な課題: SQLite → 結合ダイアグラムPDF

難易度の高い課題: AI導入率チャートの再現

セキュリティとプロンプト注入リスク

使い勝手・品質評価

命名・コミュニケーションの難題

関連記事

まだコメントはありません。