Claude Skillsはすごい、MCPよりも大きな革新かもしれない

(simonwillison.net)

52 ポイント投稿者 GN⁺ 2025-10-18 | 12件のコメント | WhatsAppで共有

Anthropicが発表した Claude Skills は、モデルが特定の作業を行う際に必要な指示、スクリプト、リソースをフォルダ形式で提供する新しいパターンで、作業ごとの専門性を動的にロードする方式
SkillsはMarkdownファイルとオプションのスクリプトで構成され、セッション開始時には各スキルのメタデータだけを 数十トークン で読み込み、実際に必要なときだけ全文を読み込むため、トークン効率 が非常に高い
Claude Codeを通じて、Skillsは単なるコーディングツールを超えて 汎用自動化エージェント へと拡張され、ファイルシステムとコマンド実行環境さえあれば多様な作業の自動化が可能
MCPとは異なり、Skillsはプロトコルではなく MarkdownとYAMLベースの単純な構造 で、他のモデルやツールでもすぐに活用でき、共有と普及が容易
このシンプルさと効率性により、Skillsは MCPよりはるかに速いペースでエコシステムが拡大 すると予想され、データジャーナリズムからブランドガイドラインまで多様な分野で専門化されたエージェントを構築可能（MCPのトークン消費問題と複雑な仕様を避けられる）

Skillsの概念と構造

Anthropicが2025年10月16日に Claude Skills を正式発表
- モデルが特定の作業（例: Excel作業、組織のブランドガイドライン順守）を行う際に必要な指示、スクリプト、リソースを収めた フォルダ単位の能力拡張システム
- Claudeは作業と関連があるときにだけそのスキルへアクセスし、専門化された作業遂行能力を高める
anthropic/skills のGitHubリポジトリで公式スキル例を提供
Skillsは概念的にきわめてシンプル
- 中核は、モデルに作業のやり方を伝える Markdownファイル
- オプションで追加ドキュメントや事前作成済みスクリプトを含め、作業完了を支援
9月に発表されたClaudeの文書生成機能は、実際には Skillsで完全に実装 されていた
- .pdf, .docx, .xlsx, .pptx ファイル処理スキルは公開リポジトリで確認できる

トークン効率性: Skillsの中核的な利点

セッション開始時、Claudeは利用可能なすべてのスキルファイルをスキャンし、各スキルの frontmatter YAMLの短い説明だけ を読む
各スキルが占める初期トークンは 数十個にすぎず、きわめて効率的
ユーザーがスキルが役立ちそうな作業を依頼したときにだけ、全文の詳細が読み込まれる
これは単にディスクにファイルを保存するだけではなく、機能として成立させる中核的な差別化要因 でもある

Slack GIF生成スキルの実践例

slack-gif-creatorスキルのメタデータ説明
- Slack向けに最適化されたアニメーションGIF生成ツールキット
- サイズ制約バリデーターと、組み合わせ可能なアニメーション基本要素を含む
- 「XがYをするSlack用GIFを作って」のような依頼に適用
実際のテスト過程
- ClaudeモバイルWebアプリでSonnet 4.5モデルにslack-gif-creatorスキルを有効化
- Make me a gif for slack about how Skills are way cooler than MCPs というプロンプトを入力
- Claudeが自動でGIFを生成（品質には改善の余地があるが、スキルは反復的に改良しやすい）
生成されたPythonスクリプトの注目点
- スキルディレクトリをPythonパスに追加: sys.path.insert(0, '/mnt/skills/examples/slack-gif-creator')
- スキルの core/ ディレクトリ内にある GIFBuilder クラスを活用
- ファイルを /mnt/user-data/outputs/ に保存
- Slackのサイズ制限（2MB）を検証する関数 check_slack_size() を使って仕様順守を確認
- サイズを超えた場合、モデルが自動でより小さいファイルの再生成を試みられる

Skillsの環境依存性

Skillsの仕組みは、モデルが次のものにアクセスできてはじめて 完全に機能する
- ファイルシステム
- ファイルシステム探索ツール
- 環境内でコマンドを実行する能力
これはLLMツーリングにおける一般的なパターン
- ChatGPT Code Interpreterが 2023年初頭の最初の大規模事例
- その後、Cursor、Claude Code、Codex CLI、Gemini CLIのようなコーディングエージェントツールによってローカルマシンへまで拡大
この要件は、MCPやChatGPT Pluginsなど過去のLLM能力拡張の試みとの 最大の違い でもある
重要な依存関係ではあるが、解放される新しい能力の規模 は驚くほど大きい
安全性の問題は依然として重要
- 安全な コーディング環境の提供が必要
- プロンプトインジェクションのような攻撃による被害を許容可能な水準に抑えられる サンドボックス 環境の構築方法が必要

Claude Code: 汎用エージェントへの進化

2025年1月、筆者は「エージェント」は失敗すると予想していたが、完全に外れた
- 2025年は実際に「エージェント」の年となった（定義はいろいろあるが、「tools in a loop」と定義）
Claude Codeという名前は適切ではない
- 純粋なコーディングツールではなく、汎用コンピュータ自動化ツール である
- コンピュータにコマンドを入力して達成できる あらゆる作業 を自動化できる
- 汎用エージェント（general agent） と説明するのがもっとも適切
Skillsはこの可能性をさらに明確かつ明示的にする
応用可能性は目が回るほど広い
- データジャーナリズムの例: 次の作業を扱うスキルフォルダを構成できる
  - 米国国勢調査データの出典と構造の理解
  - さまざまな形式のデータをPythonライブラリでSQLite/DuckDBに読み込む
  - S3上のParquetファイルやDatasette Cloudテーブルとしてデータをオンライン公開
  - 新しいデータセットから興味深いストーリーを見つける方法（経験豊富なデータ記者の指針）
  - D3を使った、整っていて読みやすいデータ可視化の構築
- 結果: MarkdownファイルといくつかのPythonスクリプト例だけで、米国国勢調査データからストーリーを見つけて公開する 「データジャーナリズムエージェント」 を構築できる

Skills vs MCP 比較

Model Context Protocol（MCP） は2024年11月の公開以来、非常に大きな注目を集めた
- あらゆる企業が「AI戦略」を必要としており、MCP実装の発表はその需要を満たす手軽な方法だった
MCPの限界が徐々に明らかになってきた
- もっとも重要な問題はトークン使用量
- GitHubの公式MCPは、それ単体で数万コンテキストトークンを消費する
- さらにいくつか追加すると、LLMが実際に有用な作業を行う余地がほとんど残らない
コーディングエージェントを本格的に扱い始めて以降、筆者のMCPへの関心は低下した
- MCPで達成できるほぼすべてのことは CLIツールで置き換え可能
- LLMは cli-tool --help の呼び出し方を知っているため、使い方の説明に大量のトークンを費やす必要がない
- モデルが必要なときに自分で把握できる
Skillsはまったく同じ利点を持ち、さらに新しいCLIツールを実装する必要すらない
- 作業のやり方を説明するMarkdownファイルを置くだけ
- 安定性や効率性の向上に役立つ場合にのみ追加スクリプトを含めればよい

Skillsエコシステムの爆発的成長予測

Skillsのもっとも興味深い点の1つは 共有のしやすさ
- 多くのスキルは単一ファイルで実装されると予想される
- より高度なスキルは、いくつかのファイルを含むフォルダ形式になる
Anthropic提供資料
- Agent Skillsドキュメント
- Claude Skills Cookbook
筆者も Datasetteプラグインのビルド方法のようなスキル案を構想中
他のモデルでも利用可能: これもSkills設計の利点
- スキルフォルダをCodex CLIやGemini CLIに接続し、「pdf/SKILL.mdを読んで、このプロジェクトを説明するPDFを作って」と指示すれば動作する
- そのツールやモデルにスキルシステムへの組み込み知識がなくても可能
予想: 今年のMCPラッシュがかすんで見えるほどの Skillsのカンブリア爆発 が起きる

シンプルさこそが中核的な強み

一部では、Skillsは単純すぎて機能と呼べないという反発もある
- 多くの人が、Markdownファイルに追加指示を書いてコーディングエージェントに読ませるトリックをすでに試している
- AGENTS.md は確立されたパターンであり、「PDF生成前にPDF.mdを読め」という指示も含められる
Skills設計の中核にあるシンプルさこそ、筆者が興奮している理由
MCPは完全なプロトコル仕様を持つ
- ホスト、クライアント、サーバー、リソース、プロンプト、ツール、サンプリング、ルート、elicitation
- 3つの転送方式（stdio、streamable HTTP、もともとはSSE）も含む
SkillsはMarkdown + 少量のYAMLメタデータ + オプションの実行スクリプト
- LLMの精神にずっと近い: テキストを渡し、あとはモデルに処理させる
Skillsは難しい部分を LLMハーネスと関連するコンピュータ環境にアウトソース している
- 過去数年間にLLMのツール実行能力について学んだすべてを踏まえると、非常に賢明な戦略といえる

12件のコメント

shakespeares 2025-10-19

コーディングで Claude Code を使うときにも応用できる部分なのかなと思います。
今も Claude.md にガイドを入れておいて、詳細ガイドはそれぞれ分けて進めています。

labeldock 2025-10-19

少ないトークンで多くの作業を行うには、プロンプト最適化よりもマルチエージェントや要約を活用する方法で、もっと簡単に解決できそうに思います。問題点には同感ですが、解決方法には限界があるように感じます。

savvykang 2025-10-18

Skillsもトークンを使うのではありませんか？もしそうなら、トークン使用量の問題がまた発生しそうですが、そのときどう対応するのかよく分かりませんね

dnjstmxhs 2025-10-19

コンテキストにはSKILLS.md全体ではなく、ひとまず冒頭の以下のような名前と説明の部分だけが常に入るように見えました。

name: skill-creator
description: 効果的なskillsを作成するためのガイド。このskillは、専門知識、ワークフロー、またはツール統合によってClaudeの機能を拡張する新しいskillを作成したい（または既存のskillを更新したい）場合に使用する必要があります。
license: Complete terms in LICENSE.txt

ds2ilz 2025-10-18

Claude Codeで作業していると、指示や規則をコンテキストに繰り返し食わせることになって、結局はトークン使用量とコンテキストの間で悩むことになるんですよね。そこで思いついたのが、フォルダを作って詳細はそこに機能別のmdとして詳しく書き込み、claude.mdには何をするには何を見ればいいかというポインタだけを大量に入れておく方式だったのですが、かなり安くうまく動きました。skillsは結局こういうものをまとめたものなので、かなり使い勝手がよさそうですね

laeyoung 2025-10-19

発表どおりにSkills Marketplaceも出てくれば、必要なskillだけ受け取って必要なときにenableしておけるので、それなりに良さそうだと思いました

shakespeares 2025-10-19

おお、重要な説明ありがとうございます。

2025-10-18

[このコメントは非表示になっています。]