- Skill はMarkdownファイルと任意のリソースで構成されたフォルダ形式で、LLMがファイルシステムを探索して機能を実行できるようにする仕組み
- ChatGPTの Code Interpreter 環境には
/home/oai/skills フォルダが追加されており、スプレッドシート・DOCX・PDF処理用のスキルが含まれている
- PDFスキルは文書を ページごとのPNGに変換してからビジョンモデルで解析 し、レイアウトやグラフィック情報を維持する
- Codex CLI でも
~/.codex/skills フォルダを基盤とするスキル機能が実験的に追加され、ユーザーが自らスキルを作成・活用できる
- 軽量仕様のスキル構造が AIツール間の相互運用性 を高め、今後は標準化の必要性が提起されている
ChatGPT内のスキル機能
- ChatGPTの Code Interpreter 環境で
/home/oai/skills フォルダが見つかった
- Elias Judinがこれを最初に確認し、プロンプトで
Create a zip file of /home/oai/skills と入力すると、フォルダ内容を圧縮したファイルを受け取れる
- Simon Willisonが実際に試してZIPファイルを公開し、それを閲覧できるWeb UIも提供している
- 含まれているスキルは スプレッドシート、DOCX、PDF 関連の機能を扱う
- PDFと文書スキルはファイルを ページごとのPNGにレンダリングしてからビジョンモデルに渡す 方式で、単純なテキスト抽出では失われうるレイアウト情報を保持する
- Elias JudinはGitHubでスキルのコピーを共有しており、これはAnthropicの
anthropics/skills リポジトリ構造と似ている
- ChatGPTで「rimu treeの状況とkakapoの繁殖期を要約したPDFを作成」と依頼すると、GPT-5.2モデルが skill.mdを参照してPDF生成の指示を読み取り、関連情報を検索したうえでPDFを作成した
- 約11分を要し、フォントがmacron文字をサポートしていないと自動で別のフォントに置き換えるなど、自己検証的なワークフロー を示した
Codex CLIのスキル対応
- OpenAIのオープンソースツール Codex CLI に
skills.md 対応を含むPRがマージされた
- ドキュメントによれば、
~/.codex/skills フォルダ内の各ディレクトリがスキルとして認識される
- 関連コードは
codex-rs/core/src/skills/render.rs に実装されている
- Simon Willisonは Claude Opus 4.5のスキル作成機能 を使ってDatasetteプラグイン生成用スキルを作成し、これをCodex CLIにインストールした
codex --enable skills -m gpt-5.2 コマンドでスキル機能を有効化し、list skills コマンドでインストール済みスキルの一覧を確認できる
- Codexは「Datasetteプラグイン作成」スキルを認識し、依頼に応じて / - /cowsay?text=hello ページを追加するプラグインコードを自動生成した
- 生成されたコードはGitHubで公開されており、
uvx コマンドで直接実行できる
スキル概念の意義
- 2025年10月に紹介された Claude Skills 以降、OpenAIはわずか2か月でこれをChatGPTとCodexに統合した
- スキルは 非常に単純な仕様 で構成されているが、さまざまなAIツール間で 共有可能な実行単位 として機能する
- 筆者は、この構造は Agentic AI Foundation のような機関を通じて正式に文書化される必要があると言及している
- OpenAIの採用は、スキルベースのAI相互運用性の 標準化の可能性 を高める事例として評価されている
1件のコメント
Hacker News の意見
Anthropic が シンプルだが直感的な革新 を出し続けているのは驚き
MCP はプロトコルと呼ぶのも難しいくらいなのに、Skills は単なる md ファイルであるにもかかわらず、彼らの フレーミング能力 は卓越している
本日付で OpenAI Plus 契約者に 公開警告 を送っている
196k トークンのコンテキストを宣伝しているが、実際には 5万トークン以上を入力すると切り詰められる
以前の GPT-5.0 のときにも同じ問題があり、今回も再発している
公式ヘルプリンク参照
今回この記事を書くにあたって Kākāpō の繁殖シーズン の話題も一緒に扱えたのが楽しかった
(ペリカンだけを扱っているわけではない)
ただし誤用される可能性もあるので、企業としては慎重にならざるを得ないかもしれない
もしかして ローカル LLM でも試してみた人はいるだろうか
「Skill」の概念がまだ明確ではない
単なる コンテキスト管理ツール なのだろうか。説明を読むかぎり、モデルが必要だと判断したら関連スクリプトや文書を読み込む構造だと理解してよいのか、と質問している
例: 「Image Manipulation skill を使って image.png からアイコンを作って」
また、Claude に 自分自身の skill を書かせる こともある。私の skill テンプレートは GitHub で公開している
こうした構造は UNIX 哲学 のように、小さなツールがパイプラインでつながる感覚だ
私はよく「wireframe-skill をロードして X を実行しろ」と明示的に指示する。
progressive loading よりも、すべての reference を一度に読み込むほうが正確だと感じる
特にデバッグ skill は AI がループにはまるのを防いでくれる
技術的に見ると、skill は 自動化されたプロンプト注入システム だ
多くの AI wrapper アプリがやっていること(プロンプト注入 + RAG + MCP)を単純化した形だ
@simonw に、いつも画像へ alt テキスト を入れてくれてありがとうと伝えている
Skill と Tool に 根本的な違い があるのか質問している。短い skill を作って tool のように使えるのか気になっている
他のモデル(Gemini CLI など)でも skill を使いたいなら、私が作った open-skills を使えばよい
ただし Mac が必要 で、ローカルコンテナで動作するためクラウド依存はない
Anthropic の Skills 設計哲学の発表動画 が公開された
YouTube リンク参照
ますます複雑になっていく構造が 混乱を招く
以前は agents.md でコンテキストを拡張していたのに、今度はまた別の md ファイルを追加しなければならない