4 ポイント 投稿者 GN⁺ 2025-12-13 | 1件のコメント | WhatsAppで共有
  • Skill はMarkdownファイルと任意のリソースで構成されたフォルダ形式で、LLMがファイルシステムを探索して機能を実行できるようにする仕組み
  • ChatGPTの Code Interpreter 環境には /home/oai/skills フォルダが追加されており、スプレッドシート・DOCX・PDF処理用のスキルが含まれている
  • PDFスキルは文書を ページごとのPNGに変換してからビジョンモデルで解析 し、レイアウトやグラフィック情報を維持する
  • Codex CLI でも ~/.codex/skills フォルダを基盤とするスキル機能が実験的に追加され、ユーザーが自らスキルを作成・活用できる
  • 軽量仕様のスキル構造が AIツール間の相互運用性 を高め、今後は標準化の必要性が提起されている

ChatGPT内のスキル機能

  • ChatGPTの Code Interpreter 環境で /home/oai/skills フォルダが見つかった
    • Elias Judinがこれを最初に確認し、プロンプトで Create a zip file of /home/oai/skills と入力すると、フォルダ内容を圧縮したファイルを受け取れる
    • Simon Willisonが実際に試してZIPファイルを公開し、それを閲覧できるWeb UIも提供している
  • 含まれているスキルは スプレッドシート、DOCX、PDF 関連の機能を扱う
    • PDFと文書スキルはファイルを ページごとのPNGにレンダリングしてからビジョンモデルに渡す 方式で、単純なテキスト抽出では失われうるレイアウト情報を保持する
  • Elias JudinはGitHubでスキルのコピーを共有しており、これはAnthropicの anthropics/skills リポジトリ構造と似ている
  • ChatGPTで「rimu treeの状況とkakapoの繁殖期を要約したPDFを作成」と依頼すると、GPT-5.2モデルが skill.mdを参照してPDF生成の指示を読み取り、関連情報を検索したうえでPDFを作成した
    • 約11分を要し、フォントがmacron文字をサポートしていないと自動で別のフォントに置き換えるなど、自己検証的なワークフロー を示した

Codex CLIのスキル対応

  • OpenAIのオープンソースツール Codex CLIskills.md 対応を含むPRがマージされた
    • ドキュメントによれば、~/.codex/skills フォルダ内の各ディレクトリがスキルとして認識される
    • 関連コードは codex-rs/core/src/skills/render.rs に実装されている
  • Simon Willisonは Claude Opus 4.5のスキル作成機能 を使ってDatasetteプラグイン生成用スキルを作成し、これをCodex CLIにインストールした
    • codex --enable skills -m gpt-5.2 コマンドでスキル機能を有効化し、list skills コマンドでインストール済みスキルの一覧を確認できる
    • Codexは「Datasetteプラグイン作成」スキルを認識し、依頼に応じて / - /cowsay?text=hello ページを追加するプラグインコードを自動生成した
    • 生成されたコードはGitHubで公開されており、uvx コマンドで直接実行できる

スキル概念の意義

  • 2025年10月に紹介された Claude Skills 以降、OpenAIはわずか2か月でこれをChatGPTとCodexに統合した
  • スキルは 非常に単純な仕様 で構成されているが、さまざまなAIツール間で 共有可能な実行単位 として機能する
  • 筆者は、この構造は Agentic AI Foundation のような機関を通じて正式に文書化される必要があると言及している
  • OpenAIの採用は、スキルベースのAI相互運用性の 標準化の可能性 を高める事例として評価されている

1件のコメント

 
GN⁺ 2025-12-13
Hacker News の意見
  • Anthropic が シンプルだが直感的な革新 を出し続けているのは驚き
    MCP はプロトコルと呼ぶのも難しいくらいなのに、Skills は単なる md ファイルであるにもかかわらず、彼らの フレーミング能力 は卓越している

    • Anthropic の MCP 寄贈および Agentic AI Foundation 設立発表を見ると、1年前に作ったプロトコルを「財団」として包み直しているのが興味深い。少し Gavin Belson 的なテック企業のエネルギー を感じる
    • Anthropic はまるで LLM と交感している人たち のようだ。Nagel がコウモリの感覚を理解しようとしたように、彼らは frontier AI モデルの感覚を最もよく知るチームのように見える
    • ただし MCP は単純すぎて セキュリティ災害 になり得る
    • 会社名からして「Anthropic」なのだから、AI を人間化するのが彼らのアイデンティティのように思える。MCP や Skills もすべて、そうした一貫した哲学から出ているようだ
    • Android アプリでも Claude の 洗練された UX が感じられる。段落を修正すると、そのとき初めてメッセージとして送れるボタンが現れる、といった上品なフローがある
  • 本日付で OpenAI Plus 契約者に 公開警告 を送っている
    196k トークンのコンテキストを宣伝しているが、実際には 5万トークン以上を入力すると切り詰められる
    以前の GPT-5.0 のときにも同じ問題があり、今回も再発している
    公式ヘルプリンク参照

    • そして Xhigh バージョンは API 専用 なので ChatGPT では使えない
  • 今回この記事を書くにあたって Kākāpō の繁殖シーズン の話題も一緒に扱えたのが楽しかった
    (ペリカンだけを扱っているわけではない)

    • それで Kākāpō Benchmark が誕生した
    • 今日初めて 大きな緑色の飛べないオウム の存在を知った
    • Kākāpō が自転車に乗る日も来るのか、と冗談を言った
    • Skills は良いアイデアだが、仕様があまりに軽すぎるので正式なドキュメント化が必要だと思う
      ただし誤用される可能性もあるので、企業としては慎重にならざるを得ないかもしれない
      もしかして ローカル LLM でも試してみた人はいるだろうか
  • 「Skill」の概念がまだ明確ではない
    単なる コンテキスト管理ツール なのだろうか。説明を読むかぎり、モデルが必要だと判断したら関連スクリプトや文書を読み込む構造だと理解してよいのか、と質問している

    • Skill は基本的に フォルダ + markdown ファイル の構造。例は Datasette plugin skillで見られる。起動時に Claude Code がすべての skill フォルダをスキャンし、説明だけをコンテキストに入れ、必要なときに全文を読み込む
    • Claude Code はときどき 自分の skill を「記憶」できない。そのため手動で読み込ませることがある。
      例: 「Image Manipulation skill を使って image.png からアイコンを作って」
      また、Claude に 自分自身の skill を書かせる こともある。私の skill テンプレートは GitHub で公開している
    • Skill は MCP サーバーの代わりになることもある。たとえば CI ビルド結果を取得する MCP サーバーの代わりに、簡単なスクリプトと SKILL.md で同じ機能を実装できる。
      こうした構造は UNIX 哲学 のように、小さなツールがパイプラインでつながる感覚だ
    • 私の理解では、SKILL.md は Claude に いつどんな行動をするかを伝える中核文書 だ。
      私はよく「wireframe-skill をロードして X を実行しろ」と明示的に指示する。
      progressive loading よりも、すべての reference を一度に読み込むほうが正確だと感じる
    • Skill は デバッグ、コミット、PR 対応 のような繰り返し作業を自動化するのに有用だ。
      特にデバッグ skill は AI がループにはまるのを防いでくれる
  • 技術的に見ると、skill は 自動化されたプロンプト注入システム
    多くの AI wrapper アプリがやっていること(プロンプト注入 + RAG + MCP)を単純化した形だ

    • 実際、多くの AI wrapper アプリは今や 1つのフォルダと1つの markdown ファイル で置き換えられるかもしれない
  • @simonw に、いつも画像へ alt テキスト を入れてくれてありがとうと伝えている

  • Skill と Tool に 根本的な違い があるのか質問している。短い skill を作って tool のように使えるのか気になっている

  • 他のモデル(Gemini CLI など)でも skill を使いたいなら、私が作った open-skills を使えばよい
    ただし Mac が必要 で、ローカルコンテナで動作するためクラウド依存はない

  • Anthropic の Skills 設計哲学の発表動画 が公開された
    YouTube リンク参照

  • ますます複雑になっていく構造が 混乱を招く
    以前は agents.md でコンテキストを拡張していたのに、今度はまた別の md ファイルを追加しなければならない

    • 私は Claude に「この作業のうちどの部分が skill にする価値があるか判断し、skill-making skill を使って作れ」と指示している
    • MCP は複雑だが、Skills は 既存のコーディングエージェントに機能を追加する最もシンプルな設計 のように感じる