MCP YouTube Intelligence — YouTube動画をトークン効率よく分析するMCPサーバー
(github.com/JangHyuckYun)YouTube字幕をサーバー側で処理(要約/エンティティ/トピック/感情分析)し、
LLMクライアントには圧縮された結果だけを渡すMCPサーバーです。
作った理由:
既存のYouTube MCPサーバーを約80個調べてみましたが、どれも元の字幕を
そのままLLMに投げています。20分の動画1本で約15,000トークンが
消費されるところを、要約なら約200〜500トークン、全体レポートでも約3,000トークンまで
減らせます。
Claude skillsで使うことを想定し、CLIでも使えるようにしてあります。
主な機能:
- 構造化レポート(要約 + トピック + エンティティ + コメントをまとめて)
- 9個のMCP tool + CLI (
mcp-yt) - Ollama/vLLM連携による無料LLM要約
- チャンネルRSSモニタリング
- 日英エンティティ200件超の辞書
- SQLiteキャッシュ
pip install mcp-youtube-intelligence
Claude Desktop、Cursor、Claude Codeですぐに接続できます。
GitHub: https://github.com/JangHyuckYun/mcp-youtube-intelligence
PyPI: https://pypi.org/project/mcp-youtube-intelligence/
4件のコメント
トークン数を減らす一方で、何らかのトレードオフが発生しているはずだと思うのですが、その点については README では見つけられませんでした!
最近はデフォルトのコンテキストが 200k ですが、圧縮損失による品質劣化が気になります
こんにちは!
抽出型要約(LLMなし)は、原文に対して体感でだいたい6/10くらいの出来です。要点となる文は拾ってくれますが、文脈のつながりは弱めです。
LLM要約(Ollamaなど)はかなり良く、実際にいくつかの紹介動画や開発関連の動画でテストしてみたところ、内容把握には十分使えるように見えました。ただし、細かい数値や微妙なニュアンスが落ちることはあります。
200kコンテキストであれば、単一の動画、30分〜1時間程度のやや短めの動画なら原文のほうが良く、
数百本の動画をまとめて処理したり、繰り返し分析したりする場合には、トークン消費を抑えつつ要点だけを抽出できると思います。
(例:競合チャンネル全体の分析、経済系YouTuberの動画100本分析など)
READMEでも、もう少し多様な動画でテストして、ベンチマーク結果とトレードオフをより明確に追記しておきます!
ご丁寧なご回答を本当にありがとうございます!! このプロジェクトが実を結ぶことを願っています!!
(笑) はい、ありがとうございます!