41 ポイント 投稿者 xguru 2025-09-24 | 1件のコメント | WhatsAppで共有
  • Webサイトを高速かつ軽量に Markdown と llms.txt 形式へ変換し、AI が検索可能な LLM コンテキスト生成 を支援するツール
  • 従来の HTML→Markdown 変換器は LLM 向けではないため、トークン消費が多く、速度も遅い
  • mdream コアLLM に最適化された HTML→Markdown 変換器で、約 50% 少ないトークンで最適化された出力を生成し、1.4MB の HTML を約 50ms で超高速変換 可能
    • 5kB gzip サイズのライブラリで、外部依存なし
  • @mdream/crawl パッケージでサイト全体をクロールし、llms.txt、llms-full.txt、個別 Markdown ファイルを生成して、Claude Code のような AI ツールと連携可能
  • CLI、Docker、GitHub Actions、Vite、Nuxt など、さまざまな環境で実行可能
  • プラグインシステムにより、パイプラインフックを通じてコンテンツのフィルタリング、ノード変換、カスタム動作などを追加可能
    • extractionPlugin: CSS セレクターを使って特定の要素を抽出し、データ分析に活用
    • filterPlugin: CSS セレクターまたはタグ ID を基準に要素の包含/除外が可能
    • frontmatterPlugin: HTML head 情報(title、meta など)から YAML frontmatter を生成
    • isolateMainPlugin: <main> 要素や header〜footer の範囲から主要コンテンツのみを抽出
    • tailwindPlugin: Tailwind CSS クラスを Markdown 書式(太字、斜体など)に変換
    • readabilityPlugin: コンテンツの可読性をスコア化して抽出(実験的機能)

1件のコメント

 
tensun 2025-09-24

試してみましたが、エラーが出て正常に動作しません。いったん issue に投稿しました。