- Webサイトを高速かつ軽量に Markdown と llms.txt 形式へ変換し、AI が検索可能な LLM コンテキスト生成 を支援するツール
- 従来の HTML→Markdown 変換器は LLM 向けではないため、トークン消費が多く、速度も遅い
mdream コアは LLM に最適化された HTML→Markdown 変換器で、約 50% 少ないトークンで最適化された出力を生成し、1.4MB の HTML を約 50ms で超高速変換 可能
- 5kB gzip サイズのライブラリで、外部依存なし
@mdream/crawl パッケージでサイト全体をクロールし、llms.txt、llms-full.txt、個別 Markdown ファイルを生成して、Claude Code のような AI ツールと連携可能
- CLI、Docker、GitHub Actions、Vite、Nuxt など、さまざまな環境で実行可能
- プラグインシステムにより、パイプラインフックを通じてコンテンツのフィルタリング、ノード変換、カスタム動作などを追加可能
- extractionPlugin: CSS セレクターを使って特定の要素を抽出し、データ分析に活用
- filterPlugin: CSS セレクターまたはタグ ID を基準に要素の包含/除外が可能
- frontmatterPlugin: HTML head 情報(title、meta など)から YAML frontmatter を生成
- isolateMainPlugin:
<main> 要素や header〜footer の範囲から主要コンテンツのみを抽出
- tailwindPlugin: Tailwind CSS クラスを Markdown 書式(太字、斜体など)に変換
- readabilityPlugin: コンテンツの可読性をスコア化して抽出(実験的機能)
1件のコメント
試してみましたが、エラーが出て正常に動作しません。いったん issue に投稿しました。