warc-parquet - WARCをParquetに変換するCLI (github.com/maxcountryman) 8 ポイント 投稿者 xguru 2022-06-30 | 1件のコメント | WhatsAppで共有 Web ARChive(.warc)ファイルをカラム指向のApache Parquetフォーマットに変換 DuckDBにParquetを読み込んで手軽にクエリ可能 Rustオープンソース 関連記事 WarcDB - WebクロールデータをSQLite DBとして扱う 14 ポイント · 0件のコメント · 2022-06-22 Carquet - Parquetファイルを読み書きするための高性能な純粋Cライブラリ 9 ポイント · 0件のコメント · 2026-01-17 dir2md v1.0.4 — オープンソースのコードベースをLLMフレンドリーなMarkdownに変換するCLI、大規模アップデート 8 ポイント · 0件のコメント · 2025-10-10 Broot - 複雑なディレクトリツリーをナビゲーションする新しいCLIツール 7 ポイント · 3件のコメント · 2020-01-10 DuckLake - 統合データレイクおよびカタログフォーマット 13 ポイント · 1件のコメント · 2025-05-29 1件のコメント xguru 2022-06-30 DuckDB - Embedded OLAP DBオープンソース 少し前に投稿された WarcDB - Web crawl data as SQLite DB と似ていますね。 ただ、Parquet を利用するインフラがすでにある環境では、こちらのほうが使いやすそうです
1件のコメント
DuckDB - Embedded OLAP DBオープンソース
少し前に投稿された WarcDB - Web crawl data as SQLite DB と似ていますね。
ただ、Parquet を利用するインフラがすでにある環境では、こちらのほうが使いやすそうです