Scraperr - セルフホスティング型Webスクレーパー
(github.com/jaypyles)- コードを書かずにWebサイトを収集・抽出できる セルフホスティング型Webスクレイピングソリューション
- ブラウザベースのUIでジョブを作成・管理できる ノーコードワークフロー を提供
- XPathベースの抽出 によりページ要素を精密にターゲティングし、キュー管理 と ドメインスパイダリング で同一ドメイン内の全ページのスクレイピングをサポート
- スクレイピングリクエストに JSONヘッダーの追加 が可能で、画像・動画などのメディア自動ダウンロード、構造化されたテーブル形式での スクレイピングデータの可視化 をサポート
- Markdown/CSVエクスポート をサポートし、さまざまなチャネルを通じて完了通知を送信
- Docker および Helmデプロイ により、ローカル・クラスター環境で素早く起動可能
まだコメントはありません。