11 ポイント 投稿者 GN⁺ 2024-12-16 | 3件のコメント | WhatsAppで共有
  • Buzee は Mac と Windows で使える全文検索アプリケーション
  • ユーザーがすべての文書、画像、音声、動画、フォルダ、およびブラウザ履歴を対象に高速な Full-Text 検索を行えるツール
  • キーワード、時間、種類、またはそれらの組み合わせでローカル文書とフォルダを検索可能
  • 特定のファイルやフォルダをインデックス対象から除外したり、内容のみ除外したりすることが可能
  • グローバルショートカットでアプリの表示/非表示を切り替え可能 (⎇ / Alt + Space)
  • アプリ内で検索へすぐ移動可能 (⌘ / Ctrl + F or K)、スクラッチパッドへ移動可能 (⌘ / Ctrl + Shift + S)
  • ファイルの統計を表示し、独自の文書プロファイルを提供
  • サブ機能: PDF や画像からのテキスト抽出、スクラッチパッドの利用、ファイルシステム変更との自動同期
  • 軽量なインストールパッケージと低いメモリ使用量
  • 対応ファイルフォーマット
    • 文書: csv, docx, key, md, numbers, pages, pdf, pptx, txt, xlsx, xls
    • 画像: jpg, jpeg, png, gif
    • 電子書籍: epub, mobi, azw3, pdf
    • 音声: mp3, wav, aac, flac, ogg
    • 動画: mp4, mkv, avi, mov, wmv
  • Rust + NodeJS + Tauri ベースのオープンソース

セマンティック検索

検索への含める/除外

  • ファイルタイプフィルタを使うか、検索語に直接入力可能(例: invoice pdf
  • 正確なフレーズ検索のためにキーワードに引用符を使用(例: "annual report"
  • 検索から除外するキーワードの前にハイフンを使用(例: "annual report" -2022 -pdf

時間で検索

  • 日付範囲フィルタを使うか、検索語に日付/時間の期間を明示可能
  • 例: **last month** pdf invoice, annual report ppt **this year**

ソースからビルドする

  • Buzee は Mac で最適な性能を発揮し、Windows と Linux では十分なテストが行われていない
  • Rust と NodeJS をインストールした後、npm install および cargo install コマンドを使って開発モードでアプリを実行可能

TODO / 既知の問題

  • 検索結果に一致したテキストを表示することや、ブラウザ履歴検索での複雑なクエリ対応など、さまざまな機能改善が必要
  • 文書への「タグ」追加、「ダッシュボード」ビューの作成、コードベースへのテスト追加など、新機能の開発が必要

技術スタック

  • バックエンド: Rust, Tauri v2, SQLite, Tantivy
  • フロントエンド: Svelte 4, TypeScript, TailwindCSS

アーキテクチャ

  • すべてのファイルメタデータは SQLite の document テーブルに保存される
  • metadata テーブルに全文インデックスが作成され、Tantivy に保存される
  • Firefox、Chrome、Arc の履歴は、それぞれの履歴データベースを通じて検索される

ライセンス

  • MIT ライセンス

3件のコメント

 
dhlee0305 2024-12-16

0.1.1 バージョンなので少し迷いましたが……ひとまず問題なく動作します。
ただ、PC使用中だからリソースを少なく使うように設定しているのかは分かりませんが、インデックス作成速度は遅く感じますね。
また、画像を含めてファイル内のテキストを探してくれるので便利ではあります。少し Google Desktop の雰囲気があります。

 
xguru 2024-12-16

失敗したスタートアップ Buzee をオープンソース化 – ファイル検索アプリケーション

recoll - デスクトップ向けフルテキスト検索ツール

 
GN⁺ 2024-12-16
Hacker Newsの意見
  • あるユーザーは、失敗した理由と、もし今始めるなら何をどう変えるかという道のりを共有してほしいと求めている。複数のユニバーサル検索スタートアップが失敗する理由について、市場の不在や適応の問題を挙げている

  • オープンソース化してくれたことへの感謝とともに、AI検索機能がない点を指摘している。アプリには堅実な土台があるが、実用性のためにはさらに磨き上げる必要があると考えている

  • Recoll というプログラムを使えばさまざまなファイルを検索できると説明している。Thunderbirdフォルダに保存されたMS-Word文書を検索し、PDFファイルをダブルクリックで開ける機能を強調している

  • ダウンロードできない問題に触れつつ、電子記録が膨大すぎてWindows検索が機能しない環境では役立ちそうだと述べている。電子ファイル管理の必要性を強調している

  • Labrador Retriever という名前のプログラムは使いたくないという冗談とともに、自分の犬の写真を共有している

  • Microsoft SharePointと似た機能を実装しようとした試みだったと述べつつ、MS中心の企業を説得することがビジネス面での課題だと指摘している。SharePointの上に製品を構築できるのかと問いかけている

  • ダウンロードリンクが動作しない問題を指摘し、GUIが主な価値であるプロジェクトならスクリーンショットを含めるべきだと提案している

  • 複雑なファイル検索のために、duckdb の拡張を使ってファイルシステム上でSQLを実行できる選択肢を提案している

  • Google Drive、GitHub、GitLab、Box.com、およびローカルファイルを検索できるアプリの推薦を求めている

  • オープンソース化してくれたことへの感謝とともに、ドキュメント不足を指摘している。AIドキュメント化システムを構築中で、ドキュメントを書いてPRを作成してよいか許可を求めている。AkiraDocsプロジェクトを紹介している