31 ポイント 投稿者 xguru 2025-10-04 | 1件のコメント | WhatsAppで共有
  • 完全にオフラインで動作する無料のオープンソース音声→テキストアプリで、Rust + React/TypeScriptベースのTauriデスクトップアプリ
  • ショートカットキーを押すと録音開始 → 話すとクラウド送信なしでローカル変換 → テキストとして自動入力
  • WhisperおよびParakeet V3モデルを活用し、GPUアクセラレーションまたはCPU最適化方式で動作し、Windows, macOS, Linuxをサポート
  • プロジェクトの目標は「最も完璧な音声認識アプリ」ではなく、誰でも簡単に修正・拡張でき、オープンソース、無料、オフラインをサポートする最もforkしやすいアプリを作ること
  • 技術スタック
    • フロントエンド: React + TypeScript + Tailwind CSS
    • バックエンド: Rustベース、音声処理および機械学習推論を担当
    • コアライブラリ:
      • whisper-rs (Whisperベースの音声認識)
      • transcription-rs (ParakeetのCPU最適化モデル)
      • cpal (クロスプラットフォーム音声I/O)
      • vad-rs (音声活動検出)
      • rdev (グローバルショートカットおよびイベント処理)
      • rubato (音声リサンプリング)
  • 公式サイト : https://handy.computer/

1件のコメント

 
shakespeares 2025-10-07

素晴らしいです。