- 完全にオフラインで動作する無料のオープンソース音声→テキストアプリで、Rust + React/TypeScriptベースのTauriデスクトップアプリ
- ショートカットキーを押すと録音開始 → 話すとクラウド送信なしでローカル変換 → テキストとして自動入力
- WhisperおよびParakeet V3モデルを活用し、GPUアクセラレーションまたはCPU最適化方式で動作し、Windows, macOS, Linuxをサポート
- プロジェクトの目標は「最も完璧な音声認識アプリ」ではなく、誰でも簡単に修正・拡張でき、オープンソース、無料、オフラインをサポートする最もforkしやすいアプリを作ること
- 技術スタック
- フロントエンド: React + TypeScript + Tailwind CSS
- バックエンド: Rustベース、音声処理および機械学習推論を担当
- コアライブラリ:
whisper-rs (Whisperベースの音声認識)
transcription-rs (ParakeetのCPU最適化モデル)
cpal (クロスプラットフォーム音声I/O)
vad-rs (音声活動検出)
rdev (グローバルショートカットおよびイベント処理)
rubato (音声リサンプリング)
- 公式サイト : https://handy.computer/
1件のコメント
素晴らしいです。