FreeFlow - 音声ディクテーションアプリをオープンソース化
(github.com/zachlatta)- 商用音声文字起こしアプリの Superwhisper、Monologue と同様の機能を提供
- 無料の groq API を活用し、1秒未満の高速な文字起こし速度 と LLM ベースの後処理 を実行
- キーボードの
Fnキーを長押しして録音を開始すると、音声内容を 現在のカーソル位置に自動入力 - コンテキスト認識機能 により、メールやターミナルなどの入力環境を検知(Monologue の "Deep Context" 機能)
- 宛先名やコマンドなど、文脈に合ったスペルや表現の補正機能 を提供
- Swift で書かれた Mac 専用アプリ(Apple Silicon と Intel Mac の両方をサポート)
- MIT ライセンス
2件のコメント
groqのpricingページを見ると、*Audio is billed at a minimum of 10s per request. と書かれていますね
grok だと思っていましたが、groq は別物なんですね