vvrite — オープンソースの macOS 向けオンデバイスAI音声タイピングアプリ
(github.com/shaircast)こんにちは。私はもともと、superwhisper や spokenly のような既存の音声タイピングツールに 8bitdo micro ゲームパッドを接続して使っていました。ところが、どうにもネットワークレイテンシが気になっていました。
そこでローカルモデルをいろいろ試し続けていたのですが、今回 Qwen3-ASR モデルを使ってみて、これだと思いました。きびきび動きながらクラウドモデルに引けを取らない性能を見せてくれたので、これをローカルで動かしつつ同じ UX を目指して vvrite を作りました。デバイス性能によりますが、かなり高速で、メモリもあまり消費しません。
vvrite は macOS のメニューバーでホットキー(デフォルトは Option+Space)を押すとすぐに録音を開始し、もう一度押すとオンデバイスAIで音声を認識して、現在の入力欄に自動で貼り付けるアプリです。macOS 13 以降の Apple Silicon Mac に対応しています。GitHub Releases から署名・公証済みの DMG をそのままインストールできます。
13件のコメント
handyを使ってみようと思っていたのですが、こちらのほうが韓国語をよりよくサポートしているとのことなので、使ってみないといけませんね。ありがとうございます
韓国語の音声認識ツールを使っていたのが気になっていて
grok がオープンソースの中でこれをおすすめしてくれたので
(最後にものすごく小さい文字でおすすめしてくれていました)使ってみたのですが
よかったのでカスタマイズして使っています
モデルも3つ追加して
通知音が大きすぎたので音量調整を入れて…
いくつかバグも直して…
しばらくはこれでまた
音声コーディングを楽しくやっていこうと思います
コードを開いてみたら、開発者ではない方が
進めているプロジェクトのようで
ますます応援したくなりましたね〜〜
いつも考えるだけで先延ばしにしている
誰かさん(私…)より100倍すごいです😂
superpowers の痕跡が残っているのも
見ながら「みんなこうやってやってるんだな…」と
思ったりもしました〜
使ってみたら速くて良いですね。活用させていただきます。
ありがとうございます!
私はAndroid向けの音声コマンドアプリを作っているのですが、qwenは確かにかなり良いですね。 ただ、まだ最適化できていないので、Whisper baseを韓国語データセットでファインチューニングしたものを使っています。
Whisper large v3 turboより良いですか? 私はまだこれを使っているのですが、もし比較してみたことがあれば気になります。Moonshineもここで見て使ってみようと思っていたのに、もう3週間も経ってしまいましたね(笑)
韓国語では、Whisperより明らかに良いです!
Moonshineはparakeetと大きな違いはありませんでした。
handyとの違いは何ですか?
こういう類いのアプリはUXがほとんど似たようなものだと思います。vvriteも大きくは変わりません。結局はモデルの性能ですね。
英語だけを使うなら、handyでサポートされているparakeet程度で十分ですが、
日本語対応の経験ではQwen3-ASRがいちばん良い選択肢に感じました。
でも対応しているところがなかったので、自分で作りました。
わあ、すごいツールですね。
個人的には、使い方の説明書(マニュアル)をあとで見返せるUIが追加されると、さらに良くなると思います。最初にインストールしながら適当に押していたら、どう使えばいいのか混乱しました(笑)
ツール名は何と読むんですか? ライトですか?
ご意見ありがとうございます!次のリリースに反映します。
vvriteを意図してはいたのですが……私もどう読むのがよいのかよく分かりませんねブライトはどうですか?
vvrite - vwrite - bright の3つの意味をあわせて込めたもの…