OCR翻訳機 - VLMベースのWindows向け rust/slint アプリ
(github.com/kirinonakar)rust/slintで作られたWindows向けOCR翻訳機です。
VLMベースで、geminiとローカルモデルに対応しています。 (LM Studio、OpenAI compatible APIなど)
ショートカット、オーバーレイ、テキストボックス、自動再翻訳、クリップボード、プロンプト変更、スタイル機能など、さまざまな機能をサポートしています。
テキストボックスモードでは、翻訳中の画面内クリックも可能です。
ゲーム翻訳に向いています。
ローカルモデルの中では、gemma-4-31b-itが最も品質が高く、gemma-4-26b-a4bが速度と品質のバランスに優れています。
qwen3.5 9は高速ですが、やや物足りない印象です。
システムプロンプトによっても多少の違いがあります。
翻訳スタイルを指示してもよく、固有名詞のようなものはシステムプロンプトに直接入力すると、うまく処理してくれます。
システムプロンプトを変更すれば、翻訳以外のこともできます。
(markdown、jsonの作成、要約、漫画を小説に変換、文字位置の出力、画像説明、プロンプト生成、Webページデザイン評価など)
活用方法は無限大です。
詳しい使い方はgithubを参照してください。
https://github.com/kirinonakar/ocr_trans
まだコメントはありません。