5 ポイント 投稿者 jufufu 9 시간 전 | まだコメントはありません。 | WhatsAppで共有

美少女ゲームが好きな、どこにでもいるオタクです。
昔は EZTrans や AralTrans を使って翻訳していた時代があったと聞きました。
最近は MORT を使って OCR 翻訳機を動かせるそうですが、
実際に使ってみると設定も機能も多すぎて複雑で、
何より画面認識率があまりにも低かったんです。
翻訳も DeepL は API キーを入れないとしょっちゅうエラーが出るし、
最近はローカル AI もかなり良くなってきたので、ローカル OCR AI モデルと
ローカル AI 翻訳モデルを入れたらいいのでは? と思って、
作りました。
作っているうちに、音声を認識して翻訳する機能も入れたらよくないか? と思って、
だんだん規模が大きくなり、
1つのアプリで画面/音声を認識して翻訳するアプリを作りました。
対応言語は日本語だけです(もともとの目的自体が美少女ゲーム向けなので……)
画面認識翻訳は
一時領域を確定領域として登録したあと、翻訳ボタンをカチカチ押すだけで翻訳されてオーバーレイ表示される方式で、
音声認識は音声ファイルを丸ごと受け取ると文字起こしを作成してオーバーレイに表示する方式です。

作る過程は簡単ではありませんでした。
もともとプログラミングとはまったく関係のない学科を出て、まったく関係のない職場で働いていて、
プログラムといえば高校の情報の授業で DevC++ を少し触って、if/while までやった記憶があるくらいです。
GPT-5.5 でここまで作れるということを皆さんにお見せしたかったんです。
使ったトークン数は 7.2 億トークンほどです。
どうか GN の皆さん、たくさんのフィードバックをお願いします!

まだコメントはありません。

まだコメントはありません。