MMRequest - vision LLM APIを呼ぶたびに手でbase64変換していませんか? 頭にきて作ったChrome拡張
(mm-request.vercel.app)vision または audio LLM API を呼ぶたびに、Postmanで毎回画像や音声をbase64に変換している方はいませんか?
はい、私もそうだったので、それを自動で処理してくれるChrome拡張を作りました。
vLLMを毎日のように使いながら、GPT-4o・Claude・Whisper・TTS などのクラウドAPIも Postman で頻繁に呼んでいました。ところが、vision/audio リクエストを1回送るたびに、同じ作業を繰り返さなければなりませんでした。画像をどこかのbase64エンコーダーサイトにアップロードして、300KBの文字列をコピーして、Postman の本文に貼り付け、エディタがもたつくのを見ながら、画像が一度変われば最初からやり直し。Postman はそもそもマルチモーダルなワークフローのために作られたツールではないので、もうツールを変えたほうがいいと思いました。同じもどかしさを感じている方の助けになればと思い、共有します。
MMRequest — vision/audio LLM ワークフローという1つの課題をしっかり解決する Chrome 拡張です。
- 画像や音声ファイルを ドラッグ / 貼り付け / 選択 すると、
{{base64Image}}・{{base64Audio}}変数に自動でバインドされます。ファイルは ブラウザ内の FileReader のみで 処理され、外部サーバーには送信されません。 - JSON 本文には変数だけを書いておけばよく、実際の置換は Send 時点のネットワーク境界でのみ 行われます。コレクションファイルのサイズは 300KB ではなく 1KB のまま 保てます。
- ストリーミング応答はチャンク単位に分割され、そのまま読むと見づらいのですが、Stream タブでチャンクを再結合して1画面で 表示します。NDJSON・SSE・JSON array をすべて自動検出します。
- 応答の Pretty ビューは フィールド単位で折りたためる ため、応答に base64 がそのままエコーバックされたり、
b64_jsonのような長い文字列が含まれていても、画面が埋め尽くされません。 - OpenAI / Claude / Gemini / vLLM の本文テンプレート がサイドバーに内蔵されており、ワンクリックで読み込めます。
- Postman Collection v2.1 としてエクスポート可能。受け取る側は MMRequest がなくても Postman でそのまま実行できます。
率直な disclaimer
- v0.0.3 ベータのため、粗い部分があるかもしれません。
- ログインは任意で、しなくてもすべての機能を使えます。
ランディングページに詳細 + 比較表 + 利用フローをまとめています → https://mm-request.vercel.app
読んでみて、同じ問題を抱えていたらぜひ一度試してみてください。フィードバック歓迎です。
まだコメントはありません。