1 ポイント 投稿者 acerghjk 4 시간 전 | まだコメントはありません。 | WhatsAppで共有

vision または audio LLM API を呼ぶたびに、Postmanで毎回画像や音声をbase64に変換している方はいませんか?

はい、私もそうだったので、それを自動で処理してくれるChrome拡張を作りました。

vLLMを毎日のように使いながら、GPT-4o・Claude・Whisper・TTS などのクラウドAPIも Postman で頻繁に呼んでいました。ところが、vision/audio リクエストを1回送るたびに、同じ作業を繰り返さなければなりませんでした。画像をどこかのbase64エンコーダーサイトにアップロードして、300KBの文字列をコピーして、Postman の本文に貼り付け、エディタがもたつくのを見ながら、画像が一度変われば最初からやり直し。Postman はそもそもマルチモーダルなワークフローのために作られたツールではないので、もうツールを変えたほうがいいと思いました。同じもどかしさを感じている方の助けになればと思い、共有します。

MMRequest — vision/audio LLM ワークフローという1つの課題をしっかり解決する Chrome 拡張です。

  • 画像や音声ファイルを ドラッグ / 貼り付け / 選択 すると、{{base64Image}}{{base64Audio}} 変数に自動でバインドされます。ファイルは ブラウザ内の FileReader のみで 処理され、外部サーバーには送信されません。
  • JSON 本文には変数だけを書いておけばよく、実際の置換は Send 時点のネットワーク境界でのみ 行われます。コレクションファイルのサイズは 300KB ではなく 1KB のまま 保てます。
  • ストリーミング応答はチャンク単位に分割され、そのまま読むと見づらいのですが、Stream タブでチャンクを再結合して1画面で 表示します。NDJSON・SSE・JSON array をすべて自動検出します。
  • 応答の Pretty ビューは フィールド単位で折りたためる ため、応答に base64 がそのままエコーバックされたり、b64_json のような長い文字列が含まれていても、画面が埋め尽くされません。
  • OpenAI / Claude / Gemini / vLLM の本文テンプレート がサイドバーに内蔵されており、ワンクリックで読み込めます。
  • Postman Collection v2.1 としてエクスポート可能。受け取る側は MMRequest がなくても Postman でそのまま実行できます。

率直な disclaimer

  • v0.0.3 ベータのため、粗い部分があるかもしれません。
  • ログインは任意で、しなくてもすべての機能を使えます。

ランディングページに詳細 + 比較表 + 利用フローをまとめています → https://mm-request.vercel.app

読んでみて、同じ問題を抱えていたらぜひ一度試してみてください。フィードバック歓迎です。

まだコメントはありません。

まだコメントはありません。