Cafe24、LLM Routerを公開

xguru · 2026-06-25T10:46:02+09:00

Claude、Gemini、Qwen、Llama、DeepSeek など100以上のモデルを単一エンドポイントで呼び出せる統合LLMインフラ OpenAI互換の単一APIを提供し、プロバイダーごとに異なるAPI仕様・リトライロジック・ストリーミング形式を個別に学習・保守する必要がない Auto Routerがプロンプトを分析してコーディング/推論/翻訳/創作のタイプを判別し、最適コストのモデルを自動選択例: "Reactの無限スクロールコードを作って" → コーディングを検知 → claude-sonnet-4-6 Auto Fallbackにより障害・タイムアウト時は事前定義された代替経路へ即時切り替え、失敗した呼び出しは課金対象外（ZCI）例: qwen3-72b → llama-3.3-70b → deepseek-v3 Provider Routingにより、コスト・速度・スループット基準に合わせてプロバイダーの優先順位を設定可能 BYOK（Bring Your Own Key）モードで保有中のOpenAI/Anthropic/Googleキーをそのまま登録し、コストを直接コントロール可能 Semantic Cacheにより類似質問ではLLM呼び出し自体をスキップしてトークンコストを削減し、応答はms単位で返却 Preset機能でPrimaryモデル・System Prompt・Sampling・多段Fallbackチェーンをまとめて保存し、呼び出しは1行、調整はコンソールで処理してコード再デプロイは不要 Privacy & ガバナンスにより、ログ・モデル送信データの機密情報（PII）の自動マスキングをサポート Realtime Dashboardでリクエスト・コスト・トークン推移、モデル別コスト比率、成功/失敗率、リクエスト単位の詳細ログを確認可能 Playgroundでコードなしにモデルごとの応答品質・速度・コストを即時比較契約・サブスクリプション不要のクレジット従量課金制、月額基本料金0円、登録後すぐに無料クレジットを提供、ウォン建て課金および税金計算書の発行に対応

(llm-router.cafe24.com)

2 ポイント投稿者 xguru 4 시간 전 | まだコメントはありません。 | WhatsAppで共有

Claude、Gemini、Qwen、Llama、DeepSeek など100以上のモデルを単一エンドポイントで呼び出せる統合LLMインフラ
OpenAI互換の単一APIを提供し、プロバイダーごとに異なるAPI仕様・リトライロジック・ストリーミング形式を個別に学習・保守する必要がない
Auto Routerがプロンプトを分析してコーディング/推論/翻訳/創作のタイプを判別し、最適コストのモデルを自動選択
- 例: "Reactの無限スクロールコードを作って" → コーディングを検知 → claude-sonnet-4-6
Auto Fallbackにより障害・タイムアウト時は事前定義された代替経路へ即時切り替え、失敗した呼び出しは課金対象外（ZCI）
- 例: qwen3-72b → llama-3.3-70b → deepseek-v3
Provider Routingにより、コスト・速度・スループット基準に合わせてプロバイダーの優先順位を設定可能
BYOK（Bring Your Own Key）モードで保有中のOpenAI/Anthropic/Googleキーをそのまま登録し、コストを直接コントロール可能
Semantic Cacheにより類似質問ではLLM呼び出し自体をスキップしてトークンコストを削減し、応答はms単位で返却
Preset機能でPrimaryモデル・System Prompt・Sampling・多段Fallbackチェーンをまとめて保存し、呼び出しは1行、調整はコンソールで処理してコード再デプロイは不要
Privacy & ガバナンスにより、ログ・モデル送信データの機密情報（PII）の自動マスキングをサポート
Realtime Dashboardでリクエスト・コスト・トークン推移、モデル別コスト比率、成功/失敗率、リクエスト単位の詳細ログを確認可能
Playgroundでコードなしにモデルごとの応答品質・速度・コストを即時比較
契約・サブスクリプション不要のクレジット従量課金制、月額基本料金0円、登録後すぐに無料クレジットを提供、ウォン建て課金および税金計算書の発行に対応

Cafe24、LLM Routerを公開

関連記事

まだコメントはありません。