1 ポイント 投稿者 calmlake79 2026-02-25 | まだコメントはありません。 | WhatsAppで共有
  • Vertex AIのPriority PayGoを実運用AIチャットボットに適用し、約2週間で蓄積された27,000件のデータを時間帯別に分析した結果を共有
  • 中央値(Median)ベースの応答時間は、ON_DEMAND(Standard)とON_DEMAND_PRIORITYの大半が100〜300ms以内で、実質的に同等の性能
  • Priorityが有意に速かった時間帯は16時(-338ms)程度が唯一で、残り23時間は同程度か、むしろStandardのほうが速い
  • 10秒超過リクエストの割合はStandard 3.4%、Priority 5.9%で、Priorityのほうがむしろ1.7倍不安定という結果
  • 特に夜間(22〜23時)にはPriorityの10秒超過率が12%を超え、Standard比で3倍以上高かった
  • トークン単価が1.8倍高い点を考慮すると、現時点ではPriority PayGoにコスト対性能の優位性はないと判断
  • gemini-3-flash-preview(プレビュー版モデル)+ asia-northeast3(ソウルリージョン)環境での結果であるため、GA公開後には変わる可能性がある

まだコメントはありません。

まだコメントはありません。