3 ポイント 投稿者 ragingwind 3 시간 전 | 4件のコメント | WhatsAppで共有

シンガポールで初めて開催されたQuenカンファレンスの基調講演は、Alibaba Cloudが「エージェンティックAI時代」への転換を公式化する場となりました。シンガポール政府、Alibaba Cloud経営陣、Nous Research、Fireworks AI、NVIDIA、PicsArtなどのパートナー企業関係者が登壇し、モデル、インフラ、ツール、エコシステム全般にわたる変化を発表しました。中核メッセージは「トークンを知能に、知能を行動に、行動をビジネス価値に」変換するフルスタックインフラを構築するというものでした。

発表の主な内容

  • シンガポール政府との協力: Desmond Tan国務大臣は、Alibaba Cloud、NTUC、ST Telemedia Data Centresとともに、1,000以上の現地企業・開発者・学生に生成AI・エージェンティックAIの実務教育を提供する協力案を発表しました。「AIは労働者を置き換えるのではなく、労働者のために働く」という原則を強調しました。

  • Quen 3.7 Max公開: コーディング、ツール利用(MCPプロトコルを標準サポート)、マルチモーダル、長期実行(long-horizon)タスク能力を大幅に強化した新しいファウンデーションモデルが公開されました。SWE-Bench、IFBench、HLEなど主要ベンチマークで最上位圏の性能を記録したと説明しました。

  • Quen Cloud発表: quencloud.com というエージェント専用ゲートウェイが公開されました。200以上のモデル、トークン料金プラン(月額30ドルのスタンダード〜マックスプラン)、Skills/CLIベースのワークフロー自動化機能を提供します。

  • CoderとMuron: ノートPCにインストールするバイブコーディングツールのCoderと、クラウド上で24時間稼働するマルチドメインエージェントのMuronを紹介しました。Muronはすでに43か国で活用されており、Alibaba社内でも5人・7日でCoder Worksを自前構築したことが明かされました。

  • エージェンティッククラウドインフラ: MicroVMベースのサンドボックス(ミリ秒単位の起動、テナントごとに1万同時セッションをサポート)、エージェントID・ガバナンス・セキュリティ・メモリ・データプレーンを網羅するフルスタックを公開しました。MiniMaxはこの上で20〜40msのコンテナ起動と40%のTCO削減を達成したとされています。

技術的な差別化ポイント

  • フルスタック統合: シリコン(自社PPU、第5世代CIPU)からファウンデーションモデルまで、すべてのレイヤーを自社保有する数少ないハイパースケーラーである点を前面に出しました。
  • エージェントネイティブクラウド: 人間が使うSaaS中心の構造から脱し、エージェントが直接呼び出して利用するAPIとインフラへと、コントロールプレーン全体を再設計しています。
  • オープンエコシステム: PyTorch FoundationのPlatinum Memberとして参加し、Kimi、Zhipu、MiniMax、StepFun、Viduなど競合モデル企業までModel Studioに取り込み、マルチモデルハブを志向しています。

強みとして強調された点

  • コスト効率: トークンプランによりコストの可視性と予算管理を確保し、Coderのモデル自動選択によってトークンコストを最大70%削減できると説明しました。
  • 長期実行能力: Quen 3.7 Maxが35時間連続実行で1,000回以上のツール呼び出し、平均10倍の速度向上といった事例を示したと発表しました。
  • 信頼性とセキュリティ: Gartner 2025 Access Management Magic Quadrantにアジア太平洋地域で唯一のベンダーとして掲載され、エージェントファイアウォールやIDガードのようなランタイムセキュリティを強調しました。

指摘された限界と課題

  • 信頼構築の難しさ: Nous ResearchのTommy Eastmanは、同じ作業を再現可能に実行することが依然として大きな課題であり、モデル品質・human-in-the-loop・エージェント間ガバナンスという3段階のアプローチが必要だと指摘しました。
  • メモリボトルネック: Fireworks AIは、推論最大のボトルネックは演算ではなくKVキャッシュメモリであり、マルチ階層ストレージとシステム全体の再設計が必要だと診断しました。
  • CPUの再評価: NVIDIAは、エージェントの直列的なツール呼び出し特性により、単一スレッド性能の高い新しいCPUへの需要が急増するとして、従来のクラウドCPU設計の前提が揺らいでいると述べました。

エコシステムの事例

  • PicsArt: 1億3,000万人のユーザーベースにQuen Image、Wan、Happy Horseモデルを統合し、ペルソナキャスティングや動画広告制作のようなエージェント型ワークフローを実演しました。Happy Horse導入後、動画生成量が72%増加したと明らかにしました。
  • グローバルハッカソン: 賞金総額7万ドル規模のQuen Cloud Global HackathonとHappy Horse Awards 2026を同時発表し、開発者・クリエイターの流入を狙いました。

Googleカンファレンスとの比較

1か月前に開かれたGoogle Cloud Next 2025(4月)とI/O 2025(5月)も事実上同じ方向を示していましたが、武器は異なっていました。

  • Googleの発表ラインアップ: Gemini 2.5 Pro Deep Think、Agent Development Kit(ADK)、Agent2Agent(A2A)プロトコル、第7世代TPU Ironwood、Android XRグラス、Veo 3まで、検索・デバイス・インフラをまたぐ発表を相次いで行いました。
  • Googleのユーザー指標: AI Modeが200か国で1億5,000万人、Geminiアプリが月間4億人に到達し、トークン処理量が1年で9.7兆から480兆へ50倍に増えたという数字を公開しました。
  • 戦略構図の違い: Alibabaがフルスタックの垂直統合とオープンソース(450以上のモデル、累計ダウンロード20億件)・競合モデルの受け入れというハブ戦略を両立させている一方、Googleは圧倒的なユーザー接点と自社TPU・A2A標準の先行確保で対抗しています。
  • それぞれの弱点: Googleは主力のGeminiをクローズドに維持し、発表の多くが依然として「coming soon」の段階にあり、Alibabaは米国・欧州市場へのアクセス性と、パネルで言及された信頼性・メモリボトルネックの課題を抱えています。
  • 短期的な優位領域: 短期的にはGoogleがユーザー規模とフォームファクタで、Alibabaはインフラ単価と非米国

Alibaba Cloudは、自社モデルの競争力だけではエージェント時代の主導権を握るのは難しいと見ており、シリコンからモデル・インフラ・ツール・エコシステムまでを垂直に束ねる一方で、PyTorchや競合モデル企業まで取り込む水平拡張も同時に進めています。ただし、信頼性、メモリボトルネック、CPUアーキテクチャの再設計といった根本課題がパネル討論で繰り返し言及された以上、エージェンティッククラウドが実際のエンタープライズワークロードで約束した性能と経済性を証明できるかは今後の課題として残っています。シンガポールを国際事業拠点とし、米国のハイパースケーラーとの競争を本格化させようとする意図が、今回のイベント全体から明確にうかがえました。

4件のコメント

 
yupkidangju 1 시간 전

AIによる自動生成であっても、人間による検証は必要だという教訓的な記事ですね

 
jhk0530 3 시간 전

quenではなくqwenではないでしょうか。AIが書き起こしをうまくできなかったようです

 
dydwls140 2 시간 전

よく見ていますね、私は qwen に見えました(笑)

 
tsboard 2 시간 전

そうですね、私も読みながら「Quenって何だ??」となっていました