1 ポイント 投稿者 GN⁺ 1 시간 전 | 1件のコメント | WhatsAppで共有
  • オープンウェイト モデルは、誰もが自前のハードウェア上でLLMを直接実行できるようにし、機密データの保護、ファインチューニング・量子化の柔軟性、フロンティアモデルに比べた低い推論コストを提供する
  • MiniMax、Z.ai、DeepSeek、Qwen などの中国の研究所モデルが先進的なオープンウェイトモデルとして挙げられ、Google の Gemma や OpenAI の gpt-oss は概してそれらより後ろに位置すると評価されている
  • オープンウェイトモデルは、OpenAI、Anthropic、Google のようなフロンティア研究所に価格下落圧力を与え、より安価な代替に切り替えられる可能性が寡占的な価格行動を抑制する
  • 最近 Meta は最新の「Muse Spark」でモデル公開を停止し、Alibaba は API優先またはAPI専用の公開を増やしており、Kimi K2.6 と Mistral もより強いライセンス条件を課す流れを見せている
  • 競争的なオープンウェイト生態系が弱まれば、少数のフロンティア研究所と一部の中国研究所が、AIユーザーの消費者余剰をより大きく吸収できるようになり、蒸留も強力な基盤モデルへのアクセス可能性を必要とするため根本的な解決策にはなりにくい

オープンウェイトモデルの役割

  • LLM市場にはクローズドモデルと**オープンウェイト(open weights)**モデルが共存してきた
    • クローズドモデルには、名前とは裏腹に OpenAI のほぼすべてのモデルが含まれる
    • オープンウェイトモデルは他の研究所が公開してきており、Llama シリーズが代表的だった
    • 最近では MiniMax、Z.ai、DeepSeek、Qwen(Alibaba)などの中国研究所モデルが先進的なオープンウェイトモデルとして挙げられる
    • Google の Gemma シリーズと OpenAI の gpt-oss モデルは、概して中国モデルより後ろに位置すると評価されている
  • オープンウェイトモデルは、誰もが自分のハードウェア上で直接実行できるようにする
    • 実用価値のあるモデルを動かすには、通常かなり強力なハードウェアが必要だった
    • しかし、より小さなモデルの有用性が大幅に高まったことで、この条件は急速に変わりつつある
  • ローカル実行には、APIで OpenAI、Anthropic、Google のような提供者にリクエストする方式より3つの利点がある
    • 機密データをフロンティア研究所のデータセンターに送るのが難しい、または不可能な場合、オンプレミス実行によりデータをネットワーク外へ出さずに済む
    • モデルをファインチューニング前提で使ったり、特定のハードウェア条件に合わせて量子化(大まかな圧縮)したりできるため、柔軟性が高い
    • 自前のハードウェアを使えば、ハードウェアの設備投資、電力、運用コストだけを考えればよく、ホスティング提供者を使う場合でもトークン単価は通常フロンティアモデルの10%未満である

価格圧力と市場規律

  • オープンウェイトモデルはフロンティア研究所にかなりの価格下落圧力を与える
    • 独占または寡占市場でも、安価で信頼できる代替手段があるなら既存事業者は競争的に行動するという contestable markets 理論に緩やかに似ている
    • この理論は厳密には埋没費用がほぼゼロであることを前提とするが、フロンティアモデルの学習はむしろその逆に近い
    • それでも、消費者が乗り換えられるという潜在的な選択肢が価格を規律するという中核メカニズムは維持される
  • フロンティアモデルは、より高い品質と契約上の利点によって、より高い価格を取ることができる
    • ユーザーはより優れたモデルに対してはるかに多く支払いうる
    • 約1兆ドル規模の企業との推論契約は、安価な推論提供者として OpenRouter を使うこととは異なる価値を持つ
    • OpenAI などは SLA や機密保持といった項目について法的拘束力のある約束を提供する
  • しかしオープンウェイトモデルは、寡占的な価格行動を難しくするのに十分な圧力として機能する
    • フロンティア研究所が一夜にして価格を5倍に引き上げれば、とりわけ要求の厳しくないユースケースでは、多くのユーザーがオープンウェイトモデルへ移行できる
    • オープンウェイトモデルは価格行動の面でジェネリック医薬品に近い役割を果たす
    • ジェネリックが存在すれば、大手製薬会社は価格をジェネリック価格にはるかに近い水準まで下げ、価格維持のためにジェネリックより一段先の新しい治療法へ注力する
  • オープンウェイトモデルがなければ、フロンティア研究所の価格決定力は今よりはるかに大きくなりうる

ライセンスと公開方式の変化

  • オープンウェイトモデルの可用性は当然の前提ではない
    • モデル学習には大きな費用がかかり、これらのモデルを作る企業は営利企業である
    • 中国国家から大きな補助を受けている可能性があるとしても、慈善団体ではない
  • 最近、オープンウェイトモデルのライセンス条件には明確な厳格化の流れが見られる
    • Meta は最新の「Muse Spark」モデルでオープンウェイトを完全にやめ、モデル自体をまったく公開していない
    • Alibaba はますますモデルをまずAPIで公開するか、一部の派生版ではAPIのみで公開している
    • Kimi の K2.6 ライセンスは、月間アクティブユーザー1億人超または月商2,000万ドル超の製品について、UIに「Kimi K2.6」を目立つ形で表示しなければならない著作者表示条項を追加している
    • フランスの Mistral も商用利用にさまざまなライセンス条件を課している
  • 例外もある
    • DeepSeek はむしろより寛容な方向へ変わっている
    • しかし全体的な傾向はより非寛容なライセンスであり、Meta と Alibaba は一部または全モデルの公開停止へ向かっている

オープンウェイト縮小が生みうる市場構造

  • 1年後には、以前ならオープンウェイトとして公開されていた最高水準のモデルの大半、あるいはすべてが、もはや公開されなくなる状況になっているかもしれない
    • これは現時点では仮定的な状況である
    • モデル間の価格比較は今後も存在しうる
    • しかし学習コストと複雑性が増え続ければ、少数のプレイヤーしか残らない可能性がある
  • ありうる市場構成は、西側の3大フロンティア研究所と一部の中国研究所へと絞られるかもしれない
    • 中国の研究所が国家主導の「合併」によって1つか2つの中国版「スーパーラボ」に統合される可能性もある
    • 戦略産業ではこの種の統合の前例は多い
    • 中国は鉄道(CRRC)、原子力、航空会社、通信でこの方式を用いてきた
    • 西側も冷戦後の防衛産業プライム企業の統合事例があり、例外ではない
  • この変化により、AIが生み出す消費者余剰を少数企業が吸収できるようになる
    • AIユーザーはトークンコストをはるかに上回る価値を得ている
    • 現在価格の10倍を支払ってもためらわないほど価値が大きいと考えられる
    • 高付加価値の専門業務やエージェント型の作業では、実際の支払額と支払意思額の差はさらに大きくなる
    • オープンウェイトという価格下限のない寡占は、この差分を利益として取り込める立場に置かれる
  • 経済理論上、このような世界では権力と経済的富が少数企業に歴史的な規模で集中しうる
    • 研究所は消費者余剰を直接マージンとして抽出し始める可能性がある
    • 少数企業による寡占と、新モデルに必要な莫大な設備投資という参入障壁のため、価格競争は制限される可能性が高い

反対可能性と残るリスク

  • 悲観的な見通しが行き過ぎている可能性もある
    • ハードウェアの進歩がより速ければ、「十分に良い」モデルを学習することは、時間とともにむしろ容易になるかもしれない
    • AIハードウェアの製造業者は少数だが、AIハードウェア市場では激しい競争が起きている
  • 蒸留(distillation) は逃げ道として挙げられるが、根本的な解決策ではない
    • 蒸留とは、フロンティアモデルの出力を用いてより小さなモデルを学習する方式である
    • しかし、そもそも強力な基盤モデルにアクセスできなければならない
    • まさに危機にさらされている要素こそ、強力な基盤モデルへのアクセス可能性である
  • 競争的なオープンウェイト生態系は、AI経済全体の下に静かに敷かれた荷重支持の前提だった
    • この前提が弱まりつつあるという事実には注目する必要がある
    • より広い経済に及ぶ含意は非常に大きい

用語と補足説明

  • オープンウェイト モデルは最終モデルのみを公開するカテゴリーである
    • 技術的には、クローズド型、オープンウェイト型、完全公開または再現可能モデルという3つのカテゴリーに分けられる
    • 完全公開または再現可能モデルには、学習データや関連する学習手順の文書まで含まれる
    • このカテゴリーがソフトウェアでいうオープンソースに最も近い
  • OpenRouter は「APIのためのAPI」の役割を果たす
    • 特定モデルについて、最も安い、または最も可用性の高い推論提供者へリクエストをルーティングする
    • ある提供者に問題が生じれば、即座に別の提供者へ切り替えて信頼性を大幅に高められる
    • より安価な提供者があれば、そちらへ切り替える

1件のコメント

 
GN⁺ 1 시간 전
Lobste.rsの意見
  • この記事は Kimi について不正確。大きな制限を付けて「modified MIT」と呼ぶ企業もあるが、Kimi K2.6 just has an advertising clause にあるのは広告条項だけ。ない方が望ましいが、そこまで大きな問題として扱うほどではないと思う
    記事では、Kimi が月間アクティブユーザー1億人超または月間売上2,000万ドル超の製品ではオープンウェイトモデルを使えないようにしたと主張していたが、実際の K2.6 ライセンスは、そのような製品・サービスの UI に「Kimi K2.6」を目立つように表示することを求めているだけ
    一部の企業がオープンウェイト公開を減らしているのは事実だが、Xiaomi、DeepSeek、Moonshot、Z.ai のように、競争力のある大規模なオープンウェイトモデルを出しているところもある。小型モデルでは Gemma 4 が標準的なオープンライセンスである Apache に移行したのも前向き
    この懸念を提起するのは妥当だが、現時点ではオープンウェイトから後退する企業が、新規参入企業や、より伝統的なライセンスへ移る企業に置き換えられている流れに近く見える

    • 著者として、もっともな指摘だったので記事を更新した。Cursor Kimi に関する内容と混同していたようで、その指摘は正しい
      今後どうなるかは興味深い。記事がすでに長かったので入れなかったが、これらの企業が実際に注目を集めるにはオープンウェイトモデルが必要だっただろうと思う。Grok のように計算資源と攻撃的な価格設定があっても採用が低い例を見ると、少なくとも世界的な認知を得るのは非常に難しかったはず
      ただし中国モデルは、推論用計算資源でも xAI ほど持っているわけではない。今やモデル品質が向上し、クローズド化する誘因は強まっているが、常に新規参入者が現れる世界が続くのかもしれない
  • オープンウェイトの 大規模言語モデル を公開する市場インセンティブは何なのか、と自問してしまう
    Nvidia on Hugging Face は一部モデルを公開しており、人々がサブスクリプションサービスを使う代わりにローカルで大規模言語モデルを動かせば、GPU がより売れるという賭けをしているように見える
    オープンウェイトモデルの公開が減れば、大手推論プロバイダーが Linux Foundation に似た オープンウェイト財団 を作り、学習データの確保、学習、ファインチューニングを調整する可能性もある。提供できる競争力のあるモデルがなければ、こうした企業の事業自体も成り立ちにくい

    • どこかで、ムーアの法則 が終われば、よりオープンで修理しやすい電子製品が増えるという理論を読んだことがある。最先端を維持するには企業に秘密のソースを隠す誘因があるが、その境界がこれ以上動かなくなれば、機能で競争しなくなり、市場のすべての製品が似たように良くなって、その誘因が消えるという理屈だった
      今の推論プロバイダーがオープンウェイト財団に乗り出すかは分からない。ただ、大規模言語モデルが数年内に壁にぶつかるなら、顧客側には確かにインセンティブが生まれうる。「なぜ 自前で できることのために OpenAnthropic に毎月50億ドルも払っているんだ?」という話になる
  • ここで一部内容に反論するコメントもあるが、いくつか付け加えたい
    Alibaba が Qwen についてやや オープン優先 ではないアプローチを取ったのは確かで残念だが、実際の差はそこまで大きくない。Max 系列モデルと多くの特化モデルはもともと API 専用で、現在 API 専用の主要モデルは約400Bパラメータの「Plus」くらい。サイズの割に歴史的に見て飛び抜けて優れたモデルでもなかった
    人々が主に Qwen として認識している小型モデル群は、今も公開されている。公開スケジュールはやや散発的になった感じはあるが、Qwen の公開はもともとかなり雑然としていた
    クローズドモデルとして言及された Qwen 3.6 Plus は、独占パートナーシップを通じて available on Fireworks として提供されている。ローカル所有サーバーを望む組織も使えるようにしたいのかは分からないが、今後こうした形が増えるのかは興味深い
    Meta の「Muse Spark」は LLaMa とは別チームによる、事実上まったく別のモデル系列なので、オープンウェイトを「中止した」と見るより、別製品と考える方が適切に思える
    Kimi K2.6 の表示条項は新たに「追加」されたものではなく、the clause has been there since the original K2 だった。DeepSeek も R1V3 0324 から通常の MIT ライセンスを使ってきた
    最近でも MiMo v2.5 系列、GLM 5.1、Gemma 4 のように、注目度の高い実際のオープンウェイト公開はいくつもあった。ただし GLM の本流はオープンウェイトでも、「Code」系列のような複数のファインチューニング版は独占で、Step 3.5 Flash の 2603 アップデートも独占に見える。それでも release their SFT training data はしているので、あまり強くは責めにくい
    公開が遅れるケースもあり、MiMo v2.5/Pro と GLM 5.1 がそうだった。ただ、そのおかげでリリース直後から SGLang/vLLM のサポートが用意される利点も時にはある。MiniMax M2.7 は実際に much more restrictive license に移行しており、これが Kimi と混同されたようだ
    「まず API で多少収益化してから後で公開する」という方式は、モデル開発自体に大きなコストがかかることを考えれば、依然としてかなり寛大で、少なくとも今のところ業界はそのバランスに満足しているように見える

  • GLM 5.1 は先月 MIT ライセンスで公開された、非常に競争力のあるオープンウェイトモデル。すでに複数の企業がサービスとして提供している。Z.ai 製で、他の中国企業のように後で制限を付ける可能性はあるが、現時点では制限はない

    • 気になる人向けに言うと 1.51TB: https://huggingface.co/zai-org/GLM-5.1/tree/main
    • ヨーロッパのプロバイダー経由で OpenCode と一緒に使っているが、確かに Claude と競争できる。近い将来、大企業への依存から完全に脱却できることを期待している
      一部では、すべての中国モデルは多かれ少なかれ GPT や Anthropic のような大規模モデルから「蒸留」されたものだと想定している。事実かどうかは分からないし、あまり気にもしていない。いずれにせよ、こうしたモデルは パブリックドメイン にあるべきだと思っており、その方向に急速に進んでいるのはうれしい
  • 最近、AI モデルライセンス事業 の人気が高まるのではないかと考えている。一定額を払い、モデル利用権を得たうえで、自分のハードウェアで直接動かす方式。Photoshop の価格設定に少し似ている
    こうすれば機密情報漏えいの問題を避けつつ、モデル制作者も収益を得られる。トークン課金のような潜在的に非常に高額な料金体系ではなく、定額制である点も利点。もちろんハードウェア費用は別

    • 将来的には、オープンウェイトモデルを公開しつつ、それを シリコンに焼き込むこと を禁止するライセンスを付けられるようになるかもしれない。そして、その種のチップを販売する形: https://taalas.com/products/
  • Kimi K2.5 が今のところ自分には最も合っていて、無理にアップグレードしなくてもいいと思っている