11 ポイント 投稿者 GN⁺ 5 시간 전 | 2件のコメント | WhatsAppで共有
  • 中国の主要AI研究所を実際に訪問し、研究者たちと対話した経験をもとに、中米AIエコシステムの文化的差異と、それがモデル開発に及ぼす影響を分析した現地レポート
  • 中国の研究者たちは、個人の名声よりも最終モデルの品質最適化に集中する文化的傾向を示しており、中核的な貢献者のかなりの部分が現役学生
  • 中国のAI企業は外部サービスを購入するよりも、自社の技術スタックを統制しようとする強いオーナーシップ意識を持っており、オープンソース公開も実用的な判断に基づいている
  • 中国のAI開発者の大半がClaudeを使用しており、エンタープライズAI需要はSaaSではなくクラウド市場の軌道をたどる可能性
  • 米国と中国のAIエコシステムは構造的に異なる形で動作しており、西側のフレームワークで中国AI産業を単純にマッピングするとカテゴリーエラーが起こりうる

中国研究者の思考様式

  • 中国のLLM開発企業は、教育と仕事における長年の文化的伝統と、テック企業運営の微妙な違いを組み合わせることで、**高速キャッチアップ型(fast-follower)**として最適な構造を備えている
  • 最新のLLM構築では、データ、アーキテクチャの細部、RLアルゴリズム実装など、スタック全体にわたる緻密な作業が鍵であり、個々の貢献者の成果が全体モデルの多目的最適化のために譲られなければならない複雑なプロセスとなる
  • 米国の研究者は自分の仕事を積極的に宣伝する文化が強く、"先導的AI科学者"としての名声追求が組織内の対立を引き起こす
    • Llama組織がこうした政治的利害の重みで崩壊したという噂が広く流れている
    • 一部の研究所では、最終モデルに自分のアイデアが反映されなかったことに不満を示すトップ研究者に報酬を支払う必要があったという話もある
  • 中国研究所の中核的な貢献者のかなりの部分は現役学生であり、研究所そのものが非常に若い組織である
    • これはAi2の構造に似ており、学生が同僚として扱われ、LLMチームに直接統合される形
    • 一方で米国のOpenAI、Anthropic、Cursorなどはインターンシップを提供しておらず、GoogleのGemini関連インターンシップも実務から切り離されるおそれがある
  • こうした文化的差異がモデル構築能力を高める具体的要因:
    • 最終モデル改善のための目立たない仕事への高い受容性
    • AIの新規人材が以前のハイプサイクルに縛られず、現代技術により速く適応すること
    • エゴが少ないため組織構造がややスケーラブルで、システムのゲーム化も少ないこと
    • 他所で概念実証された問題を解くのに適した豊富な人材プール
  • こうした利点は、中国の研究者が創造的で分野を切り拓く0-to-1型の学術研究をあまり生み出さないという既知の固定観念と対照的
    • 学術研究所のリーダーたちは、より野心的な研究文化を育てようと努力している
    • 一部の技術リーダーは、教育およびインセンティブ制度の再設計は現在の経済的均衡の中で行うにはあまりに大きな課題だとして懐疑的である

学生研究者の特性

  • 中国でも米国と同様の頭脳流出が起きており、以前は学界を考えていた多くの人が産業界に残ろうとする傾向にある
    • ある研究者は教授職に関心があったが、"教育はLLMで解決される — 学生がなぜ私に質問するのか"と述べた
  • 学生はLLMに先入観なくアプローチできる利点を持つ
    • ここ数年でLLMの中核パラダイムはMoEスケーリング → RLスケーリング → エージェント活用へと移行した
    • これらすべてをうまく行うには、幅広い文献と技術スタックの文脈を素早く吸収する必要があり、学生はこの作業に慣れていて情熱的である
  • 中国の学生研究者は哲学的言説への関与が少なく、非常に直接的である
    • モデルの経済性や長期的な社会的リスクについて精緻な意見を持つ中国の研究者は、米国に比べてずっと少ない
    • ある研究者はDan Wangの有名な前提である"中国はエンジニアが運営し、米国は弁護士が運営する"を引用した
    • 中国にはDwarkeshやLexのような巨大メインストリームポッドキャストを通じて科学者のスターパワーを体系的に育てるルートが存在しない
  • AIがもたらす経済的不確実性、AGIを超える問い、モデル行動に関する道徳的議論などについての質問に対し、中国の科学者は議論や社会構造についての意見が奨励されないシステムの中で育った特性を示していた

北京と中国AIエコシステムの現場の空気

  • 北京はBay Areaと非常によく似た感覚があり、競合研究所が徒歩または短時間の移動圏内に位置している
    • 36時間のあいだにZ.ai、Moonshot AI、清華大学、Meituan、Xiaomi、01.aiを訪問した
    • Didiでの移動が便利で、中国のXL車両にはマッサージチェア付きの電動ミニバンが割り当てられることが多い
  • 研究者をめぐる人材争奪戦は米国と非常によく似ており、研究者が転職するのは一般的で、選定基準は今いちばん雰囲気が良い場所である
  • 中国のLLMコミュニティは、競争する部族というよりエコシステムに近い印象を受ける
    • すべての中国研究所が、人気のDoubaoモデルを持つByteDanceを警戒している
    • ByteDanceは中国で唯一のフロンティア非公開研究所である
    • すべての研究所がDeepSeekを、実行面で最高の研究センスを持つ技術リーダーとして尊重している
    • 米国で非公式に研究所メンバーに会うとすぐに火花が散るのとは対照的である
  • 中国研究者の謙虚さで最も印象的だった点は、ビジネス面について"自分の問題ではない"として無関心な態度を取ることだった
    • 米国では、データ販売者、コンピュート、資金調達などエコシステム全体の産業トレンドに誰もが執着している

中国AI産業の相違点と類似点

  • 今日のAIモデル構築は、優れた研究者によるエンジニアリング成果物にとどまらず、構築、デプロイ、資金調達、採用が結び付いた複合的な活動へと変化している
  • 西側エコシステムとの主な違い6点:
  • 1. 国内AI需要の初期兆候

    • 中国企業はソフトウェアにお金を払わないため巨大な推論市場は形成されない、という仮説がある
    • これは歴史的に中国で非常に小さいSaaSエコシステムにのみ当てはまる話であり、中国には依然として大規模なクラウド市場が存在する
    • 中核となる未解決の問いは、エンタープライズAI支出がSaaS市場(小さい)に従うのか、クラウド市場(本質的)に従うのかという点である
    • 全体としてAIはクラウドにより近い軌道を示しており、新しいツールの周辺で市場が成長することを積極的に懸念する人はいなかった
  • 2. ほとんどの開発者がClaudeを使用

    • 中国のAI開発者の大半がClaudeに熱中しており、Claudeがソフトウェア構築の方法をどう変えたかに注目している
    • Claudeは名目上中国で禁止されているにもかかわらず利用されている
    • 一部の研究者はKimiやGLM CLIのような自前ツールの利用にも言及したが、全員がClaudeの利用に触れた
    • Bay Areaで人気が急上昇しているCodexへの言及は驚くほど少なかった
    • 中国が歴史的にソフトウェア購入に消極的だったとしても、推論需要の大規模な急増が起こらないという印象は与えない
  • 3. 技術オーナーシップ意識

    • 中国文化は活発な経済エンジンと結びつき、予測不可能な結果を生み出している
    • 数多くのAIモデルはマスタープランではなく、多くのテック企業の実用的で現在的な均衡を反映している
    • 産業は、ByteDanceとAlibabaがかなりの資源によってほとんどの市場で勝つと予想される既存勢力として尊重されている構図である
    • DeepSeekは尊敬される技術リーダーだが、市場リーダーとは距離があり、方向性は示しても経済的に勝つ構造ではない
    • Meituan(配送サービス)やAnt Groupのような企業がモデルを構築することは西洋では驚かれるかもしれないが、LLMは将来の技術製品の中核であるため、強固な基盤が必要だという判断である
    • 汎用モデルをファインチューニングすれば、オープンコミュニティからのフィードバックでスタックを強化でき、自社製品向けの内部ファインチューニング版も維持できる
    • "オープン優先"の思考は実用性に基づいており、モデルへの強力なフィードバックを得ること、オープンソースコミュニティに貢献すること、ミッションを強化することにつながる
  • 4. 政府支援は実在するが規模は不明

    • 中国政府がオープンLLM競争を積極的に支援しているという主張はしばしば提起される
    • 政府は複数レベルに分権化されており、各レベルで正確に何をしているのかについて明確なプレイブックはない
    • 北京の地域区画(neighborhood)はテック企業のオフィス誘致をめぐって競争している
    • 提供される"支援"には、ほぼ確実に許認可のような官僚手続きの簡素化が含まれるが、人材誘致やチップ密輸まで可能なのかは不明である
    • 訪問中、政府の関心や支援についての言及は何度もあったが、詳細を断定的に報告するにはあまりに情報が少ない
    • 中国政府の最上位レベルがモデルの技術的意思決定に影響しているという示唆はまったくなかった
  • 5. データ産業がはるかに未発達

    • AnthropicやOpenAIが単一環境に1,000万ドル超、年間で数億ドル規模をRLフロンティア拡張に投じているという話を聞いていたため、中国研究所も米国企業から同じ環境を購入しているのか、あるいは国内エコシステムの支援を受けているのかを確認しようとした
    • データ産業が完全に存在しないというより、相対的に品質が低いため、環境やデータを自前で構築するほうが良いことが多い
    • 研究者たちはRL訓練環境の構築にかなりの時間を直接投じている
    • ByteDanceやAlibabaのような大企業は、これを支えるための社内データラベリングチームを持っている
    • これらすべては前項の購入より構築という発想を反映している
  • 6. Nvidiaチップへの切実な需要

    • Nvidiaコンピュートは学習のゴールドスタンダードであり、どの研究所もその不足によって進展が制約されている
    • 供給があれば購入するのは明らかである
    • Huaweiを含む他のアクセラレータは推論用途では好意的に評価されており、多くの研究所がHuaweiチップにアクセス可能である
  • これらのポイントは、西側研究所の運営方法を中国に素早く当てはめるとカテゴリーエラーが生じる、非常に異なるAIエコシステムの姿を示している
  • 核心的な問いは、こうした異なるエコシステムが意味のあるほど異なる種類のモデルを生み出すのか、それとも中国モデルは常に米国フロンティアモデルの3〜9か月前の版として説明されるのか、という点である

グローバルな均衡

  • 中国はルールやレシピで表現できる場所ではなく、非常に異なる力学と化学を持つ場所である
    • 文化が非常に古く深く、国内の技術構築のあり方と完全に絡み合っている
  • 米国の現在の権力構造は、中国に対する世界観を意思決定の中核装置として用いているが、中国には西洋の意思決定モデルでは捉えにくい性質や本能が存在する
  • なぜこれらの研究所が最高クラスのモデルをオープン公開するのかを直接尋ねても、オーナーシップ意識と真のエコシステム支援の交差点は容易には結び付けられない
  • ほぼすべての主要な中国テック企業が独自の汎用LLMを構築している
    • Meituan(配送サービス)、Xiaomi(幅広い消費者向け技術企業)などがオープンウェイトモデルを公開している
    • 米国で同等の企業なら単にサービスを購入するだろう
    • これらの企業がLLMを構築する理由は流行を追うためではなく、自社スタックを統制し、この時代で最も重要な技術を開発するという深い根源的欲求によるものだ
  • 中国研究者たちの人間味、魅力、そして本物の温かさは非常に人間的な体験だった
    • 米国で見慣れた冷酷な地政学的対話は、彼らにはまったく染み込んでいなかった
  • オープンエコシステムが世界的に繁栄すれば、より安全でアクセスしやすく有用なAIを作ることができ、現在の問いは米国の研究所がそのリーダーシップポジションを取るための措置を講じるかどうかである
  • オープンモデルに影響を与える大統領令に関する噂がさらに広がっており、これは米国のリーダーシップとグローバルエコシステムのシナジーをさらに複雑にする可能性がある

2件のコメント

 
jjw9512151 5 분 전

時に、中国に対する過剰で不合理な執着が、
私たちの中の怪物を生み出しているのではないかと心配になります。

ちょうど、ナチスが政権を握る名分の一つが反共だったように。

 
kaydash 14 분 전

たった一つの中国…!