2 ポイント 投稿者 GN⁺ 2025-07-07 | 1件のコメント | WhatsAppで共有
  • HuaweiQwenDeepSeekの大規模AIモデルを複製した後、『盤古(Pangu)』という自社製品として打ち出したとの内部告発が提起された
  • 盤古チームの内部社員の証言によれば、一部の実質的なモデルは直接開発されたものではなく、外部のオープンソースモデルをベースに名称だけを変更した形だという
  • 実際に135B V2およびPro MoE 72Bなど主要モデルが、QwenおよびDeepSeekの構造とかなりの水準で一致していることが技術的に明らかになった
  • 内部ではこうした慣行が研究者の士気低下と離脱につながり、行政的な非効率と不透明な人事政策も問題を深刻化させた
  • 真に自前で開発されたモデル(Pangu V3など)も存在するが、複製の慣行と評価されない研究文化が組織全体の信頼に大きな傷を残した
  • 内部告発者は自身の実名をかけて真実を明らかにすることを決意し、組織の反省と変化を促している

盤古の悲劇: Huawei Noah Ark Lab 盤古大規模モデルの痛ましい内幕

内部告発者の紹介と現場の雰囲気

  • 筆者はHuawei Noah 盤古大規模モデルチームに所属しており、主要な組織・プロジェクト構造およびリーダーシップ構成を内部情報と照合して身元を証明した
  • 盤古プロジェクトは実際には研究組織というより納品組織に近く、繰り返される締め切りと過重労働、絶え間ない評価と報告の圧力に苦しめられていた
  • 業務強度と官僚主義が極端に厳しく、家族と長期間離れて宿舎生活を送り、週末勤務も頻繁だった
  • 実質的には研究の自律性や創造性よりも、各商品ライン(Cloud、ICTなど)の納期と実績重視の企業文化が支配していた

眠れぬ夜、踏みにじられた創作意識

  • Qwenモデルの盗用論争以後、一部の研究者は羞恥心、怒り、無力感を同時に経験した
  • 告発者本人は巨大企業と内部ネットワークからの報復を恐れているが、これ以上の事実隠蔽と対外的な虚偽宣伝には耐えられないとして、良心に基づく告白を決意した

技術的難関、そして盗用の始まり

  • 初期の盤古モデルはHuawei Ascend NPU基盤で自前学習を試みたが、トークナイザー効率とモデル性能の低さなど深刻な試行錯誤を経験した
  • 競合他社(Alibaba、Zhipu)のGPUベースモデルに後れを取り、自社230B denseモデルの学習は失敗に終わった
  • その結果、小型モデルラボは「自社開発」と装ったものの、実際にはQwen-1.5 (110B)モデルを複製し若干修正した135B V2を作って供給しており、内部でもコードと構造の類似性が明らかになった
  • 主要なリーダーシップおよび経営陣はこうした実情を知りながらも、対外的な成果と実績への圧力を理由に黙認した

真の技術的成果: Pangu V3

  • 捲土重来の末、チームは最初から完全に自前で開発したPangu V3 (135B Ultra)モデルをAscend上で独立して学習した
  • 複数の技術的難関(トークナイザーの統一、損失曲線の安定化など)を克服し、競合他社と同等の性能を達成した
  • この成果は盗用ではない独自の大規模モデル開発の証拠であり、研究者たちの誇りの源泉だった

分業の裏で報われない苦労

  • 小型モデルラボは継続的にデータ・コード・成果物を持ち去って容易にモデルを改変・配布しており、成果や報奨などは主にその組織に帰属した
  • その結果、献身的な研究者たちは組織を去るか、技術者人生の汚点として残る現実を自嘲気味に語った

224B MoE/718Bクローンなど第2の盗用事例

  • 新たな718B MoEモデル開発過程でも、DeepSeekv3をほぼそのまま複製した後、Pangu Pro MoE 72Bと命名して配布した
  • 内部ではこうした慣行を認識していたが、互いの生存と真実暴露への恐れから口をつぐむ雰囲気があった

不条理な行政管理

  • 真に研究を行うチームには厳格なプロセス・モデル系譜・監査体系が適用され、開発速度が遅延した
  • しかし複製モデルの場合は「上がやればすべて通る」という二重基準が根深く残っている

告発の理由と辞任の決意

  • HonestAGI事件以後、会社ぐるみの危機管理と内部隠蔽の試みが始まった
  • 告発者は「偽の報告書」と内部共謀にこれ以上加担できないとして、チームメンバー一覧と報告書から自分の名前を削除し、自主退職の意思を明らかにした

最後の訴えと同僚への思い

  • 同僚たちはすでにByteDance、DeepSeek、Tencent、Kuaishouなど他社へ転職しており、Huaweiからの人材流出が深刻であることを示している
  • イノベーション、適切な環境、少ない政治的障害があれば、世界水準の大規模モデルおよびチップ開発も可能だったと強調した
  • 本内容の真実性と、追加告発に伴う自身および家族の身辺への脅威の可能性まで引き受ける意思を表明した

追加状況の説明

  • 135B V2クローン事例では、小型モデルラボが報奨・インセンティブなどの利益だけを得て、downstream支援・保守負担は元の開発チーム(4th brigade)に転嫁された
  • Pangu技術報告書の著者表記でも、実際にモデル開発へ中核的に貢献した人員が除外され、小型モデルラボ所属の非貢献者が含まれるなど、不公正な学術慣行が蔓延している

1件のコメント

 
GN⁺ 2025-07-07
Hacker News の意見
  • 元の投稿者はやや世間知らずな見方をしている、と感じる立場。Ascend チームは当初(第1世代 910A NPU 基準)Nvidia と比べて性能が不足していたが、これは当然の結果だった。経営陣はすぐ商用化できる GPU ベースの代替案を追うチームを支援し、社内政治によってその方向性が固定された。Ascend チームは最終的に技術的課題の解決に成功したが、不当な扱いと官僚的なえこひいき、評価不足などにより多くのメンバーが燃え尽きたり、他の中国 AI 企業へ転職した。HW(おそらく Huawei)は長年、トップティア級の人材を酷使する戦略と文化を持っており、90年代にも PRC の通信事業者が Nortel、Siemens、Lucent から人材を引き抜いていたが、西洋式の職場文化に慣れていた中国系人材は実際の中国企業文化に適応するのに苦しみ、燃え尽きた。それでも HW は攻撃的なワークカルチャーによって最終的に業界を支配するようになった。今では制裁以降、戦略企業となり、半導体、国産チップ、AI によって価値が大きく高まっている。現在の国際環境の下で、HW は市場支配のために何でもやれる立場を確保している。この退職レターから分かるのは、HW が最終的に十分な人材投入によって Ascend を実用レベルまで引き上げており、今後も Nvidia と競争できるほど人材を継続投入する可能性があるということ。著者だけでなく、たいていの会社員は、従業員に正当な報酬を与え良い労働環境を整えることが不可欠だという直感を持っている。しかし HW は過去30年間、多くの優秀な人々(愛国者を含む)に莫大な報酬を与えて問題解決に投入し、人が壊れるまで追い込みながら勝ってきた
  • LLM は著作権とまったく両立しない構造だという見方。すでに他人のデータを一銭も払わず学習できるなら、複製も自由だという理屈になる。結局は複製のブーメラン現象だという視点
    • 素朴に見れば両立不能だが、弁護士が何とかして合法化の方法を見つけるだろう、という考え
  • 昔の地図出版社は偽の路地を入れて著作権侵害を簡単に見抜けるようにしていた。LLM にもこうした方法が適用できるのか気になる
    • Malwarebytes 勤務時、IOBit が DB を盗用している疑いがあった。明白な証拠はあったが、一般人にも分かりやすく示すため、1台のマシンにしか存在しない新製品プログラムを作り、そのシグネチャを DB に追加した。そのプログラムは実際には配布され得ない非マルウェアで、相手がこれを DB に追加するとブログで公開し、大きな反響を呼んだ。関連事例 IOBit 盗用事件
    • 代表的な例としては、コンピュータチップに意図的に微細で無害な欠陥や異常現象を入れる方法がある。中国製の多くの製品は TI など他社製品のリバースエンジニアリング結果物なので、こうした欠陥が多い。しかも中国国内でも互いにこうしたことをやっている。どれも同じような抜け道利用だという認識
    • OML 1.0: Fingerprinting というプロジェクト例を見たことがある。LLM の所有権識別と無断使用防止のために指紋をモデルに埋め込むツールだ
    • YouTuber の Jay Foreman が 地図の中の偽の路地に関する動画 を作っていた例がある
    • 元の中国語による告発文には次の内容があった。Honestagi の分析では、非常に長い追加学習を経たモデルであるにもかかわらず高い類似性が見られたことに驚いた。このモデルのパラメータをロンダリングするために投入した計算資源は、同クラスのモデルを新たに作るのに十分な水準だった。同僚によれば、Qwen のウォーターマークを消すために汚染データでわざと学習させるなど、さまざまな試みも行われたという。この方式は今後、モデル血統研究分野で前例のない事例として残り、今後新たな研究手法を検証する際の見本として使える可能性がある
  • Apple は Qwen2.5-Coder-7B をベースにしつつ独自のアイデアを組み込んだ LLM を発表した。主な変更点は、Apple 独自のコード例でカスタム学習させた点であり、温度を上げると複数のコードブロックを順序を無視して生成できる。関連記事 Apple LLM 関連ニュース HN 議論
  • 中国式の効率重視。西側は過去の著作権法に足を引っ張られているという意見
  • とても人間味があり率直な報告書だ。大企業内部の混乱と、経営陣が不誠実なチームにより有利になるよう圧力をかける構造を示している。筆者は会社を去っており、人柄も良いと評価されている
    • 実際、この報告書は最近中国で相次いでいる他の退職レターとも文脈を共有している。最近では勤続15年の Alibaba ベテランの退職文も、企業文化の衰退が競争力低下と新製品失敗の原因だと批判していた。報告書の論点は次の通り。1. Huawei の能力に関する国家レベルの虚偽 2. 有料顧客に対する虚偽 3. KPI に執着する管理体制の下で、成果指標の操作が事実上黙認・助長されている現実(これと筆者の理想、信頼喪失が報告書の核心である)
  • 「土曜日は基本的に勤務日だったが、ときには午後のティータイムや、さらにはエビ料理まで食べられた」という一文に詩的な感性を感じる。こうした状況でザリガニが出される特別な理由があるのか気になる
    • 「土曜勤務でも時々軽食が出て、ザリガニもそれだけ人気なのかもしれない、あるいは誤訳かもしれない」という推測
  • 「私たちは『第4野戦軍』プロジェクトの傘下におり、コア言語 LLM は第4旅団、Wang Yunhe の小型モデルグループは第16旅団」という組織説明を見て不思議に思った。本当に共産党軍所属の組織なのか疑問だ
    • 実際の第4野戦軍は 1955 年以降存在せず、LLM プロジェクトのコードネームとして使われ続けているネーミングである可能性が高いという見方
    • Huawei の軍隊式企業文化への言及。新入社員オリエンテーションも軍隊訓練の修了式のように運営される。参考資料 Huawei の軍隊式文化
  • 実際に原初モデルを作ったのは誰なのか、という問い
  • 過去に Huawei Lab のメンバーがモデル訓練を実際に妨害して解雇された事例があり、今回の告発当事者がその人物ではないかと疑う意見
    • おそらくその事例は、ByteDance のインターンが AI モデルに悪意あるコードを仕込み解雇された事件を指していると思われる。関連記事 bytedance-intern-fired