- Facebookの最高経営責任者マーク・ザッカーバーグは、Metaの大規模言語モデル Llama 3 はオープンソースだと主張しているが、実際にはオープンソースではない
- オープンソース・イニシアティブ(OSI)のオープンソース定義によれば、Llama 3 のライセンスはいくつもの点でオープンソースの条件を満たしていない
- Metaだけがこのようなごまかしをしている企業ではない。これは「オープンウォッシング」と呼ばれる
- オープンウォッシングとは、実際にはオープンではない製品やサービスを「オープン」であるかのように見せかける欺瞞的な慣行
- 2009年にインターネット政策研究者 Michelle Thorne が「グリーンウォッシング」に着想を得て作った用語
- AI分野ではオープンウォッシングが蔓延している。Radboud University の研究者が調査した45のモデルのうち、Google、Meta、Microsoft など大手企業のモデルは実際にはオープンソースではなかった
企業がオープンウォッシングを行う理由
- かつてはオープンソースを敬遠していたが、今ではオープンソースに対する認識は好意的に変わっている
- 2001年、Steve Ballmer は「Linux はがんだ」と宣言し、オープンソースソフトウェアを使うと残りのソフトウェアもすべてオープンソースにしなければならないと主張した
- 企業はオープンソースのポジティブなイメージを利用しつつ、実際にはオープンソースに本気で取り組んでいない
- これは世間的なイメージを改善し、透明性と開放性を重視する消費者にアピールするのに役立つ
- 一部の企業は、オープンウォッシングによってモデルや慣行を科学的・規制上の監視から守りながら、「オープン」というラベルの恩恵を享受している
- EU AI法が「オープンソース」モデルに特別な免除を与えているため、オープンウォッシングへの強い動機になっている
オープンソースAIに関する明確な定義の欠如
- EUはいまだにオープンソースAIの明確な定義を示せておらず、実際のところ、まだ誰も示せていない
- OSIは今後数日以内にオープンソースAIの定義を発表する予定
- 現在のオープンウォッシング的なライセンスは、作成者を除けば、どの定義にも反している
- ただし、すべての大手AI企業がオープンソースについて嘘をついているわけではない
- たとえば IBM の Granite 3.0 LLM は、実際に Apache 2 ライセンスの下でオープンソースとして提供されている
- OSIは政府や規制当局ではないにもかかわらず、なぜオープンソースという用語を正しく使うべきなのだろうか?
- OSIは単に有用なガイドラインを作った非営利団体にすぎない
- Chainguard の CEO である Dan Lorenc は、最近アトランタで開催された SOSS カンファレンスの基調講演で次のように語った
- 誰も OSI の定義を使うよう強制はできないが、多くの人々、特に弁護士はこの定義を信頼している
- 彼らは OSI の活動を信頼し、企業がオープンソース基準を満たすライセンスを使う際に得られる保護を理解している
- だからこそ、この定義が世界中の大企業の調達契約に登場するのだ
オープンソースは単なる法務・ビジネスの問題ではない
- オープンソースは開発者に自由な活動のあり方を与える
- オープンソースがなければ、ライセンスのさまざまな条件を把握したり気にしたりせずにコードを自由に使えるという恩恵は失われる
- すべてのコードのライセンスを一つひとつ確認しなければならないなら、開発者は新しいライブラリを使うたびに法務レビューを受ける必要がある
- 企業は、ソースコードを公開したときに直面する責任が不明確であれば、インターネット上に何かを公開すること自体を恐れるようになる
- Lorenc は、これは大企業だけの問題ではなく、共有された問題だと強調する
- オープンソースを使うすべての人が影響を受ける
- プロジェクト全体が動かなくなる可能性があり、セキュリティバグは修正されず、保守ははるかに難しくなる
- オープンソースの定義を守り維持するために、私たちは共に行動しなければならない。そうでなければ、弁護士が再び介入することになる
- 多くの知的財産弁護士は、このような厄介ごとを望んでいない
- 真のオープンソースライセンスは、企業、プログラマー、弁護士のすべてにとって生活を容易にする
- 「私たちと競争できる人を除いてオープン」や「クラウドにコードを配備できる人を除いてオープン」のような条項を導入するのは、自ら問題を招く行為だ
オープンウォッシングはすべての人に害を及ぼす
- 結局のところ、オープンウォッシングは誰にとっても法務、ビジネス、開発の作業を汚染することになる
- 皮肉なことに、現在このアプローチを支持している近視眼的な企業も被害を受ける
- 結局、彼らのほぼすべての仕事、とりわけAI分野での仕事はオープンソースの上に成り立っているからだ
GN⁺の見解
- オープンソースの定義を損なうオープンウォッシングの慣行は、AI分野だけでなくソフトウェア産業全体にも悪影響を与えうる。開発者の活動を制約し、企業の法的リスクを高める
- 企業がオープンソースのポジティブなイメージだけを利用しようとするのは近視眼的な姿勢だ。長期的には、むしろ企業自身にとっても害となりうる
- AI技術の発展には、オープンソースの精神に基づく協力と共有が不可欠だ。企業は真のオープンソース文化の形成を先導すべきだ
- オープンソースAIに関する明確な定義と基準の整備が急務だ。OSIのオープンソースAI定義はまもなく発表される予定であり、これを土台に企業、政府、開発者コミュニティが協力していく必要がある
- オープンウォッシングを防ぐための、消費者と開発者向けの認識向上活動も必要だ。企業の「オープン」という主張をそのまま受け入れず、実際のライセンスと慣行を注意深く確認する習慣が重要だ
2件のコメント
オープンソースとしてプロジェクトを公開して初期のバグ修正や機能改善をコミュニティに任せ、その後安定してくると再び独占ライセンスにさっと戻してしまう現象をよく見かけます。
フォークすればいいのでは、という主張もありますが、すでに定着したイメージやネームバリューを企業がそのままかっさらっていくわけです。
Hacker Newsの意見
2つのプログラムまたはAIモデルのどちらかを選ぶ際、オープンソースを好む人とそうでない人の間で議論が起きる。目標は、オープンソースではないプログラムもオープンソースのように見せることだ。
オープンソースは企業寄りの妥協だったが、一部の参加者は高い倫理観を持っていた。そのような倫理観を持つ人々が、オープンソースの乱用を防がなければならない。
商標、認証、ライセンスなどで解決できないなら、主要メディアを通じてメッセージを伝えるべきだ。<i>The Register</i> は内部事情に通じているが、一般大衆にも広く知られる必要がある。
複数の企業がオープンソースを非難しながらも、Linux、Java、Debian などのオープンソースソフトウェアに依存して事業を運営している。ほとんどの企業は、貢献や支援への義務を感じていない。
OSI は議論の余地があるオープンソースAIの定義を準備中だ。
thirdweb は技術的にはオープンソースだが、APIキーなしでは動作せず、SaaS の API 呼び出し制限にも左右される。これは真のオープンソース代替を作ろうとするチームを落胆させる。
Fair Source のような概念を大衆化できなかった結果として、小規模な非SaaS企業はオープンソースで生き残れない。
オープンソースには、自由ソフトウェアが持つ倫理や哲学がない。自由ソフトウェアはオープンソースより優れている。
大規模モデルの場合、学習コストは高く、バイナリアーティファクトは価値があり改変可能だ。OSI が定義を確立するなら、Meta がそれに従うかどうかに関係なく、その努力は称賛に値する。
OSI は、大手クラウドプロバイダーの時代に市場参加者からの保護が必要であることを認識すべきだ。Mongo、Elastic、Redis のような騒動を避けられる明確なライセンス選択肢が必要だ。
「Open <something>」という用語は、一般大衆を誤解させないよう保護されるべきだ。「OpenAI」のような混乱を防がなければならない。
「Open Source」という用語を誤用することより、コミュニティの貢献を受け入れた後でライセンスを撤回するほうが、さらに悪質な場合がある。これは詐欺と見なされるべきで、民事責任を負うべきだ。
AIモデルについて、再現可能な学習スクリプトとデータを共有しないのであれば、「Open Weights」という名称のほうが適切だ。