真のオープンLLM、Hello OLMo登場
(blog.allenai.org)-
AI2がOLMo 7Bモデルを公開。事前学習データと学習コードをあわせて公開した、真の意味でのオープンソース大規模言語モデル。
- 研究者と開発者が最高水準のオープンモデルを使い、協調して言語モデル科学を発展させられるようにする。
- MetaのAI科学者Yann LeCunは、オープンソースコミュニティこそがAIの未来を最も速く効果的に築けると述べている。
-
OLMoフレームワークの主な特徴:
- 完全な事前学習データ: AI2のDolmaデータセットを使用し、学習データを生成するコードも含まれる。
- 学習コードとモデル重み: 7Bスケールの4種類のモデル変種について、完全なモデル重み、推論コード、学習指標、学習ログなどを提供。
- 評価: Catwalkプロジェクトのもとで、500以上のチェックポイントと評価コードなど、開発に使われた評価ツールを公開。
-
OLMoによって、AI研究者と開発者は次のような体験ができる:
- より正確な分析: 学習データへの完全な洞察をもとに、より速く作業できる。
- 炭素排出の削減: 学習と評価のエコシステム全体を公開することで、重複開発を減らせる。
- 継続的な成果: モデルとデータセットを公開することで、以前のモデルから学び、その上に構築できる。
-
AMD、CSC(Lumi Supercomputer)、University of Washington、Databricksなどとの協力を通じて、OLMoの開発が可能になった。
GN⁺の見解
- AIモデルの透明性向上のために学習データとコードを公開したことは大きな意義があるように見える。ただし、データのバイアスなどの問題があり得るため、その点の検討も必要だろう。
- オープンソース言語モデルのエコシステム活性化により、技術発展は加速しそうだ。一方で、大手IT企業のクローズドなAIモデルとの競争でどのような成果を出せるかは見守る必要がある。
- AI開発に必要な莫大な計算資源を確保するため、さまざまな機関との協力は非常に重要に見える。産学連携モデルとして良い手本になりそうだ。
- OLMoによって言語モデルの動作原理に関する科学的研究が活発になることが期待される。これは、より安全で信頼できるAI開発につながる可能性がある。
1件のコメント
Hacker Newsの意見