Yi - 次世代オープンソース二言語LLM
(github.com/01-ai)- 開発者によってゼロから訓練された次世代オープンソース大規模言語モデル
- 二言語モデルを目標として3Tの多言語コーパスで訓練されており、言語理解、常識推論、読解能力などで強力な性能を示す
- 6Bと34Bの事前学習済み言語モデルをベースとしており、チャットボットモデル、200K長文コンテキストモデル、深度アップスケーリングモデル、ビジョン言語モデルへと拡張
- Yi-34B-Chatモデルは
- AlpacaEvalリーダーボードでGPT-4 Turboに次ぐ2位を獲得し、他のLLMを上回る
- 英語と中国語の両方で既存のオープンソースモデルを上回り、さまざまなベンチマークで1位を獲得
- Llamaと同じモデルアーキテクチャを採用しているが、Llamaの派生モデルではない。Llamaの重みは使用していない
- さまざまなサイズで提供されており、特定の要件に合わせてモデルをファインチューニングできる
- チャットモデル
- Yi-34B-Chat, Yi-34B-Chat-4bits, Yi-34B-Chat-8bits
- Yi-6B-Chat, Yi-6B-Chat-4bits, Yi-6B-Chat-8bits
- ベースモデル
- Yi-34B, Yi-34B-200K
- Yi-9B
- Yi-6B, Yi-6B-200K
- チャットモデル
1件のコメント
Hacker Newsの意見