14 ポイント 投稿者 xguru 2023-05-09 | 2件のコメント | WhatsAppで共有
  • 1兆トークンで学習されたトランスフォーマー
  • LLaMA-7Bと同程度の品質だが、オープンソースで商用利用可能
  • 追加で3つのファインチューニング済みモデルも公開
    • MPT-7B-Instruct、MPT-7B-Chat、MPT-7B-StoryWriter-65K+(65Kトークン対応)
  • MosaicMLプラットフォームで9.5日間、約 ~$200K のコストをかけて学習されており、独自のMPTモデルを訓練、ファインチューニング、デプロイ可能
  • MPT: Mosaic Pretrained Transformers

2件のコメント

 
kuroneko 2023-05-09

最近、商用利用可能なオープンソースLLMモデルがものすごい勢いで登場しているのを見ると、
LLM界のStable Diffusionになることを目指して競争しているように見えますね。

最終的に誰が勝者になるのか楽しみです。 +_+

 
xguru 2023-05-09

ひとまずChatGPTと先に連携して開発し、後で最も進化したオープンソースに置き換えるのが良い代案だと思います。