StarCoder、BigCodeプロジェクトが公開したコード向けLLM
(huggingface.co)- 80以上のプログラミング言語について、1兆トークンで学習された15.5Bモデル
- 効率的な生成のためにMQAを使用し、8192トークンのコンテキストウィンドウを持つ
- StarCoderBase : 80以上の言語データを持つThe-Stack v1.2(6TB)データセットで学習
- StarCoder : Pythonについてさらに追加学習したモデル
- Chat DemoおよびVSCode向け拡張機能を提供
3件のコメント
Twitterの告知投稿にある論文リンクです。 :)
https://drive.google.com/file/d/1cN-b9GnWtHzQRoE7M7gAEyivY0kl4BYs/view
HuggingFace Chatですぐに使えるようにも公開されていますね。 :)
https://huggingface.co/chat/?model=bigcode/starcoder
SantaCoder - 11億(1.1B)パラメータで学習したコード生成モデル