SantaCoder - 11億個(1.1B)パラメータで学習したコード生成モデル (huggingface.co) 6 ポイント 投稿者 xguru 2022-12-29 | 2件のコメント | WhatsAppで共有 Python、Java、Javascript のコードで学習したマルチ言語モデル LTR 生成および Infilling において、Facebook の InCoder(6.7B)/ Salesforce の CodeGen-Multi(2.7B)より優れているとのこと BigCode が公開した The-Stack v1.1(6TB)データセットの一部を使用 関連記事 StarCoder、BigCodeプロジェクトが公開したコード向けLLM 16 ポイント · 3件のコメント · 2023-05-08 Replit Code - 10日で学習されたオープンソースのコード生成LLM 19 ポイント · 2件のコメント · 2023-05-04 BigCode - オープンソースで作るコード生成向けAI開発プロジェクト 10 ポイント · 4件のコメント · 2022-09-29 OpenCoder: 最先端のコードLLMのためのオープン・クックブック 12 ポイント · 1件のコメント · 2024-11-10 Code Alpaca - コード生成命令で訓練された LLaMA 21 ポイント · 0件のコメント · 2023-03-27 2件のコメント siabard 2022-12-29 今はAIプロジェクトがパラメータ性能頼みでかなり押し進めていますが、価格をどの程度に設定すれば収益性を担保できるのか気になりますね。CoPilotのように月額$10で本当にコストを賄えるのか……。 (大企業の心配をするのは無意味だとは分かっていますが……) xguru 2022-12-29 GitHubのCopilotは12Bですが、生成コードの品質面ではそれとは多少差があるようですね。
2件のコメント
今はAIプロジェクトがパラメータ性能頼みでかなり押し進めていますが、価格をどの程度に設定すれば収益性を担保できるのか気になりますね。CoPilotのように月額$10で本当にコストを賄えるのか……。 (大企業の心配をするのは無意味だとは分かっていますが……)
GitHubのCopilotは12Bですが、生成コードの品質面ではそれとは多少差があるようですね。