Code Llama - コーディングのための最先端大規模言語モデル

kuroneko · 2023-08-25T09:35:56+09:00

MetaがLlama 2をベースに構築した、コーディング専用モデルのCode Llamaを公開。コードおよび自然言語プロンプトからコード生成が可能で、独自ベンチマークではChatGPTより高い性能を示した。 5,000億のコードトークンと関連データで学習した7B、13B、34Bモデルをそれぞれ公開。最大10万コンテキストトークンをサポートし、より長いプログラムを書いたり、詳細な条件や実際のコードをプロンプトとして入力しやすい。 Code Llamaはベースモデルに加えて、2つの追加バリアントも公開。 Code Llama - Python: 1,000億のPythonコードトークンを追加してファインチューニングしたモデル。 Code Llama - Instruct: 50億の命令トークンでファインチューニングした、自然言語入力とコード出力に最適化されたモデル。他のモデルは自然言語に最適化されていないため、自然言語からコードを生成する際はこのモデルを使う必要がある。 HumanEval、MBPPでモデル性能を測定した結果、ChatGPT（GPT 3.5）と同等またはそれ以上の性能を示した。 GPT 3.5がHumanEvalで48.1%を記録したのに対し、Code Llama - Pythonは53.7%を記録。 GPT 4は67%で、まだ差がある。 Code Llamaが悪意あるコードを生成するリスクを最小化するため、さまざまな安全対策を追加。実際のテストでは、ChatGPTと比べて生成される悪意あるコードが少ないことが確認された。

(ai.meta.com)

22 ポイント投稿者 kuroneko 2023-08-25 | 2件のコメント | WhatsAppで共有

MetaがLlama 2をベースに構築した、コーディング専用モデルのCode Llamaを公開。
コードおよび自然言語プロンプトからコード生成が可能で、独自ベンチマークではChatGPTより高い性能を示した。
5,000億のコードトークンと関連データで学習した7B、13B、34Bモデルをそれぞれ公開。
最大10万コンテキストトークンをサポートし、より長いプログラムを書いたり、詳細な条件や実際のコードをプロンプトとして入力しやすい。
Code Llamaはベースモデルに加えて、2つの追加バリアントも公開。
- Code Llama - Python: 1,000億のPythonコードトークンを追加してファインチューニングしたモデル。
- Code Llama - Instruct: 50億の命令トークンでファインチューニングした、自然言語入力とコード出力に最適化されたモデル。
  - 他のモデルは自然言語に最適化されていないため、自然言語からコードを生成する際はこのモデルを使う必要がある。
HumanEval、MBPPでモデル性能を測定した結果、ChatGPT（GPT 3.5）と同等またはそれ以上の性能を示した。
- GPT 3.5がHumanEvalで48.1%を記録したのに対し、Code Llama - Pythonは53.7%を記録。
- GPT 4は67%で、まだ差がある。
Code Llamaが悪意あるコードを生成するリスクを最小化するため、さまざまな安全対策を追加。
- 実際のテストでは、ChatGPTと比べて生成される悪意あるコードが少ないことが確認された。

2件のコメント

xguru 2023-08-25

ライセンスはLlamaと同じですね。MAUが7億人を超えると、ライセンスの申請が必要です。まあ韓国企業には大きな問題はなさそうですね（笑）

kuroneko 2023-08-25

Llama 2と同じライセンスで公開されました。
StarCoderも少し物足りないと聞いていましたが、ついに本当のCopilotの代替が現れたのでしょうか？

いずれにせよ、こういうことを考えるとGPT 4の性能は本当にすごいのだと思います。
日本語も得意で、ベンチマークでもGPT 4の性能がはるかに高いと出ていますし…。

GPT 3.5も日本語は他のオープンモデルに比べて圧倒的です。

日本語でも動作するオープンソースのコード生成モデルが登場することを願います。

Code Llama - コーディングのための最先端大規模言語モデル

関連記事

2件のコメント