- Code Llama は、コーディング作業のために特別に設計された最先端の大規模言語モデル(LLM)です。
- コードと自然言語のプロンプトの両方から、コードおよびコードに関する自然言語を生成できます。
- Code Llama は Llama 2 をベースに構築されており、基本的なコードモデル、Python 特化モデル、自然言語の指示を理解するようにファインチューニングされたモデルの3種類で提供されます。
- このモデルは研究用途と商用利用の両方で無料であり、コード関連タスクにおいて他の公開利用可能な LLM を上回ります。
- Code Llama は、プログラマーがより堅牢で十分に文書化されたソフトウェアを書くのを支援する生産性ツールとして、またコードを学ぶ人々の参入障壁を下げる教育ツールとして利用できます。
- このモデルは Python、C++、Java、PHP、Typescript (Javascript)、C#、Bash など多くの人気言語をサポートしています。
- Code Llama は、それぞれ 7B、13B、34B のパラメータを持つ3つのサイズで提供され、各モデルはコードおよびコード関連データの 500B トークンで学習されています。
- さまざまなモデルは異なるサービスやレイテンシ要件に合わせて提供されており、34B モデルは最高の結果を示し、小型モデルは高速かつ低レイテンシが求められるタスクにより適しています。
- Code Llama は最大 100,000 トークンのコンテキストを処理できるため、より長いプログラムの生成や、より大規模なコードベースのデバッグに役立ちます。
- Code Llama - Python と Code Llama - Instruct という2つの追加バリアントもファインチューニングされており、それぞれ Python コードに特化し、自然言語で有用かつ安全な応答を生成するよう調整されています。
- Code Llama は、HumanEval と Mostly Basic Python Programming(MBPP)コーディングベンチマークを用いた評価で、他のオープンソースのコード専用 LLM や Llama 2 を上回りました。
- Code Llama の公開前には安全対策が講じられており、これにはモデルが悪意のあるコードを生成するリスクに対する定量的評価が含まれていました。
- Code Llama のトレーニングレシピとモデル重みは GitHub で利用可能であり、その開発、ベンチマーク評価、限界、今後の課題については研究論文で詳しく説明されています。
- Code Llama の開発者たちは、AI モデル、特にコーディング向け LLM はオープンなアプローチから最も大きな利益を得られると考えており、それによってコミュニティ全体がその能力を評価し、問題を特定し、脆弱性を修正できるようになります。
- 開発者には Code Llama を責任を持って使用することが推奨されており、これには派生モデルの開発、コンテンツポリシーの定義、データ準備、モデルのファインチューニング、性能評価と改善、リスク対応、ユーザーとの相互作用における透明性、報告メカニズムの構築に関する指針に従うことが含まれます。
- Code Llama は、あらゆる分野のソフトウェアエンジニアを支援し、また他の人々が Llama 2 を活用して研究や商用製品向けの新しい革新的なツールを生み出すきっかけとなるよう設計されています。
1件のコメント
Hacker Newsの意見