1 ポイント 投稿者 GN⁺ 2023-08-25 | 1件のコメント | WhatsAppで共有
  • Code Llama は、コーディング作業のために特別に設計された最先端の大規模言語モデル(LLM)です。
  • コードと自然言語のプロンプトの両方から、コードおよびコードに関する自然言語を生成できます。
  • Code Llama は Llama 2 をベースに構築されており、基本的なコードモデル、Python 特化モデル、自然言語の指示を理解するようにファインチューニングされたモデルの3種類で提供されます。
  • このモデルは研究用途と商用利用の両方で無料であり、コード関連タスクにおいて他の公開利用可能な LLM を上回ります。
  • Code Llama は、プログラマーがより堅牢で十分に文書化されたソフトウェアを書くのを支援する生産性ツールとして、またコードを学ぶ人々の参入障壁を下げる教育ツールとして利用できます。
  • このモデルは Python、C++、Java、PHP、Typescript (Javascript)、C#、Bash など多くの人気言語をサポートしています。
  • Code Llama は、それぞれ 7B、13B、34B のパラメータを持つ3つのサイズで提供され、各モデルはコードおよびコード関連データの 500B トークンで学習されています。
  • さまざまなモデルは異なるサービスやレイテンシ要件に合わせて提供されており、34B モデルは最高の結果を示し、小型モデルは高速かつ低レイテンシが求められるタスクにより適しています。
  • Code Llama は最大 100,000 トークンのコンテキストを処理できるため、より長いプログラムの生成や、より大規模なコードベースのデバッグに役立ちます。
  • Code Llama - Python と Code Llama - Instruct という2つの追加バリアントもファインチューニングされており、それぞれ Python コードに特化し、自然言語で有用かつ安全な応答を生成するよう調整されています。
  • Code Llama は、HumanEval と Mostly Basic Python Programming(MBPP)コーディングベンチマークを用いた評価で、他のオープンソースのコード専用 LLM や Llama 2 を上回りました。
  • Code Llama の公開前には安全対策が講じられており、これにはモデルが悪意のあるコードを生成するリスクに対する定量的評価が含まれていました。
  • Code Llama のトレーニングレシピとモデル重みは GitHub で利用可能であり、その開発、ベンチマーク評価、限界、今後の課題については研究論文で詳しく説明されています。
  • Code Llama の開発者たちは、AI モデル、特にコーディング向け LLM はオープンなアプローチから最も大きな利益を得られると考えており、それによってコミュニティ全体がその能力を評価し、問題を特定し、脆弱性を修正できるようになります。
  • 開発者には Code Llama を責任を持って使用することが推奨されており、これには派生モデルの開発、コンテンツポリシーの定義、データ準備、モデルのファインチューニング、性能評価と改善、リスク対応、ユーザーとの相互作用における透明性、報告メカニズムの構築に関する指針に従うことが含まれます。
  • Code Llama は、あらゆる分野のソフトウェアエンジニアを支援し、また他の人々が Llama 2 を活用して研究や商用製品向けの新しい革新的なツールを生み出すきっかけとなるよう設計されています。

1件のコメント

 
GN⁺ 2023-08-25
Hacker Newsの意見
  • Code Llamaは、コーディング向けに特別に設計された新しい大規模言語モデルです。
  • このモデルは最大100,000トークンのコンテキストを処理でき、安定した生成を提供します。
  • 一部のユーザーは、16kトークン以降で中核的な検索精度が低下するとして、100kコンテキストの有用性に疑問を呈しています。
  • Code Llamaの7Bモデルは、GitHubのCopilotを支えるモデルであるCodexと競争力があると見られています。
  • ユーザーは、34B Python 4 bit quantizedモデルの潜在力に興奮しています。
  • 100Kトークンを超えるコードベースを扱う組み込みコードモデルについて疑問があります。
  • こうしたモデルの開発は、これらのツールを最適化するためのコーディング慣行が変化する可能性についての議論を促しています。
  • ユーザーは、Rust、Linux、ゲノミクス、物理モデリングなど他のドメイン向けの特化型大規模言語モデルを作り、協力して問題を解決する可能性に関心を持っています。
  • 最上位モデルであるUnnatural Code Llamaはまだリリースされておらず、これはOpenAIの利用規約に違反する可能性があるためかもしれません。
  • ユーザーは、Code LlamaやCode Pilotのようなツールの有用性を、GPT-4を直接使うことと比較しています。
  • こうしたモデルを動かすのに必要なハードウェア要件を理解したいという関心があり、一部のユーザーは自分のソースコードを巨大テック企業にアップロードせずにこれらのモデルを使いたいと考えています。