Stability AI、コーディング向けLLMモデル Stable Code 3B を公開
(stability.ai)- CodeLLaMA 7b より 60% 小さいが、コード生成時に同程度の性能を発揮する 3B パラメータサイズの LLM
- GPU がなくても一般的なノートPCでオフライン動作が可能(MacBook Air のようなもの)
- 4兆個の自然言語データで学習した Stable LM 3B モデルをベースに、ソフトウェアエンジニアリング/コードに関するデータで追加学習
- 2023年 StackOverflow 開発者調査を参考にして 18のプログラミング言語を選定
5件のコメント
金融業界なので、開発は社内ネットワーク内でしか行っていません。こういう場合は、どのようにアプローチするのがよいでしょうか?
家で Copilot のようなものを使ってみると、会社でも少し活用できたらと思って質問しています。
https://github.com/janhq/jan
オフラインでモデルを使えるようにするGUIアプリです。内部ネットワークであれば、このアプリのインストールファイルと使用するモデルファイルだけを事前に外部で受け取り、内部ネットワークへ移して使えばよさそうです。
モデルを手動で追加する方法は以下にあります。
https://jan.ai/guides/using-models/import-manually/
ネットワーク分離された環境では、正直に言って開発者に足かせをはめるのと変わりませんね。
最近はネットワーク分離政策の緩和に関する話も出てきていて、多少改善しようとする努力も見えているので、希望を持てるかもしれませんが、銀行や通信事業者など個人情報を扱うところは、今後もおそらく少し難しいままだと思います。開発者にとっては、あまりにも牢獄のような環境ですよね。
同じように小さいモデルサイズのもの同士でしか性能比較をしていませんが、もう少し広げたリーダーボードを見るとこうですね。
https://huggingface.co/spaces/bigcode/bigcode-models-leaderboard
コード用途なのだから、なおさら多少遅かったり高価だったりしても、性能がもっと良いほうがいいのでは? という気はしますね。