9 ポイント 投稿者 xguru 2024-01-18 | 5件のコメント | WhatsAppで共有
  • CodeLLaMA 7b より 60% 小さいが、コード生成時に同程度の性能を発揮する 3B パラメータサイズの LLM
  • GPU がなくても一般的なノートPCでオフライン動作が可能(MacBook Air のようなもの)
  • 4兆個の自然言語データで学習した Stable LM 3B モデルをベースに、ソフトウェアエンジニアリング/コードに関するデータで追加学習
    • 2023年 StackOverflow 開発者調査を参考にして 18のプログラミング言語を選定

5件のコメント

 
misolab 2024-01-18

金融業界なので、開発は社内ネットワーク内でしか行っていません。こういう場合は、どのようにアプローチするのがよいでしょうか?
家で Copilot のようなものを使ってみると、会社でも少し活用できたらと思って質問しています。

  • application 開発をしていて、AI はあまり詳しくありません。ヒントをいただければ一生懸命調べます
 
cosine20 2024-01-19

https://github.com/janhq/jan
オフラインでモデルを使えるようにするGUIアプリです。内部ネットワークであれば、このアプリのインストールファイルと使用するモデルファイルだけを事前に外部で受け取り、内部ネットワークへ移して使えばよさそうです。
モデルを手動で追加する方法は以下にあります。
https://jan.ai/guides/using-models/import-manually/

 
ahwjdekf 2024-01-18

ネットワーク分離された環境では、正直に言って開発者に足かせをはめるのと変わりませんね。

 
ahwjdekf 2024-01-18

最近はネットワーク分離政策の緩和に関する話も出てきていて、多少改善しようとする努力も見えているので、希望を持てるかもしれませんが、銀行や通信事業者など個人情報を扱うところは、今後もおそらく少し難しいままだと思います。開発者にとっては、あまりにも牢獄のような環境ですよね。

 
laeyoung 2024-01-18

同じように小さいモデルサイズのもの同士でしか性能比較をしていませんが、もう少し広げたリーダーボードを見るとこうですね。
https://huggingface.co/spaces/bigcode/bigcode-models-leaderboard

コード用途なのだから、なおさら多少遅かったり高価だったりしても、性能がもっと良いほうがいいのでは? という気はしますね。