Lit-LLaMA - nanoGPTベースのオープンソースLLaMA実装
(github.com/Lightning-AI)- GPLライセンスのLLaMAコードの代わりに、nanoGPTベースでApache 2.0ライセンスとして完全に別開発されたオープンソース
- boilerplateなしで単一ファイルとして実装されており、シンプルで既存モデルと数値的に同一
- FlashAttention、量子化、LoRAファインチューニング、事前学習などをサポート
- コンシューマー向けハードウェアで動作するよう最適化
1件のコメント
nanoGPT は、TeslaのAI責任者だった Andrej Karpathy が minGPT を書き直したコードです。
nanoGPT - 中規模GPTを最速で訓練・ファインチューニングするためのオープンソース
FlashAttention