nano-llama31 - nanoGPTスタイルのLlama 3.1版

xguru · 2024-08-08T10:02:02+09:00

Andrej Karpathyが実装したnanoGPTスタイルのLlama 3.1版依存関係のない最小限のLlama 3.1アーキテクチャ実装で、非常に簡単に学習、ファインチューニング、推論が可能 MetaやHuggingFaceの実装より依存関係が少なく、コードも小さい現在はLlama 3.1の8Bベースモデルに重点を置いている WIP: まだ開発中で、完成版ではない

(github.com/karpathy)

9 ポイント投稿者 xguru 2024-08-08 | まだコメントはありません。 | WhatsAppで共有

Andrej Karpathyが実装したnanoGPTスタイルのLlama 3.1版
依存関係のない最小限のLlama 3.1アーキテクチャ実装で、非常に簡単に学習、ファインチューニング、推論が可能
- MetaやHuggingFaceの実装より依存関係が少なく、コードも小さい
現在はLlama 3.1の8Bベースモデルに重点を置いている
WIP: まだ開発中で、完成版ではない

nano-llama31 - nanoGPTスタイルのLlama 3.1版

関連記事

まだコメントはありません。