9 ポイント 投稿者 xguru 2024-08-08 | まだコメントはありません。 | WhatsAppで共有
  • Andrej Karpathyが実装したnanoGPTスタイルのLlama 3.1版
  • 依存関係のない最小限のLlama 3.1アーキテクチャ実装で、非常に簡単に学習、ファインチューニング、推論が可能
    • MetaやHuggingFaceの実装より依存関係が少なく、コードも小さい
  • 現在はLlama 3.1の8Bベースモデルに重点を置いている
  • WIP: まだ開発中で、完成版ではない

まだコメントはありません。

まだコメントはありません。