32 ポイント 投稿者 xguru 2023-02-13 | まだコメントはありません。 | WhatsAppで共有
  • Python と NumPy に慣れていることを前提に、シンプルに GPT を実装し、OpenAI が公開した GPT-2 モデルをロードしてテキスト生成を試すチュートリアル

目次

  • GPT とは何か
  • セットアップ : Encoder、Hyperparameters、Parameters
  • Basic Layers : GeLU、Softmax、Layer Normalization、Linear
  • GPT アーキテクチャ
    • Embeddings
    • Decoder Stack
    • Vocab への射影
    • Decoder Block
    • Position-wise Feed Forward Network
    • Multi-Head Causal Self Attention
  • すべてを組み合わせる
  • What's Next?
    • GPU/TPU Support
    • Backpropagation
    • Batching
    • Inference Optimization
    • Training
    • Evaluation
    • Architecture Improvements

まだコメントはありません。

まだコメントはありません。