NumPy 60行でGPTを実装する
(jaykmody.com)- Python と NumPy に慣れていることを前提に、シンプルに GPT を実装し、OpenAI が公開した GPT-2 モデルをロードしてテキスト生成を試すチュートリアル
目次
- GPT とは何か
- セットアップ : Encoder、Hyperparameters、Parameters
- Basic Layers : GeLU、Softmax、Layer Normalization、Linear
- GPT アーキテクチャ
- Embeddings
- Decoder Stack
- Vocab への射影
- Decoder Block
- Position-wise Feed Forward Network
- Multi-Head Causal Self Attention
- すべてを組み合わせる
- What's Next?
- GPU/TPU Support
- Backpropagation
- Batching
- Inference Optimization
- Training
- Evaluation
- Architecture Improvements
まだコメントはありません。