ExcelでAIを学ぶ
- Excelで実装された実際のLLMを通じて、AIがどのように動作するのかを学ぶ
- GPT-2のForward Passを外部API呼び出しなしで、Excel関数だけで実装
- スプレッドシートを理解できればAIを理解できることを目指す
- レッスン1: ExcelでGPTを理解する
- レッスン2: Byte Pair Encoding と Tokenization
- 追加: Excel実装を詳細に見ていく(Transformersを理解している人向け)
- XLSB(Excel Binary)形式なので、ダウンロードして実行可能(Mac/Windows対応だがWindows推奨)
- 実装上の制限
- BPE、マルチヘッドAttention、マルチレイヤーPerceptronステージを含む、小型の完全なGPT-2(124Mパラメータ)モデル
- 推論/Forward Passのみ可能(学習なし)
- コンテキストは10トークン長に制限
- 1単語あたり10文字に制限
- Zero Temperature出力のみ可能
FAQ
- Google Sheetsについて: このプロジェクトはGoogle Sheetsから始まったが、モデル全体が大きすぎたためExcelへ移行した。Google Sheetsで動作させる方法は引き続き模索中だが、単一ファイルではExcelのようには収まらない可能性が高い。
- ChatGPTのように対話できない理由: 非常に短いコンテキスト長に加え、対話型チャットボットにするための指示チューニングと、人間のフィードバックからの強化学習(RLHF)が不足しているため。
- 名前の由来: 「Spreadsheets-are-all-you-need」という名前は、Transformerの機械学習アーキテクチャを最初に説明した有名な論文「Attention Is All You Need」のタイトルをもじって付けられた。
GN⁺の意見
- このプロジェクトは、AIと機械学習へのアクセシビリティ向上に貢献している。Excelのような身近なツールを使って複雑な技術を理解できるようにすることで、非専門家にもAIの基本原理を学ぶ機会を提供している。
- Excelによる実装は、実際のAIモデルの動作を視覚的に理解するのに有用だが、実際のAI開発に使われるものではない。したがって、この方法でAIを学んだからといって専門のAI開発者になれるわけではない。
- このような教育ツールは、AIに対する一般大衆の関心を高め、AI技術の民主化に貢献しうる。しかし実際のAIシステムを構築する際には、より専門的なツールやフレームワークが必要になる。
- 類似の教育目的プロジェクトとしては、GoogleのMachine Learning Crash Courseや、CourseraでのAndrew Ng教授のMachine Learning講座などがある。これらの講座は理論と実践を組み合わせ、より深い学習を提供している。
- この技術を導入する際には、実際のAIモデル開発とは異なるアプローチが必要であることを理解しなければならない。このプロジェクトは教育目的に焦点を当てており、実際のAI開発プロジェクトではTensorFlowやPyTorchのような専門的なAIフレームワークを使うのが一般的である。
2件のコメント
Hacker Newsのコメント
クリエイターのあいさつと感謝
スプレッドシートを使ったニューラルネットワーク教育
スプレッドシートでニューラルネットワークを説明
スプレッドシートのリンク共有
RLHFの必要性に関する質問
GPT-2をスプレッドシートに実装した方法への感嘆
スプレッドシートでのGPT-3またはGPT-4実装可能性
LLMの理解に役立つ素晴らしいプロジェクト
ExcelでのPDE解法事例の共有
投資銀行を顧客にするAI企業