イリヤ・サツケバー: 「これらをすべて学べば、重要なことの90%は理解できるでしょう」
(reddit.com)イリヤ・サツケバーが機械学習/AI関連で推薦したリーディングリスト
- The Annotated Transformer
- The First Law of Complexodynamics
- The Unreasonable Effectiveness of RNNs
- Understanding LSTM Networks
- Recurrent Neural Network Regularization
- Keeping Neural Networks Simple by Minimizing the Description Length of the Weights
- Pointer Networks
- ImageNet Classification with Deep CNNs
- Order Matters: Sequence to sequence for sets
- GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism
- Deep Residual Learning for Image Recognition
- Multi-Scale Context Aggregation by Dilated Convolutions
- Neural Quantum Chemistry
- Attention Is All You Need
- Neural Machine Translation by Jointly Learning to Align and Translate
- Identity Mappings in Deep Residual Networks
- A Simple NN Module for Relational Reasoning
- Variational Lossy Autoencoder
- Relational RNNs
- Quantifying the Rise and Fall of Complexity in Closed Systems: The Coffee Automaton
- Neural Turing Machines
- Deep Speech 2: End-to-End Speech Recognition in English and Mandarin
- Scaling Laws for Neural LMs
- A Tutorial Introduction to the Minimum Description Length Principle
- Machine Super Intelligence Dissertation
- PAGE 434 onwards: Komogrov Complexity
- CS231n Convolutional Neural Networks for Visual Recognition
リンク集: https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE
3件のコメント
Neoのボットクローリング問題があるようですね。
Redditでブロックされているようです。手作業で入れておきました ;)
Hacker Newsの意見
Hacker Newsコメントまとめ要約
見出しはこの作業の範囲を実態より小さく見せている。中身を見に行くと、次のようなものが含まれている:
少し前に自分もこの一覧を リンク にコピーしたので、
wgetしやすくなっている(たとえば arXiv の PDF をまとめて取得できる)wgetコマンドを使ってすべての arXiv PDF をダウンロードできる。pdfuniteを使って1つの PDF に結合し、印刷所でスパイラル製本してもらった。仕上がりはとても良かった。これは実際の一覧だという確認が取れていない点に注意。
すでに CS のバックグラウンドがない場合、これらを学ぶ前提知識を身につけるのにどれくらいかかるのか?
人々が忘れがちなのは、適切で具体的な目標がなければ、どれだけ重要な論文や面白い論文を読んでも結局何も覚えていないということだ。
2022年10月までさかのぼる過去の議論がいくつかある。この一覧が今ではどれほど古くなっているのか気になる。
これは単なる誰かのブックマークフォルダでは? これが Ilya に推薦されたものだという証拠はどこにある?
これが ML で重要なことの90%だという主張は、少し大胆すぎるように思える。
ここには LLM について何もなく、in-context learning、retrieval augmentation、tool using、multi-modality のように本当に最前線で盛り上がっている分野が抜けている。
30本の研究を読んだからといって「学び、理解した」ことにはならない。特にゼロから始めるならなおさらだ。