過度な効率性の副作用 (2022)
(sohl-dickstein.github.io)高すぎる効率性はあらゆるものを悪化させる: 過学習と強いバージョンのグッドハートの法則
効率性が高まると、逆説的に結果が悪くなることがある。これはほとんどあらゆる場所で当てはまる。この現象を強いバージョンのグッドハートの法則と呼ぶことにする。たとえば、標準化テストによる生徒の学力の中央集権的な追跡は良いアイデアのように見えるが、学校が試験対策に集中するようになり、全体的な教育成果を悪化させる可能性がある。政治、経済、健康、科学など、多くの分野にも同様の例が存在する。
過学習とグッドハートの法則
- 過学習: 機械学習では目標を直接当てられないため、類似したプロキシを使ってモデルを訓練する。最初はプロキシが改善されると目標も改善されるが、最適化を続けると、プロキシがさらに良くなっても目標はそれ以上改善されなくなる。これを過学習と呼ぶ。
- グッドハートの法則: 測定が目標になると、良い測定ではなくなる。これは経済学だけでなく、さまざまな分野に適用される。
強いバージョンのグッドハートの法則: 効率的になりすぎると、私たちが気にしているものが悪化する
- プロキシ目標を継続的に最適化すると、目標が悪化する可能性がある。これは機械学習で非常に一般的な現象である。
- 強いバージョンのグッドハートの法則: 測定が目標となり、効果的に最適化されると、測定しようとしているものが悪化する。
効率性の向上と過学習はいたるところに存在する
- 効率性が高まると、社会全体にわたって肯定的または否定的な結果をもたらしうる。
- 例:
- 目標: 子どもたちをしっかり教育する
- プロキシ: 標準化テストの成績
- 結果: 試験対策だけに集中し、実際の教育の質が低下する
- 目標: 科学を迅速に発展させる
- プロキシ: 出版物数に応じたボーナス
- 結果: 不正確な研究結果の出版が増える
- 目標: 健康な人口
- プロキシ: 栄養価の高い食品へのアクセス
- 結果: 肥満問題
- 目標: 子どもたちをしっかり教育する
過学習と強いバージョンのグッドハートの法則を緩和する方法
- プロキシ目標と望ましい結果をよりよく一致させる: 機械学習ではテスト状況に似た訓練例を収集する。社会システムでは、法律、インセンティブ、社会規範を変更し、目標との整合性を高める。
- 正則化ペナルティを追加する: 機械学習ではパラメータの大きさを小さく保つ。社会システムでは、複雑性を減らしたり追加コストを課したりする。
- システムにノイズを注入する: 機械学習では入力、パラメータ、内部状態にランダムノイズを加える。社会システムでは、予測可能性を下げるためにランダムな要素を追加する。
- 早期停止: 機械学習では検証損失が悪化し始めたら訓練を止める。社会システムでは、意思決定時間を制限したり市場活動を停止したりする。
- 能力/容量の制限: 機械学習ではモデルを小さくして過学習を防ぐ。社会システムでは、組織やエージェントの容量を制限する。
- 能力/容量の増加: 機械学習ではモデルを非常に大きくして過学習を防ぐ。社会システムでは、能力を大幅に高めることで目標とプロキシの間のトレードオフを取り除く。
終わりに
強いバージョンのグッドハートの法則は、AIに対する個人的な恐れの根本原因である。AIはほぼあらゆる作業で効率性を高めうる。この問題を解決するための研究機会は多い。社会システムが強いバージョンのグッドハートの法則によって崩壊すると、それを解決するための合理的な行動を取ることが難しくなる。この現象に名前を与え、よりよく理解することは助けになるだろう。
GN⁺のまとめ
- 強いバージョンのグッドハートの法則は、効率性が高まると目標が悪化しうることを説明する。
- 機械学習における過学習現象と似ており、さまざまな分野に適用できる。
- プロキシ目標と実際の目標をよりよく一致させ、正則化ペナルティを追加し、システムにノイズを注入するなどの方法で問題を緩和できる。
- AIの効率性向上によってさまざまな副作用が生じうるため、それを解決するための研究が必要である。
- 社会システムが崩壊しないよう、強いバージョンのグッドハートの法則を理解して対処することが重要である。
2件のコメント
韓国の大学修学能力試験は、数学能力を測定するという当初の目的から外れ、等級カットの配分だけを効率化しようとするシステムへと変質したと聞きました。これはグッドハートの法則から逃れられていない例に見えます。
Hacker Newsの意見
JaschaはGoogle Brainにいた優れたML研究者で、現在はAnthropicにいる
dynamical isometryのような概念を通じて、非常に深いTransformerモデルの収束を達成したGoodhartの法則は、測定が目標になると良い測定ではなくなるというもの
スウェーデンではこの20年間、社会問題として浮上してきた
運動生理学にも似た法則がある
待ち行列理論にも関連する法則がある
GDPに集中するのは好ましくない
地元のハードウェア店でこの法則の例を見つけた
チェーンレストランを訪れたときにも似た経験をした
著者の名前を思い出した
効果自体は存在するが、例は正確ではない