予測には誤差範囲が必要です
(andrewpwheeler.com)犯罪分析と犯罪予測における誤差範囲の必要性
- 犯罪予測には誤差範囲を含めるべきであることを強調する内容
- リチャード・ローゼンフェルドが最近 Criminologist に寄稿した文章で、全国の犯罪率予測について論じている
- FBIが犯罪統計を1年遅れで公表することへの不満はあるが、学術界はさらに遅れて「予測」を提供している
ARIMAモデルを使った分析
- PythonでARIMAモデルを用いて、妥当な予測誤差がどのようなものかを分析
- データとコードはGitHubで提供
- データの読み込みとライブラリのインポートに関する簡単な説明とともに、データ形式を正しく設定する過程を説明
モデル適合の準備
- リチャードの論文と似た条件でARIMA(1,1,2)モデルを適合
- リチャードのモデルに関する説明と比較、そしてモデルの出力結果を提示
予測と誤差範囲
statsmodelsパッケージを使って新しいデータを追加し、1ステップ先の予測を実行- 予測の標準誤差が時間の経過とともに増加することを示す予測結果を提示
リチャードの推定値との比較
- リチャードの予測値と比較して、各モデルのMAPE(Mean Absolute Percentage Error)を計算
- 予測区間を示し、観測値がなお推定モデルと整合していることを強調
最終的なポイント
- リチャードがマクロレベルの犯罪予測で引き続き大きな誤りを犯しても重要ではないと主張
- 国レベルの犯罪予測は政策対応には役立たないと主張
- 実際の犯罪予測の応用例として、都市の成長に伴う警察人員増加の必要性を予測する方法を提示
GN⁺の見解
この文章で最も重要な点は、犯罪予測における誤差範囲の重要性と、予測の不確実性を認める必要性を強調していることだ。犯罪予測は政策決定に直接有用でない可能性があるとしても、予測モデリングは犯罪学理論の妥当性を検証するための重要なツールとして使うことができる。この文章は、データサイエンスと犯罪学の交差点にいる人々に興味深い洞察を提供し、予測モデルの限界とそれを克服するための方法について踏み込んだ議論を提供している。
1件のコメント
Hacker Newsの意見
予測と意思決定のつながり
エラーバーの意味
エラーバーの重要性
統計分布の確認
日付見積もりに対するエラーバー
不確実性の定量化の重要性
予測と測定の比較
天気に関する誤解
現在または過去の予測、つまりナウキャスティング
エラーバーがなくても有用な予測
ガウス過程回帰の利点
すべての推定/予測/予報/内挿/外挿に対する信頼/予測/許容区間の必要性