2 ポイント 投稿者 GN⁺ 2023-12-05 | 1件のコメント | WhatsAppで共有

犯罪分析と犯罪予測における誤差範囲の必要性

  • 犯罪予測には誤差範囲を含めるべきであることを強調する内容
  • リチャード・ローゼンフェルドが最近 Criminologist に寄稿した文章で、全国の犯罪率予測について論じている
  • FBIが犯罪統計を1年遅れで公表することへの不満はあるが、学術界はさらに遅れて「予測」を提供している

ARIMAモデルを使った分析

  • PythonでARIMAモデルを用いて、妥当な予測誤差がどのようなものかを分析
  • データとコードはGitHubで提供
  • データの読み込みとライブラリのインポートに関する簡単な説明とともに、データ形式を正しく設定する過程を説明

モデル適合の準備

  • リチャードの論文と似た条件でARIMA(1,1,2)モデルを適合
  • リチャードのモデルに関する説明と比較、そしてモデルの出力結果を提示

予測と誤差範囲

  • statsmodels パッケージを使って新しいデータを追加し、1ステップ先の予測を実行
  • 予測の標準誤差が時間の経過とともに増加することを示す予測結果を提示

リチャードの推定値との比較

  • リチャードの予測値と比較して、各モデルのMAPE(Mean Absolute Percentage Error)を計算
  • 予測区間を示し、観測値がなお推定モデルと整合していることを強調

最終的なポイント

  • リチャードがマクロレベルの犯罪予測で引き続き大きな誤りを犯しても重要ではないと主張
  • 国レベルの犯罪予測は政策対応には役立たないと主張
  • 実際の犯罪予測の応用例として、都市の成長に伴う警察人員増加の必要性を予測する方法を提示

GN⁺の見解

この文章で最も重要な点は、犯罪予測における誤差範囲の重要性と、予測の不確実性を認める必要性を強調していることだ。犯罪予測は政策決定に直接有用でない可能性があるとしても、予測モデリングは犯罪学理論の妥当性を検証するための重要なツールとして使うことができる。この文章は、データサイエンスと犯罪学の交差点にいる人々に興味深い洞察を提供し、予測モデルの限界とそれを克服するための方法について踏み込んだ議論を提供している。

1件のコメント

 
GN⁺ 2023-12-05
Hacker Newsの意見
  • 予測と意思決定のつながり

    • 予測は通常、意思決定につながるべき。
    • 予測が意思決定から切り離されると、その価値は不明確になる。
    • ローゼンフィールドは過去データに関する統計的結論に重みを持たせるために予測を使おうとしているようだが、これは疑わしい。
  • エラーバーの意味

    • エラーバーの意味は明確ではない。
    • 1つは信頼区間(モデルが出力がこの範囲内にある確率を95%として提示する)。
    • もう1つは標準偏差(自身の予測と結果の差の二乗を予測するもの)。
  • エラーバーの重要性

    • エラーバーは新しい処理の利点を比較する際に、よりよい理解を与える。
    • これが問題をかえってわかりにくくすると考える人もいる。
    • 意味のあるエラーバーを得るのは、場合によっては非常に難しい。
  • 統計分布の確認

    • 重要な指標のヒストグラム(統計分布)を定期的に確認している。
    • Webサービス呼び出し速度の問題では、2つの明確なピークが現れた。
    • ログアウトしたユーザーとログインしたユーザーを示す2つのピークにより、問題の原因をより深く把握できた。
  • 日付見積もりに対するエラーバー

    • 日付見積もり(つまり締め切り)にもエラーバーがあるべき。
    • 日付は予測であり、不確実性の見積もりなしでは意味がない。
  • 不確実性の定量化の重要性

    • データサイエンス、とりわけ機械学習では、不確実性の定量化がしばしば見過ごされる。
    • 実務者が常に統計の背景を持っているとは限らない。
  • 予測と測定の比較

    • 予測は未来に対する測定と見なせる。
    • 不確実性に関する知識なしに行う測定は、どれも意味がない。
  • 天気に関する誤解

    • 最初はこの記事が天気についてのものだと思った。
  • 現在または過去の予測、つまりナウキャスティング

    • データを待っている間に、現在または過去を予測する技術。
    • 誤差範囲がなければ、不正確な科学/統計にすぎない。
  • エラーバーがなくても有用な予測

    • ときには単純な点予測だけでも行動を導くのに必要なことがある。
    • 予測分布全体を知ることが、よい意思決定に役立つこともある。
  • ガウス過程回帰の利点

    • ガウス過程回帰(またはクリギング)には大きな利点がある。
  • すべての推定/予測/予報/内挿/外挿に対する信頼/予測/許容区間の必要性

    • チームがその問題に投入する仮定を含む、信頼/予測/許容区間があるべき。