- 社会科学および生命科学では、ほぼすべての変数間にある程度の相関関係が存在する
- この現象は単なる偶然や統計的誤りではなく、複雑に絡み合った遺伝的・環境的要因に由来する実際の事実である
- 標本数が大きくなるほど、有意な相関関係はほとんどの変数ペアで現れ、研究者は個別の相関よりも相関パターンそのものに注目するようになる
- 「Crud factor」は、ほぼすべての変数ペアに小さな相関関係が存在することを意味し、任意の理論と変数ペアの選定だけでも高い確率で有意な結果が得られる
- このような状況では、**従来の有意水準(0.05)**が持つ意味は弱まり、社会科学の統計解釈では注意が求められる
概要と背景
- 心理学と社会学では、**「あらゆるものはある程度相互に相関している」**という主張が広く受け入れられている
- 特定の特性は複数の遺伝的および環境的要因によって決まり、これらの要因同士にもそれ自体の相関関係が存在する
- したがって、実質的にほぼすべての測定可能な変数には、ある程度の相互関連性が存在する
「Crud Factor」と統計的発見
- **「Crud factor」**とは、社会科学(および一部の生命科学)の研究において、任意の変数ペアの間にも常に小さな相関関係が存在する現象を指す
- 1966年にミネソタ州の高校生57,000人を対象に実施された大規模データでは、家族、教育、趣味活動、進路、宗教など多様な変数間の105件のクロス集計(crosstabulation)分析の結果、すべてが統計的に有意だった
- 全体の96%は p<10⁻⁶ という極めて低い確率水準で、偶然である可能性を排除した
- 変数数を45個まで広げると、合計990通りの組み合わせのうち92%が統計的に有意だった
- ある変数と他のすべての変数との有意な関係の**中央値(median)**は、44個中41個だった
実際の変数間の事例
- MCATの点数と、兄弟姉妹の数、出生順、性別、職業計画、宗教的嗜好などとの関係でも、いずれも高い統計的有意性が見出された
- 例:女子学生のほうが男子より点数が高い、兄弟姉妹が多いほど点数が下がる傾向がある、第一子・一人っ子は末っ子より賢い、宗教集団ごとに明確な差がある、など多数
- 代表的なプロテスタント5教派ごとに見ても、複数の変数との関係で高い有意性が観察された
- 例:一人っ子が Presbyterian である確率は Baptist のほぼ2倍、教派ごとの学校への好感度や職業希望の違いなど、多数の相関がある
MMPI項目の事例
- MMPI(性格検査)の550項目のうち507項目(92%)が、性別による有意な差を示した
- 一部の項目は明確な傾向の違いを比較的はっきり説明できるが、他の項目では理由が複合的、または説明不能である
- これらの結果は標本数が非常に多い大規模研究で現れるものであり、統計的誤り(type I error)ではなく実質的な現象である
社会科学における相関関係と理論検証の限界
- 任意の理論と変数ペアをランダムに組み合わせたとしても、平均相関(crud factor)が0.30程度であれば、実質的に3回に1回の頻度で有意な差を発見できる
- 通常、社会科学で意味があると見なされる有意水準(0.05)よりも、この現象のほうがはるかに頻繁に起こる
- 研究者が理論的に予測していなかった変数ペアにも相関関係が容易に現れるため、統計的有意性だけで実質的な因果関係を裏づけるのは難しい
- 複合的な原因(遺伝子/環境)と観察データの豊富さが、このような多方面の相関関係を生み出す
実践的結論
- 社会科学データの解釈と理論検証では、crud factor による**「ありふれているが実在する相関関係」**を常に念頭に置く必要がある
- 有意水準の統計(例:p<0.05)を盲信するのではなく、変数間の実質的な因果性とパターン解釈により重点を置くアプローチが必要である
- Thorndike の格言「良いものは一緒にやって来る傾向がある」が示すように、現実世界ではあまりにも多くのものが互いに絡み合っている
まだコメントはありません。