逐次採点バイアスに関する研究結果
- ミシガン大学の研究チームが3,000万件以上のCanvas成績記録を分析した結果、アルファベット順で後ろに位置する姓を持つ学生ほど、より低い点数を受ける傾向がある
- これは逐次採点バイアスと、Canvasで学生の提出物のデフォルト順序が姓のアルファベット順に基づいているため
- アルファベット順で不利な学生は、より否定的で丁寧さに欠けるコメントを受け、学生の事後的な成績への不満で測定した採点品質も低い
- 研究チームは採点の公平性と正確性について多く考えていたが、データを見て順序が差を生むと気づくまで、この問題を認識していなかったという
研究データと結果
- 2014年秋学期から2022年夏学期まで、Canvasにあるすべてのプログラム、学生、課題について利用可能な過去データを収集
- 大学の登録データで補完し、学生の背景、人口統計、大学での学習軌跡に関する詳細情報を含めた
- データはミシガン大学のものだが、研究チームは学習管理システムに共通する設計上の問題により、他の機関やコースにも一般化できると述べている
- 学生の課題を名前のアルファベット順に並べるデフォルト設定に起因する
- 評価者がより多くの課題を採点するほど、採点品質が低下する明確なパターンを発見
- A、B、C、D、Eで始まる姓を持つ学生は、無作為に採点された場合より100点満点で0.3点高い点数を受ける
- 同様に、アルファベット後半の姓を持つ学生は0.3点低い点数を受け、合計で0.6点の差が生じる
- 0.6点差は小さく見えるが、このような不一致は学生の科目GPAに影響し、それぞれのキャリアパスにおける機会へ悪影響を及ぼす
研究の背景と提案
- この研究アイデアは、教育技術を研究するワンとAIを研究するペイが研究について議論している最中に生まれた
- 機械学習の基本作業であるデータラベリングも長く退屈になりうる連続作業だが、無作為に行われる点に注目した
- 予備研究を通じて、採点時間に伴う成績の不均衡があるかを確認した
- 研究チームは、疲労がこうした効果を引き起こす主要因の一つである可能性が高いと推測している
- 長時間何かを続けると疲れ、注意力が落ち、認知能力が低下する
- Canvasや他のオンライン学習管理システムには、課題を無作為の順序で採点するオプションがあり、一部の教育者は利用しているが、デフォルトモードはアルファベット順
- 簡単な解決策は、デフォルト設定を無作為順にすること
- また、学術機関には、大規模授業により多くの採点者を雇うこと、作業量をより多くの人に分配すること、あるいはバイアスを認識して減らすための訓練を行うことを提案している
GN⁺の意見
- 逐次採点バイアスが学生の成績に実質的な影響を与えるという点は、教育評価システムの公平性の問題を提起している。成績が学生の将来に大きく影響するだけに、改善は急務に見える
- ただし英語圏の国に限定された研究であり、日本では大きな問題にならない可能性もある。五十音順や漢字の画数順にした場合にも同じ現象が現れるのか、国内研究が必要に思われる
- 評価者の疲労度が採点品質に影響する点は、教育現場で評価業務に対する適切な報酬と支援が必要であることを示唆している。過度な業務負担は公正な評価を損なう可能性がある
- AIベースの自動採点システムの導入も一つの代替策になりうる。ただし、バイアスの問題が完全に解消されるとは限らず、評価の質的な側面を補う方策もあわせて求められる
1件のコメント
Hacker Newsの意見
以下はHacker Newsのコメントを要約した内容です: