1 ポイント 投稿者 GN⁺ 2026-01-26 | 1件のコメント | WhatsAppで共有
  • 企業の持続可能性と株価パフォーマンスの相関関係を主張した論文が6,000回以上引用されたが、重大な誤りと虚偽の記述が明らかになった
  • 研究の再現を試みたAndy Kingは、著者、学界、ジャーナル、大学のいずれもが、自身の訂正と検証の要請を繰り返し無視したと述べている
  • 論文には、統計的有意性の誤記方法論の誤記非現実的な標本マッチングなど多数の問題が含まれ、一部は単純な誤植として処理された
  • KingはLinkedInでの公開と複製研究専門ジャーナル(JOMSR) を通じて問題提起したが、Harvard Business SchoolとLondon Business Schoolは軽微な事案だと結論づけた
  • 著者は今なお論文を撤回しておらず、記事は科学的信頼性を管理するシステムの崩壊と改革の必要性を強調している

問題の論文と再現の試み

  • 論文 “The Impact of Corporate Sustainability on Organizational Processes and Performance” は6,000回以上引用され、ウォール街の経営幹部や元米国副大統領まで引用した影響力のある研究と評価されている
  • Andy Kingはこの論文を再現しようとして、方法論の不一致、統計的誤り、欠落した検定、異常な標本構成を発見した
    • 著者に何度もメールを送ったが、返答はなかった
    • 既存研究には、再現・複製(Replication)研究者からの要請を無視または遅延させる慣行が一般的だとする Bloomfield et al.(2018) の研究もある

学界とジャーナルの対応

  • Kingは同僚研究者たちに協力を求めたが、多くは対立回避時間不足を理由に断った
    • 一部の研究者は「出版済み論文の誤りを指摘することの方がキャリアにとって不利だ」と述べた
  • ジャーナル Management Science に批判的コメントを投稿したが、「論調が不適切だ」 という理由で却下された
    • 著者らは主要結果の有意性表記が誤っていたことを認めたが、それを**「誤植」**だと主張した
    • Kingによる追加の訂正要求はすべて拒否された

外部公開と複製研究の出版

  • KingがLinkedInで誤りを公開した後、ジャーナルは遅れて訂正文(erratum) を掲載した
  • 複製研究は Journal of Management Scientific Reports(JOMSR) に掲載され、複製研究専用ジャーナルの役割を強調した
  • Kingは、元の論文では報告された方法と実際に使われた方法が異なっており、実際の方法では結果を再現できないことを確認した

研究倫理調査と大学の反応

  • Kingは Harvard Business SchoolLondon Business School に研究倫理違反の申告を提出した
    • 著者らは「編集過程のミスで誤った文章が残った」と説明したが、すべての草稿で同じ誤りが繰り返されていた
    • Harvardは調査を行うかどうかを非公開とし、LBSは「意図的な虚偽ではない」として教育的措置のみを勧告した
  • Kingは「データにアクセスできるかどうかは本質ではなく、誤った記述は研究の解釈可能性を破壊する」と批判した

制度的失敗と改革提案

  • 論文は一部のみ訂正され、誤った方法の記述は今も修正されていない
  • Kingは「信頼できる科学管理システムが機能していない」として、次を提案した
    • 単一研究の引用を控え、複製の有無を確認する
    • 誤りを発見したら即座に訂正する
    • 非倫理的行為をする同僚に警告する
    • 複製研究と JOMSR のようなジャーナルを支援する
    • 機関の研究倫理ポリシーを強化する
  • さらに、学術運営における透明性・独立した監視・段階的制裁を制度化し、FurtherReview のような事後検証体制を導入する必要性も示した

Andrew Gelmanのコメント

  • Gelmanは著者らの行為を研究不正と位置づけつつも、個人よりシステム上の問題に焦点を当てた
  • 「過去の誤りを認めない態度」が科学を**『死んだ学問(dead science)』**にすると指摘した
  • 学術コミュニティが誤りの訂正と責任ある態度を奨励しない限り、同じ問題は繰り返されると警告した

1件のコメント

 
GN⁺ 2026-01-26
Hacker Newsのコメント
  • 私は2003年からメンテナンスしているオープンソースのエージェントベース・モデリング・ツールキットを開発した
    最近、別の言語で作られた新しいツールキットの論文が私のソフトウェアと比較して自分たちの方が優れていると主張していたが、実際には私のツールを誤って実行し、データも歪曲していた
    修正を求めたが、ジャーナルは体面のために黙殺し、著者たちも言い訳を並べるだけだった
    こういうことが学界ではあまりにもよくあるのが問題だ

    • 私も似たような経験をした。競合が私のソフトウェアを誤解したまま論文を出し、誤ったデータで結論を出していた
      その件以来、学術論文への信頼が大きく落ちた
    • 以前、私が作った学術向けソフトウェアがあり、別の研究チームが私のプログラムを比較対象にした論文を査読することになった
      彼らのテスト方法論が根本的に誤っていて、「本当の正解」がない問題を恣意的な基準で学習させ、自分たちの結果が最高だと主張していた
      私は掲載不可を勧告し、ジャーナルも同意したが、数か月後、その論文が修正なしで別のジャーナルに掲載されているのを見て学問的な絶望を感じた
    • もしあなたが私の知っているSean Lukeなら、メリーランド大学の学部時代、あなたの講義は私のコンピュータサイエンスの考え方に大きな影響を与えた。感謝している
    • 以前、同僚に論文のコードをレビューしてほしいと頼まれて見たことがあるが、計算量の見積もりを誤っていて、完全に間違った結論を出していた
      結局、「心理学専攻にコーディングを任せるな」という結論になった。少なくともCS専攻者に検証してもらうべきだった
    • 大学院時代、指導教員がデータを捏造しているとジャーナルに通報したが、何の返答もなかった
      大学の法務チームも同様で、それ以来、学界への信頼はほとんど消えた。これがまさに再現性の危機の理由だ
  • 最近では被引用数は昔ほど意味がない
    問題のある論文がコピー&ペースト的に引用され続けている
    そこで、引用グラフの上に信頼ネットワークを重ねるサービスを構想している
    問題のある論文を無批判に引用した論文は「汚染の可能性あり」と表示し、そうした論文が多い著者や機関にもタグを付けるようなものだ

    • 私もGPT-3が最初に出たとき、こうしたアイデアを探っていた
      だが実際に論文を読んでみると、ひどい論文があまりにも多い
      悪い論文が例外的だという前提自体が間違っていて、結局は「泥の中からダイヤを探す」レベルだった
      だから、ある分野の90%が偽物なら、もうその分野を無視した方がいいという結論になった
    • 面白いアイデアだが、批判的な引用と単なる引用を区別するのは難しくないか?
      関連研究を要約しただけでも不利益を受けそうだ
    • 学会で偽研究でキャリアを築いた人たちを見て、専門家への信頼が薄れた
      だが信頼システムを作っても、結局はゲーム化されるだけだろうと懐疑的だ
    • うちの国でも**引用リング(citation ring)**や著者数の水増しが蔓延している
  • どの分野にもひどい論文はあるが、本物のビジネススクールの論文を見ると自尊心が回復する
    その分野でまともな研究をしている人はほとんどガリレオ級の例外

    • 私も工学・経済・経営の複数専攻だったが、経営学は新聞を読む程度に感じられた
      面白くはあるが深みが足りず、まるで歴史ドキュメンタリーのように表層的だった
    • ビジネススクールは結局、低コストで利益を出す技術を研究する場所なのだから、それ自体が成果物なのだ
  • 「単一の研究を決定的な根拠として引用するな」という意見には全面的に賛成だ
    たとえば有名な「Harvard Goal Study」は実在しない
    ハーバード図書館のFAQでもそのような研究は存在しないと明記されている

    • Jick Study」も似た事例だ。Wikipediaの記事が参考になる
    • 単一研究は無視すべきだ。本当に効果があるなら、他の研究者たちが部分的再現を通じて発展的研究を行う
      逆に後続の引用がほとんどないなら、それは逃げるべきサイン
  • 根本的な問題は**「publish or perish」**文化だ
    教員採用や研究費が被引用数に左右されるため、相互引用と論文量産が日常化している

    • 引用だけで評価するのが問題だ
      データ公開と再現性検証を含む多段階の評価システムが必要だ
    • 結局、学生時代の成績競争の構造が、大人の世界の「論文競争」へと続いているのだ
    • これは典型的なGoodhartの法則の事例だ
  • 世の中にはひどい科学論文が多すぎる
    私の好きな文章はJohn P. A. Ioannidisの“Why Most Published Research Findings Are False”

    • 素晴らしい論文だが、一部の技術業界の人たちはこれを口実に「自分の現実こそ真実だ」と言って現実逃避に使っている
    • Ioannidisは再現性の危機研究では偉大だったが、COVID-19関連の発言では陰謀論的な態度で失望させられた
  • 問題の核心は統計的有意性と学術誌の構造
    「有意な結果なし」は出版されないため、自然に偏った結果だけが残る
    事前登録と再現可能なデータ公開が重要だが、昇進競争と商業的利害のために、うまく守られていない

  • 「飲酒運転者は悪人ではない」という主張には賛成しがたい
    他人の命を脅かす行為を擁護したら、「悪い」という言葉の意味がなくなる
    研究者が非倫理的な行動をしても「訓練のせいだ」と言うのは責任回避に聞こえる

    • 人を「悪い」と断定するのは二分法的思考
      システムが悪い行動を起こしやすくするなら、結局のところ構造的問題が原因だ
      「訓練された」というのは「教え込まれた」という意味ではなく、環境によって馴化されたという意味だ
    • 「悪い行動」ではなく「愚かな行動」や「無責任な行動」と表現する方がより正確だ
      ‘bad’という語は道徳的含意が弱い
    • 皆がそうしていた時代には、文化的な思い込みの中で自分だけは違うと信じていた
      結局はダニング=クルーガー効果によって自分を過信していた結果だ
      こうした錯覚に陥るのが人間なら、人間そのものを悪いとは言えない
  • 「再現研究者は気をつけるべきだ」という言葉は科学の本質に反する
    再現できない結果は無意味であり、再現研究はむしろ奨励されるべきだ

  • あるジャーナルの論文の被引用数がサイトごとに異なって表示されている
    SSRNでは109回、ResearchGateでは3936回、Google Scholarでは6269回となっている
    被引用数の基準がばらばらで信頼しづらい
    また、「すべての論文に対するコメント・訂正・撤回要求を公開しよう」という提案もあったが、
    そうするとアインシュタインの論文にさえ妙なコメントがあふれそうだ

    • 実際、Google Scholar基準で6269回引用されているのは正しい
    • だがPubPeerのように匿名コメントを許すプラットフォームを見ると、
      思ったほど悪用の問題は大きくない