AIの使用が脳を再構成し、認知能力の低下を引き起こすというMITの研究結果

(publichealthpolicyjournal.com)

2 ポイント投稿者 GN⁺ 2025-09-04 | 2件のコメント | WhatsAppで共有

MITの研究で、ChatGPTのようなLLMの使用が脳の結合性の弱化や記憶力の低下など、長期的な認知低下につながることが示された
参加した学生は、AIに繰り返し依存するほど、創造的な統合力と自律性が低下した
EEG脳波検査で、LLMグループにおける注意および視覚処理ネットワークの低活性化が確認された
検索エンジン利用グループは、より強い実行機能、記憶活性化、視覚処理能力を維持した
LLM使用後も脳機能の完全な回復は難しく、AIへの依存は「認知的負荷の転嫁」傾向につながった

MIT研究の主要な発見: LLMの使用と認知低下

MITで実施された「Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task」研究は、ChatGPTのような人工知能に繰り返し依存すると、脳に長期的な認知的損傷が生じることを明らかにした
参加した学生は、AIに依存してエッセイを書くほど、神経結合性の弱化、記憶力の低下、作業に対する当事者意識の喪失を経験した
AIが生成した成果物は外見上は高い評価を受けることもあったが、その過程で脳は徐々に非活性状態へ移行する傾向を示した

脳の結合性低下と人工知能依存の現象

EEG（脳波）測定の結果、人工知能の使用が増えるほど、脳の結合性(systematic neural connectivity) が段階的に低下した
- 脳のみを使ったグループ: 最も強力で広範囲な結合性を確認
- 検索エンジングループ: 中程度の脳活性化
- LLMグループ: すべての脳波帯域（アルファ、ベータ、デルタ、シータ）で結束の弱化が見られた
特にLLMグループでは、注意集中および視覚的処理ネットワークが顕著に非活性化した
Session 4でAIの助けなしに文章作成を試みた際、LLM経験者は脳の中核ネットワークの作動低下を示した

LLM利用者の記憶力および学習経路のゆがみ

LLMに依存した後、学生は自分が今書いた内容をよく記憶できない現象を経験した
脳の長期記憶および学習関連経路で明確な干渉が観察された
AI活用中、脳の情報統合および自己動機づけ的なアプローチが弱まった
参加者は成果物に対する心理的な距離感、当事者意識の縮小を経験した

人工知能から脳使用への切り替えの限界

第4セッションで、LLM使用後に直接脳のみを使ったグループでは、元のセッション（脳のみ使用）の水準まで脳活性化が回復しない現象が確認された
脳波、作業努力、自己認識などさまざまな指標で、ベースライン以下の状態が続く傾向が見つかった

検索エンジン利用者はより健全な脳の関与を維持

検索エンジン利用グループは、実行機能、記憶活性化、引用文の想起など主要な認知指標で高い水準を維持した
脳波では後頭葉および頭頂葉の活性化強化が確認され、これは視覚処理と作業努力に密接に関連していた

AI依存がもたらす認知的負荷の転嫁(Cognitive Offloading)

研究チームは、脳がLLMに繰り返しさらされると、自発的な情報統合および記憶化の努力を中断すること（neural efficiency adaptation）への傾向を明確に確認した
これにより、受動的な作業姿勢、編集の最小化、概念統合水準の低下へとつながった

短期的な効率、長期的な認知的負債

LLMグループは表面的には審査員から一定水準の評価を得たが、
- 戦略的統合の不足
- 表現構造の多様性の減少
- 成果物の短く機械的な特性 など、明確な限界を示した
広告
時間が経つほど、認知的関与、遂行力、自己満足度の一貫した低下傾向が続いた

研究の結論と提言

より多くの人々が複雑な作業の遂行に人工知能を依存するほど、人間の本来的な認知能力と創造的能力が急激に低下するリスクが高まる
人工知能を活用する際には、定期的に休息を取り、自分の脳を直接使う時間の重要性が強調された
人工知能は単に人間の仕事を代替するだけでなく、人間の思考体系と脳機能そのものに影響を及ぼす存在である

著者紹介

Nicolas Hulscher, MPH
- 疫学者であり、McCullough FoundationのFoundation Administrator
- 関連する追加コンテンツは、X（旧Twitter）でMcCullough Foundationおよび著者のアカウントを参照可能

2件のコメント

ndrgrd 2025-09-05

内容を見ると、LLMを使った側は回答を書き写しただけのようですね。
普通は目的や望む流れがあって、回答を確認しながらフィードバックを繰り返して使うのではないでしょうか？その場合も同じなのか気になります

GN⁺ 2025-09-04

Hacker Newsの意見

大学院時代に尊敬していた博士課程の学生と話した経験を共有したい。彼は論文を読むたびに、コードを自分で書いて実装していた。私は何か月もかかったが、彼は数日でコードを完成させていた。たくさん練習すればもっとうまくできるようになると説明してくれた。単に速くコーディングするだけでなく、論文をますます速く分析し、アイデアを統合する能力にも優れ、何が有効かという直感も育てていた。私も今ではかなりシニアで、コード作業はほとんどしないが、それでも新しいコードやアイデアを自分で扱って苦労してみることは本当に有益だと感じる。promptを少し変えればいいと思っている人たちは、本当に重要な学びの機会を逃していると思う
- 実際、今まさに目の前でスキル格差が生まれていると思う。(1) 概念を深く理解し、頭の中にモデルを作ったうえで、どのレベルのコードでも自分で実装できる人たちと、(2) その過程を機械に外注して、ゆっくりその能力を失っていく人たちがいる。今はこの差がそこまで明確ではないが、数年もすればはっきりした違いが現れると信じている
- 「本物のプログラマーはアセンブリを自分で書く」という論理的誤りには注意すべき。コンパイラが普及したとき、プログラマーが自分のコードの動作を理解できなくなるという懸念があった。実際、ある程度はその通りだが、ほとんどの人は実用的に何かを作るうえであまり問題はないと考える。考えることをやめれば、学ぶことも当然少なくなる。抽象化レベルを一段上げて考えられるなら、細部が常に重要とは限らない。大学の限界は「次の抽象化レベル」ではなく、検証済みの知識移転だけのために手で選ばれたアイデアの連続だという点にある。スタートアップで実際に何かを作ったり、より大きな問題に挑戦する時間を確保するのとは違う。もちろん、すべての博士課程にこのやり方が合うわけではない。細部を知る必要がある分野もあるだろうが、今日のように専門化が進んだ時代では、むしろこれが純利益かもしれないと思う
- 数学の勉強と似ていると感じる。数学の本を一日中読んでアイデアを鑑賞することはできるが、実際に定義、定理、練習問題の例を解いてみなければ、ほとんど何も学べない
- データサイエンス分野には「ただ飯はない」という言葉が当てはまる。ChatGPTのようなツールがますます普及する中で、博士号取得者以上であっても、こうしたツールをまったく使わずに自力で勉強している人はますます魔法使いのように見える。すでに実力不足で中級以上のコーディングができなかったり、直感が鈍かったりする人たちを見ている。これはもはやインポスター症候群ではなく、AIなしではまともに仕事ができない現象だ。私は各テーマごとに、まずツールなしで自分で考え、質問を作る。そしてある程度感触をつかんでからChatGPTに質問する
- 興味深い。彼は本当にペンと紙でコードを直接書いたという意味なのか気になる。そのやり方は本当に理解の助けになるように思える（ちなみに私は職業としてコーディングしていない）。歴史家も似ていて、物理的なアーカイブに一日中没頭する人たちは、時間がたつにつれて主題についての直感や洞察を身につけていく。一方、Googleで必要な引用句や文書をかき集めて使う場合には、主題を表面的にしか把握できない危険が高い。多角的に考えたり、現象間の関連を見たりできず、自分の論旨に過度に執着する傾向もある
いくつか指摘しておきたい点がある。(1) この論文はarXivに上がっているもので、まだ出版前・査読前である。その点を踏まえて見る必要がある。(2) コホートごとに18人 (3) 全体で54人である。Nが少なく、MITの18〜22歳の学生が主に含まれているようなので、再現性や一般化可能性には課題がある。実験中は脳波（EEG）測定もしているが、慣れないし不快な環境だ。また研究対象はLLM、検索ツール、あるいは何のツールも使わずにエッセイを書くというものなので、参加者も自分が何を見られているかを全員把握している。論文の要約は、エッセイ執筆課題におけるLLM使用の認知的負担（cognitive cost）を研究したもの。エッセイ執筆は、学校や試験で用いられる課題であり、さまざまな認知過程を動員する複雑な作業だ。アイデアの整理や論証の構造化といったマクロレベルの作業と、語彙選択、文法・構文といったミクロレベルの作業を同時に管理しなければならない。認知的関与（cognitive engagement）と認知的負荷（cognitive load）、そして脳活動を評価するためにEEGを用いた。LLMに加えて、古典的なインターネット検索、そして何のツールもない状態での脳活動も比較した。論文原文
- 54人の参加者は18〜39歳（平均22.9歳、SD=1.69）で、MIT、Wellesley、Harvard、Tufts、Northeasternの5大学から募集された。学部生35人、大学院生14人、そしてポスドク・研究員・ソフトウェアエンジニアなどが6人である。標本サイズと構成は制約ではあり、後続研究はより大きく多様な標本で行われるべきだ。ただ、それによって「再現が難しい」とまでは思わない
- 査読前の論文だから「割り引いて見るべきだ」という主張はもうやめるべきだと思う。査読も理想的な科学プロセスではなく、しばしば不要な遅延や無意味なコメントが多く、大手出版企業への無償労働にすぎない。30本以上出してきて、良い評価と同じくらい悪い評価も多く受けてきた。少なくともオープンピアレビューと編集者との対話に進むべきだと思う。科学はアイデアの市場であるべきだ。残りの批判は完全に妥当だと思う。論文の結論もあまりに性急で、宣伝寄りだ。個人的には、今の査読システムは時代遅れだと思う
- 今回の研究は、ChatGPTが利用者のエッセイ執筆能力に与える影響についての実験だ。書く練習をしなければ書く能力は衰える、そして脳活動において他の方法との差が見られた、という話でしかなく、特別に有害だという証拠ではない。そして論文では「cognitive decline（認知力低下）」の代わりに「cognitive debt（認知負債）」という用語を使っており、これは解釈に重要な示唆を与える。似た結果が他の研究でも出る可能性はあると思うが、AI/LLMが脳に有害だと結論づけるのは早すぎると思う。むしろ認知負荷を下げて、エッセイ執筆をより容易にするとも読める。ただし、成果物の質の評価など追加研究は必要だ
- もう一つ注意すべきなのは、ここで使われている「AI」がLLMの代替語として使われている点だ。AIは非常に幅広い。画像、動画、音声生成が認知低下につながるとは想像しにくく、LLMについてはむしろ「記憶や暗記を自分でしなくてよくなり、知的な怠惰を招く」程度に考えている
- こうした効果は何気なく再現されると思う。最近LLMを多用し始めた人たちとやり取りしていると、目に見えてIQが下がったように感じる。以前は活発に議論していた人が、今ではGrokやChatGPTの答えを確認しないと話せなくなっているのを見た
当該記事と見出しは、むしろ以前のより独創的な原文を粗雑に繰り返しているだけだ。実際、研究者自身も、メディアが自分たちの研究を誤解して「LLMが私たちをバカにする」のような言葉を使わないでほしいと、FAQにはっきり書いている。HNコメント（の一部）は、実際の資料を確認せずに情報を受け入れるという認知バイアスの好例だ
- Reddit化した話になる理由は理解できる。こういうclickbait的な話題がずっと上がってくる。特に今回の研究は、4か月の間にChatGPTを4回、18人が使っただけで、ノイズ制御もできていない。AIの使いすぎが問題になりうることには同意するが、こうした研究は結局、自分たちが嫌うテーマについてのclickbaitにすぎない
- 実際の論文をちゃんと読む人はほとんどいないと感じる。1〜3セッションでLLMを使ったグループが4セッション目でLLMなしにすると結合性が低下した一方、すべてのグループでセッションを重ねるごとに結合性は高まっていた。重要なのは、4セッション目でも結合性が初期（1セッション目）に完全に戻ったわけではなく、中間あたりだったということだ。つまり、依然として学習していたという意味だ。Extended Mindという哲学的概念が核心だ。むしろ1〜3セッションをLLMなしで過ごしたグループが4セッション目でLLMを使うと、脳が爆発的に活性化する。研究結論の本当のポイントはここにある
- 個人的には、8か月間ChatGPTでコーディングしていて、だんだん頭の回転が遅くなるのを実感した。研究結果にはかなり共感する。ただし、研究を否定的に扱う新しい研究は、今後ほとんど出てこないだろうと予想している。AIに対する否定的な世論を望まない勢力が社会全体を主導しているのだから、そうなるしかない
私は、LLMに文章を書かせたり推敲を任せたりすべきではないと思う。フィードバックやアイデア探索、抜け漏れの発見には使えるが、執筆自体は自分で最後までやるべきだ。脳をあまりにも簡単にLLMに明け渡してしまう危険がある。エッセイ執筆だけでなく、プログラミング問題をLLMで解くことに頼っていると、本当に認知低下が来ると感じた。見慣れないプログラミングエコシステムでエラーを延々とコピペしていると、問題はすぐ解けるが、本当の学びは減る。もちろん、そのおかげで始めやすく、詰まりにくくはなるので、バランスが必要だ。問題と直接格闘する力は必ず必要だ
- 私は逆の経験をしている。単にエラーをコピペしたり、AIの答えをそのまま受け入れたりするのではなく、「なぜこれが効くのか？」をひたすら問い続ける。コマンドやフラグを一行ずつ分解して説明させ、完全に納得したときだけ次に進む。そのおかげで、自分で探究するほど深く記憶には残らないにしても、より多くの問題をより速く経験し、学習量を増やせている
- Firefoxに自動修正機能が入ったとき、正答を振り返りながらミスのない文章を書く練習をしたらかなり改善した（英語は母語ではない）。LLMも同じで、より速く学び、結論に到達するためのツールだと思う。新しいプロジェクトで以前やった設定を忘れたとき、昔のWikiに書いておいたはずの内容をLLMが思い出させてくれる。LLMを通じてより良いエンジニアになるためのセルフチェックが重要だ
- これが本当の問題だが、LLMを適度に活用すれば、自分の実力や隣接領域に素早く追いつけるし、些細な知識の欠落で止まらず本質的な仕事に集中できる。たとえば水中音響信号処理をCで素早く実装できたし、わざわざ完璧に習得する必要のなかった領域を、実用的に迅速に処理できた。以前なら他人のコードをひたすら読んでいただろう
- LLMに文章を書かせるのは怠慢で、結果も満足できない。代わりに自分で下書きを書き、LLMからフィードバックを受けて盲点を点検したり、よりよい語彙を探したりするのがよい
- LLMの習慣は、ナビゲーションや地図アプリに過度に依存するのと似ていると見ている。本当に便利だが、空間記憶や意思決定に必要な脳の領域を鈍らせる副作用がある。一度それを盲信して大きく失敗したこともあった。以前は紙の地図が不便だったが、その代償としてより多くの相互作用と余裕の時間を得られた。現在では紛争地域を除けば、紙の地図はほとんど使わない
今回の論文のように話題になった研究であっても、方法論には深刻な限界が多い。54人を3グループに分け、各条件あたり9人ずつで、「脳の再プログラミング」のような主張をするにはあまりに少ないサンプルだ。研究が示したのは、AI支援のエッセイ作成時にだけ異なる脳パターンがあるということにすぎず、永続的な損傷ではない。ツール使用時に脳活動が少ないのは、電卓を使えば暗算が減るのと同じだ。「認知的損傷」や「深刻な被害」のような用語も、実際の研究では当てはまらない。表面EEG測定からも深部の脳変化は推定できない。著者たちも限界を認めている。「83.3%が自分のエッセイの一文も覚えていなかった」も、18人中15人にすぎない
日常でAIを使う代表例として、はんだ付け、マルチメーターの使用、回路設計、太陽光・バッテリーシステム、LoRaネットワーク構築など、さまざまな実践的学習について語っている。どの場合も理論だけでなく、実際に自分で実験しながら学んでいる。問題が起きたらAIで原因を特定し、何度も質問と実験を繰り返して原理を確実に理解するという。YouTube動画は好みに合わず、テキストベースのAIのほうがむしろ自分に合っているやり方だ。わざと失敗し、壊しながら学ぶのを好む。ソフトウェアで通用した試行錯誤の戦略を、安価な電子工学にも適用して効果を見ている
- 実際にこういうことをやっている立場からすると、なぜAIを選んだのか気になる。テキストで学ぶのは最も難しい方法の一つだと思う。よく作られた動画なら、実際のプロセスや成功・失敗の基準をずっとよく示してくれる。ただ、良い動画を見つけるのがどんどん難しくなっているのは確かだ
- 私もLLM登場前に、アナログシンセサイザーを作りながら似たことを学んだ。共感する点として、LLMが参照したWeb上のテキストと同じ資料を私も参照していた。何かうまくいかないときは、実機や文書を参照していた。その間ずっと、LLMなしでも十分学んでこられる道があり、LLMが他の方法より必ずしも優れた学習方法だとは、まだ言い切れないと思う
- 実際に物理的な作業をしなければ、学ぶ速度は脳の学習速度に合わない。ソフトウェアの「vibe coding」のような速すぎるフィードバックループは、本当の学習にはむしろ役立たない。脳が学習の過程を避けるようになってしまう
- 徒弟が師匠に質問するような形でLLMを使っているなら、まったく問題はないと思う
- 同様に、私は解答のない教材を解いていて、詰まるたびにChatGPTでフィードバックをもらい、ヒントを得て大いに助かっている
記事の内容は、AIで書かれたかのように感じるほど、実際の論文を読んでそう結論づけるのは難しいと思う。実験は4か月のあいだに30分にも満たない、SAT形式のエッセイを書いただけで、一部だけがAIを使った。この程度で、1回20分、月1回AIを使っただけで目に見えて頭が悪くなったと結論づけるのは無理がある。実際の研究で示されたのは、自分で作ったものではない成果物には愛着や記憶が少ないという点だ。これは他人が作った作業物でも同じだ
- LLMでは、問題を解くためにpromptを長く調整しながら、出力物に自分もかなり関与していることが多い
AIの使い方は、学習への影響と非常に密接だと見ている。私はむしろAIに絶えず質問し、論理的に詰めることで、普段よりずっと深く考えるようになった。たとえば、文書が不足している機能を見つけたら、AIでコードの流れを把握し、命名改善、構造改修、文書化など、さまざまな選択肢についてAIと議論し続ける。情報探索の領域だけLLMが圧倒的に速いので、自分の手間が少し減るだけで、むしろより深く考えるようになる。もちろんmermaidのように一部飛ばした領域はあるが、LLMのおかげで実際に作業が可能になり、そうでなければつまらない仕事だけをしていたと思う
今回の論文と記事があまりに刺激的に解釈されたため、研究チームがFAQまで別途公開するほどだ。論文著者は「LLMが人をバカにする」のような表現は使わないでほしいと繰り返し求めている
- 標本数があまりに少ないだけに、この種の研究が実際に何かを明確に示したと言うのは難しい。敏感なテーマなので、表現やフレーミングに慎重でなければすぐ禁忌化される。したがって、このような研究は今後もあまり出てこないだろう
技術的な神経ネットワーク測定結果だけで「長期的な認知低下」を論じるのは誇張だ。たとえば「LLM利用者の83%が、たった今書いたエッセイの一文も覚えていなかった」という結果も、自分の手を通っていない文章は記憶に残らないという、ごく当然の話だ。そもそもAIが代わりに書いたのだから、自分の思考を通っていないのは当然に感じられる
- 私もよく文章を書くが、実際には内容の一文一文を別に暗記しているわけではない。LLMは編集ツールとして使い、自分の意図をよりよく反映する方法や、より良い語彙の提案に活用している。出力を盲信することはなく、文章の重要度に応じて一文ごとに丁寧に確認する。LLMに「テーマXについてのエッセイを書いて」とだけ任せて、一度も開いて見ないというのは非現実的だ。