- 生成AIの台頭により、人文学の重要性が高まる一方で、人文学の本質そのものもより複雑で見慣れないものへと変化している
- 人文学的知識と能力が、人工知能の研究と活用において重要な役割を占めるようになっている
- 非専門家でもAIツールを活用して、教育用ソフトウェアや独自のリサーチツールを容易に開発できる新たな可能性が広がっている
- 一方で、AIチャットボットの導入は、学生の自己主導的な学習動機や教育体験の質の低下という負の影響をもたらしている
- 教育の二極化が深まる懸念の中で、個々の教師による創造的なAI活用能力がかつてないほど重要な課題として浮上している
AIと人文学の関係変化
新しいAI時代における人文学の位置づけ
- D. Graham BurnettがThe New Yorkerに寄稿した文章では、キャンパスでAIに関する急進的な変化が進行しているにもかかわらず、人文学を含む多くの学問分野でその変化を見て見ぬふりをしたり、軽視したりする雰囲気があると指摘している
- AIの登場を単なる流行として片づけたり、現実的な影響力を見過ごしたりする姿勢は、もはや持続不可能だという見方が示されている
- Burnettは、AIがすでに人文学に構造的かつ取り返しのつかない影響を及ぼしていることを強調している
生成AIが人文学的知識の価値を高める
人文学的能力の再発見
- AIは自然言語翻訳、分類、データマイニングなど多様な領域で、人間の言語と文化に対する人文学的理解を本質的に必要としている
- たとえば、OpenAIがGPT-4oの**追従傾向(sycophancy)**の問題を解決する際、技術的なコードではなく、新しい英語の文(プロンプト)を書くことで対応した
- 言語の文化的文脈、修辞的効果、ジャンルの区別、そして非言語的要素に対する深い洞察がなければ、AIシステムに意図しない誤作動が生じうる
- エンジニアや研究者もまた、言語や文化、技術史に関する幅広い批判的思考力を必要とするようになっている
人文学非専攻者のAI活用能力拡大
自分でソフトウェアを作る時代
- 技術的な背景がない人文学専攻者でも、近年では人工知能を活用して研究・教育目的のカスタムツールを自ら開発できるようになっている
- 本文の筆者は実際に、17世紀の薬剤師シミュレーターや、若きDarwinのガラパゴス探検ゲームなど、人文学的知識に基づく対話型ゲームを開発している
- 1つ目のゲームでは、学習者は実際の近世初期の医学レシピで患者を治療してみる体験をし、その途中で歴史的事実と食い違うAIのハルシネーション(hallucination)の問題が発生した
- 2つ目のゲーム(Young Darwin)は、実際のDarwinの記録を活用して、動物採集や島の探検体験をシミュレーションし、AIのハルシネーションを最小化する設計によって品質を高めた
- こうした実験的な学習方法は、エッセイ執筆や授業での討論と補助的に組み合わせることで、学生の歴史認識と批判的思考を体験的に拡張できる
- AIを活用したインタラクティブなチュータリングは、人文学教育においても実際に知的刺激と学びの機会を提供する
生成AIが人文学教育を複雑にする
AIがもたらす教育の変化と課題
- 教育現場では、ChatGPTなどのAIチャットボットが、学生の自己主導的な文章執筆の経験を大きく弱めるという負の効果を示している
- ますます多くの学生がAIで生成したエッセイや課題を提出し、既存の評価体系と教育目標が挑戦を受けている
- 結果として学生は、意味のある知的努力、たとえば執筆時の行き詰まり(writers' block)を乗り越える経験、図書館での検索過程、長期間にわたる現実的な探究そのものを経験できなくなる危険が大きい
- 学生は課題そのものに興味や意味を見いだせず、AIによる単純な実行に関心を向ける傾向が際立っている
前向きな事例と新たな教育の可能性
- その一方で、AIとの相互作用を含む課題設計が、学生と教師の双方に新たな知的衝撃と省察の機会を提供する事例も報告されている
- AIは単に人間を代替するのではなく、学生がAIと対話しながら自らの思考を点検する補助的なツールとして機能しうる
- 今こそ教育の意味と目的を議論し、真正性のある教授・学習体験を守るための現場教師の積極的な役割が必要とされている
人文学教育におけるAI活用の二極化
未来の教育に向けた提言
- 生成AIが最終的に人文学教育の格差を深めるという懸念が提起されている
- 十分に訓練された学生と環境では、AIを独創的に活用する能力が際立つ一方、厳しい環境の学生はそうではない可能性がある
- 各教師が自らカスタムAI課題とツールを開発する能力を備えることが非常に重要視されている
- もし教育現場がこの課題に消極的であれば、表面的には「インタラクティブ」であっても、実際には画一的で非人間的な商用AI教育ツールが、既存の学生と教師の関係、そして学びの本質をむしばんでいくことになる
- こうした問題意識から、実際にNEH(米国人文芸術基金)支援プロジェクトが企画・推進されたが、政策変更によって中止されたこともあった
おすすめの読み物
- D. Graham Burnettの著書 The Sounding of the Whale は、クジラ科学史に関するユニークな書籍である
- 1608年刊行の聖書解釈書から、製本構造に使われていた書簡の断片が発見され、ShakespeareとAnne Hathawayの関係に関する新たな研究事例が紹介されている
- UNCのKathleen DuVal教授は、最近出版した Native Nations: A Millennium in North America でピュリツァー賞を受賞しており、既存の著作も興味深いと評価されている
1件のコメント
Hacker Newsの意見
学生たちは学校や職場を、終わりのない目標達成の段階として見るように訓練されているという、より深い教育上の問題があると思う。究極的な目標は「就職」だが、今や5〜10年後にどんな職業が残っているのかを確信を持って言えなくなっている。特に実務系の技能職だけが例外かもしれないが、そうしたプログラムはすでにずっと前から教育の場から大半が消えている。大学生がAIを使って簡単に課題を終わらせ、読書や忍耐力を養うことを飛ばしてしまうのだとしたら、これは学生のせいというより、私たちが作ってきた教育・進路システムにより大きな責任があると思う。この問題は一朝一夕に生まれたものではなく、AIだけが原因でもないと思う
AIが大規模解雇やコスト削減を正当化する言い訳として使われているのと同じように、現代の教育システムの失敗の原因までAIのせいにする現象が見られるのは残念だ。実際、教育システムというのは成績だけを報いる構造になっている。知識、理解力、知能よりも、最もゲーム化しやすい「点数」ひとつ、つまりGPAが中学・高校から大学、そしてその先の進路まで決めてしまう。これこそが教育の最大の問題だと思う
長い間存在してきた職業は、今後も引き続き維持されるという確信が強い。技術変化が来ても、それらが突然消えるのではなく、ゆっくり淘汰されていくはずだ。だから十分に備え、計画できる時間的余裕があると思う。一方で、新しい経済分野の高収益職は長く存在しない可能性が高く、予測が難しい。そのため、予期しない収入に対して嫉妬しやすい性向があるなら、そうした職業で幸せになるのは難しいのではないかと思う
「教育・進路システムの責任が大きい」という主張について、実際には多くの人が繰り返し学生に責任を押しつけていることに言及している
未来の職業を常に確信を持って予測できた人などいなかった。基礎を身につけ、柔軟性を持つ人なら、いつでも道を見つけられる
実務系の技能職に人口の10%だけが流れ込んでも、その産業は崩壊せざるをえない。なぜ皆がこの点を見落としているのか不思議だ
ある記事で、SFSUの哲学専攻の大学院生が「AIと障害物競走をしている感じ」で授業を全面的に変えたところ、学生たちが興味を示したというコメントを見て強く関心を持った。学生同士でChatGPTでは解けない課題を作って互いに出し合ったらどうか、という面白いアイデアが浮かぶ。以前、BarCampでGoogleでは簡単に答えを見つけられないように作られたクイズ企画を体験したことがあるが、本当に面白かった。ChatGPT耐性のある課題設計も、それに似た高いレベルの知的挑戦だと感じる
「ChatGPT耐性のある課題」の設計は、実際かなり簡単かもしれないと思う。ドイツの大学制度のように、毎週難しい演習問題を解き、一定以上成功してはじめて試験資格が与えられる。この種の課題の本当の目的は、準備不足の学生が試験を受けて自滅しないようにすることだ。課題で「ChatGPT」などを使ってカンニングしても厳しく処罰されるわけではないが、そうすれば試験ですぐに大失敗することを学生たちはよく知っている。ドイツの大学の多くでは、試験に3回落ちるとその専攻をもう学べなくなり、しかもそれは全大学に適用される
Howard Rheingoldはこのテーマで活発に活動している。興味があるなら Peeragogy Handbook と、そのアイデアを促した投稿を勧めたい。「私が教師の権限を学生に委ね、主体的な学習を促せば促すほど、学生たちは私の教授法について再設計すべき点を教えてくれる」という話を共有している
私は視覚障害者だが、この種の「島の輪郭だけを見せる」問題形式が、私のような人にはそもそもまったくアクセス不能であることがずっと気になっている。テキストベースの課題を減らす流れが、かえって障害者にとってアクセス可能な教育をさらに難しくしている。新しいデジタル格差世代の始まりだ
ChatGPT耐性のある課題設計が知的な挑戦だという点には同意する。しかし教授たちは、こうした実験的な教授法を適用する時間も研修もほとんど与えられていない。4/4(1学期に4科目ずつ)を担当してやっと日程を回している状況では、試みそのものが難しいし、AIツールの進化速度があまりに速いため、良いアイデアもすぐ時代遅れになってしまう。たとえば学生に論文の代わりにポッドキャスト制作をさせたところ、「自分のポッドキャストを作る」ツールがすぐ登場して、結局は従来のエッセイと同じようにカンニングしやすくなった経験がある
教員がテーマをよく理解していれば、30秒会話するだけでも学生が本当に理解しているかすぐ見抜ける。ひょっとすると「課題」というものは、知識形成と検証に最適な方法ではないのかもしれない
著者(元記事)は主に歴史教育を扱っているが、実際には「歴史鑑賞」に近い方法を語っている。これは歴史を予測ツールとして使うのではなく、「古典(たとえばCicero)」を読む文化として接近するやり方だ。軍の将校たちはまったく別の方法で歴史を学び、ミスや失敗の原因を探る。こうした観点の歴史は、今のところLLMがあまり得意でない領域でもある。もしCiceroの時代を知りたいなら、この本 を読んでみることを勧める。現場の政治記者が書いた本で、修辞にだけ惑わされる伝統的な歴史観を鋭くひねる体験ができる
歴史を予測の道具として活用することは学界本来の目的ではなく、歴史は人間の営みの流れを知るために存在し、その応用範囲も非常に広い。軍事史ですら、新しい研究方法を導入するのが最も遅い分野のひとつであるほどだ
「鑑賞」と「分析」を分けるべきだという主張には同意できない。歴史は現在の状況がどのように形成されたのかを説明するうえで不可欠だ。古典研究も当然批判的に行われるべきで、実際に歴史学者たちはそうしている
「勝者」を研究すれば、生存者バイアスしか学ばないのは確かだ
戦略的分析としての歴史と、文化鑑賞としての歴史教育を区別する点は非常に良い論点だ。今日の教育は大半が後者に傾いていて、これはAIが模倣しやすい領域でもある。実際には、失敗、意図しない結果、周縁的な視点といった不快な問いからこそ、より価値ある思考が生まれる
軍の将校が歴史を見るとき、「失敗分析」だけをしているわけではないという補足だ
人文系博士論文の審査は「書面論文」と即興の口頭ディフェンスで構成されており、ChatGPTで不正するのは非常に難しい。教授は一見無関係なもの同士でもうまく結びつけて質問する。私はエンジニアたちに意味解析の問題を解決してあげたことがあるが、彼らは言語を理解できずに苦労することが多かった。コミュニケーションはできても、言語そのものは理解していない場合があることに気づいた。AI関連の評価では、実際にはAIが得意なことだけを試しており、私の言語能力は評価基準に入っていない。私はAIが直面する言語の問題を指摘し、その価値を人間に納得させなければならない
物理の教師が怠けると、すべての問題を数学の問題に変えてしまうと思う。もしもっと優れた計算機が試験を無意味にしてしまうのではと心配するなら、実際には物理ではなく数学だけを教えてきたということだ。人文系の教師が怠けると、すべての問題を作文の問題に変えてしまう。もしより良いスペルチェッカーが人文学の評価を無力化するなら、これも実質的には作文能力しか評価していなかったということだ。やや攻撃的な言い方だが、良い文章が必ずしも良い思考と一致するのか疑問だ
教員たちがAI耐性のある評価手法を開発できるという点には同意する。ただし、組織レベルでの支援はほとんど皆無で、全員が独力で解決しなければならない。AIツールの進化速度に比べて実験サイクルも非常に遅い。新しい評価法を1学期試しても、わずか数週間でまた次の授業準備に入らねばならず、きちんと評価・改善するのが難しい。通常、繰り返せても年1回がせいぜいだ
かつて科学界で電卓が登場したときの論争を思い出す。高校の物理の授業で、一部の裕福な学生が「関数電卓」を持ってきて、使用を許すべきかどうかで議論になった。電卓はLLMとぴったり対応する比較対象ではないが、実務では結局使うのだからという理屈には説得力があった。特にソフトウェアエンジニアリングでは今でもそうだ
人文学教育に再びソクラテス式教授法を導入するのが答えだと思う。単にテキストを消費・生産する受け身の過程(実際にはTAと教授しか読まないテキスト)ではなく、学生たちが授業資料や講義内容をもとに直接議論し討論する、対話中心の授業にすべきだ。LLMは出来のよくないエッセイならすぐ書けるが、実際の教室で同級生と議論することはできない。もちろん現実には人件費の問題で、この方式を大規模に適用するのは難しいという限界もある
ChatGPTを単なるスペルチェッカーにたとえるのはありえないと思う。文章を書くこと自体も、間違いなく教育すべき重要な技能だ
人文系における不正行為の根本原因は、チーティングに対する経済的インセンティブがあるからだと思う
ほとんどの人は、歴史や人文学の中にどれほど多くの仕事があるのかを知らないことが多い。たとえばヘルクラネウムの焼けた巻物の解読に関心を向ける人はいるが、実際にはルネサンスから近世初期にかけてのネオラテン語テキストのうち、英語に翻訳されたものは10%未満にすぎない。Marsilio Ficinoのような人物でさえ、彼が翻訳した古典はヨーロッパ史に大きな足跡を残した一方で、彼自身の著作のかなりの部分はいまだ英語に翻訳されていない。LLMはこの分野に甚大な影響を与えるだろうが、その気があれば学生は誰でもこの未知の領域で本当の貢献ができる。だから私は学生を評価するとき、「自分が彼らからどれだけ学ぶか」を基準にしている
トランスフォーマーアーキテクチャはもともと翻訳用に設計されたが、過度にオーバーフィットした生成モデルは、実際には翻訳に非常に弱いと感じる。品詞分類+辞書参照+文法マッピングのような単純な方式のほうが、むしろはるかに良い性能を出し、信頼区間まで提供できる。翻訳ツールが必要なら、生成AIではなく Project Bergamot 系のツールを使う方がよい。そして高校の人文学の授業が「実際の発見」ではなく、単なる練習になってしまっている現実があまりにも残念だ
私たちが持つ歴史は、必然的に細い経路を通って伝わってきたため、多くの部分が失われるか、大きく脚色・歪曲されている。500年前に実際に何が起きたのかはほとんど分からず、権力を握っていたメディチ家のように歴史を支配する者が、記録も自分たちの利益に合わせて演出した可能性が高い。結局のところ、歴史とは現在のための背景描写だ。AIが過去をよりよく理解するのに大きく役立つとは思わないが、むしろ現代の新しいメディチたちが過去の背景をより速く塗り替えるための道具になるかもしれないと思う
AIシステムを開発するエンジニアは、言語と文化、そして技術の歴史や哲学を深く考えるべきだと主張されているが、実際に重要なのは学術的知識の欠如というより、現実世界の複雑さを無視したときに問題が噴き出すという点だと思う。コーディング能力そのものが平準化されるなら、むしろ補完的な能力(たとえばコーディング+歴史)を持つ人のほうが大きな利益を得る。今、人文学の分野で起きている変化の核心はそこだ
根本的に、「良い問いを立てて自分で解ける能力」そのものが、いつの時代も非常に価値のある力だと思う
最近の学生は、コーディングであれ何であれ一つのことだけを深く掘るより、多様な背景の友人たちとチームで動く傾向が強まっている。変化の速度が昔とは比べものにならないほど速いため、訓練の質に関係なく限界と協業の必要性を早い段階で実感するようになる。異質な才能や関心、急激な変化の中で、どうやって一つのチームとして協力し、同期し、方向性を定めていくかのほうが、より大きな課題だ
歴史学界はすでに何十年も前にHayden Whiteを通じて「叙述としての歴史」の問題に向き合っている。Whiteの言う「歴史はフィクションだ」という主張も、事実性そのものを否定するのではなく、歴史には解釈と文学的叙述が内在しているという意味だ。つまり、歴史家も小説家のように物語構造や表現技法を通じて出来事の意味を構成していることを強調している
私たちが目にしているAIシステムの失敗は、たいてい現実の複雑さを無視することに起因していると思う
実質的には、Joel Spolskyの言う「補完財をコモディティ化する(comoditize your complement)」という概念を言い換えたものだ
OpenAIのシステムプロンプトに「OpenAIの価値を最もよく示す専門性と率直さを保て」という文があるが、人文学的背景のある人なら、こうした文言が将来のAIの事態で致命的な逆効果を招きうることを直感的に見抜けると思う。こうしたニュアンスこそ本当に重要で、まさにこの点のために、(ハリウッド的な)「機械が創造主の心をなぞろうとして破滅する」というシナリオが生まれるのだ
私は教育現場におけるコンピューター利用の効果に懐疑的だ。実際に何かを本当に学ぶには、紙で読み、余白や紙のノートに手書きでメモしなければ記憶に残らない。プログラマーとして毎日画面を使ってはいるが、新しい内容を本当に覚えるには紙を必ず使わなければならない。オフラインの会議やカンファレンスでもノートPCは開かず、いつも紙にだけメモを取る。だからノートPCやタブレットで学ぶことが本当に役立つのか、いつも疑問に思っている
このケースはあくまで個人的な経験であり、他の人に安定してまったく同じように当てはまるとは思わない。私は何年も紙に何も書いていないが、その間にも十分に新しいことを学べている
こうした違いは、初期にどのように学習習慣を身につけたかが重要なのだと思う。私はNotepadにメモすると効果が落ち、手書きのほうがよく覚えられるが、これは学校教育の習慣、つまり個人的なトレーニングの産物だ。他の人はそれぞれの方法で十分すばらしく学べると思う
私と同じ世代の経験が教育の普遍的なケースではないことを証明する世代が、すでに存在している
学習アプリ、とくにゲーム化された学習ツールが「練習」の面で確かな効果を見せている点には同意する
米国では、教育が実際に機能しているやり方にLLMが大きな穴を開けたという実感がある。これまで評価は「監督なしで書かれた文章の成果物が学習の証拠である」という前提に基づいていたが、LLMがその成果物を簡単に作れてしまうようになり、結果としてエッセイ代行業界まで一緒に破壊してしまった。今や教育者たちは評価基準そのものを新たに見つけなければならず、「学習とは何か」「それをどう意味のある形で測るのか」という古い問いがいっそう重要になっている。今後は暗唱や口頭試験など、口頭中心の評価が復活すると私は半ば冗談で予想している。この方法にも欠点はあるが、現時点では不正しにくいため、しばらくは有効だろう
学生がエッセイを提出するだけで学習を証明するというやり方は、昔からの思い込みだった。今ではAIがそれすら書いてくれるようになったので、本質的な検証が必要になっている。「書くだけでは学習を証明できないなら、どうやって本当の学習を見分けるのか」という問題が残る。だから今後は口頭試験やリアルタイムの討論評価が再び活性化するかもしれない。AIが教育を壊したのではなく、もともとあった問題をむき出しにしただけだ
その穴の本質は「客観性」にあると思う。教育では測定にこだわるあまり、教えているものが先験的な事実、すなわち「客観的真理」だという前提を置いてきたが、実際にはそれ自体が神話に近い。厳密に測ろうとするほど、知識が真理であるかのように錯覚させる。しかし実際には、あらゆる文章と学習は主観的経験の集積であり、客観性を得るには無数の主観的視点を探究しなければならない。LLMの登場はむしろこの点を迂回し、論理的解釈ではなく「雰囲気(vibe)」に基づいて答えを作り出している。今や目標は、見慣れた社会的雰囲気や文脈を生み出すことになっており、その線がどこで引かれるのかはまだ分からない。厳密さは過大評価されてきたのであり、複数の視点をともに探究しながら学ぶことこそ、人間にとって最良の学び方だ
学習の定義は変わっていないと思う。人類最初期の記録でさえ、「この新式の文字のせいで学生が学ばなくなる」と嘆いていたように、教育は常に変化に適応してきた
米国の教育では、非常に大きな比重を占めているのが「意味のないエッセイ」を量産することだったのだから、AIがこうした隙間に入り込むのは当然だと思う