誰もがあらゆることにAIを使っているわけではない
(gabrielweinberg.com)- 生成AI のチャットインターフェース経由の利用は、普遍的な日常ツールというより、積極利用・断続利用・非利用に分かれる連続体に近い
- 複数の利用データと調査を総合すると、米国のAI利用はおおよそ 3分の1が積極利用、3分の1が断続利用、3分の1が非利用に近い
- Gen ZでもAIの認知度は高いが導入はほぼ頭打ちで、Gallupの調査では 月1回または数か月に1回利用 の割合と非利用の割合が大きな比重を占める
- AI利用を制限する主な理由は、雇用代替、プライバシー侵害、偽情報拡散への懸念と、AIの有用性に対する懐疑感である
- AI市場と政策は、「全員が使う」または「誰も使わない」という二分法ではなく、利用強度と懸念が異なる人々を前提に設計すべきである
「誰もがあらゆることにAIを使う」は、実際には「一部の人が一部のことにAIを使う」に近い
- ここでいうAIとは、厳密に定義されたカテゴリではなく、チャットインターフェース でアクセス可能な生成AIを指す
- 「AIを一度使えば何にでも使うようになる」という前提や、「AIがあまりに良くなって誰もが使うようになる」という前提は、データと一致しない
- Gen ZはAI認知度が最も高い集団だが、この1年でAI導入はほぼ停滞しており、かなりの割合がAIをめったに使わないか、まったく使っていない
- Gallupの2025/2026年のGen Zデータは、AI利用が普遍的で集中的な利用へ移行していないことを示している
- AIをまれにでも使う割合は 79%/81%
- AIに不安を感じる割合は 41%/42%
- AIを月1回または数か月に1回しか使わない割合は 32%/31%
- AIに怒りを感じる割合は 22%/31%
- AIをまったく使わない割合は 21%/19%
実際の利用データが示す分布
- MicrosoftのUnited States AI Diffusionデータは、匿名化・集計されたMicrosoftテレメトリ資料に基づき、米国の生産年齢人口の 30%超 がAIを利用しているとみなしている
- これは約70%がその基準ではAI利用者ではないことを意味する
- 2025年末より3ポイント増えた水準である
- 利用基準は、ChatGPT、Google Gemini、Anthropic Claude、Microsoft Copilotなど主要AIサービスで1か月に少なくとも90分使った場合である
- Datosの実利用データも同様の構図を示しており、昨年6月時点でデスクトップ端末の 21% のみがAI Toolsを月10回以上訪問していた
- デスクトップ端末の 62% はAI Toolsへの訪問が0回だった
- 残る 17% はその中間に属した
- Searchlight Instituteの調査では、58% がChatGPTやClaudeのようなAIを使った、または試したことがあると答えた
- 比較的定期的に使う割合は 30% で、月に数回以上利用している
- よりまれな利用者は 29% で、月1回以下の利用である
- The Argumentの新しい調査では、米国人の大半がAIを 週1回以下 しか使っていない
米国のAI利用は3分割に近い
- 複数の資料を総合すると、米国のAI利用はおおよそ 積極利用が3分の1、断続利用が3分の1、非利用が3分の1に分かれる
- この分布は用語定義によって多少変わりうるが、「誰もがあらゆることにAIを使う」より「一部の人が一部のことにAIを使う」に近い
- 直近6か月から1年の間で、AI利用は大きく動いていない
- 大きく変わった点はAIに対する否定的感情であり、GallupのGen Z調査ではAIに対する怒りが前年比で約 40% 上昇した
多くの人が現実的な懸念と低い体感価値のためにAI利用を制限している
- 相当な割合の人々がAI利用を意図的に制限しており、主な理由はAIに対する現実的な懸念である
- Searchlight調査での上位3つの懸念は、雇用代替と失業、プライバシー侵害、偽情報と虚偽の拡散だった
- 「AIが仕事を代替し、失業を引き起こす」は 42%
- 「AIが人々のプライバシーを侵害する」は 35%
- 「AIが偽情報や虚偽を広める」は 33%
- 安全性とプライバシー保護のためのAI規制を支持する傾向も強く、多くの人は、米国のAI開発速度が中国のような国より遅くなったとしても、政府は安全性・プライバシーのルールを優先すべきだと考えている
- AIの有用性に対する懐疑も大きく、社会全体への影響についての純ポジティブ評価はAIで +8% にとどまる
- ソーシャルメディアは +7%、暗号資産は -17%
- 携帯電話、インターネット、太陽光エネルギーはそれぞれ +68%、+67%、+65%
- The Argumentの調査では、AIの具体的な社会的利益に対する懐疑が広く見られ、AI効果への懐疑は実際の利用経験がない人々の無知だけから生じているわけではない
個人利用でも、懸念を上回るだけの価値を感じていない人が多い
- 社会レベルでは否定的に見つつ、個人レベルでは異なる行動を取ることもありうるが、現在のAI利用分布はそうした姿とは一致しない
- 断続利用者が最も大きな層を成し、完全回避者も多いという点は、多くの人が懸念を上回るだけの個人的価値をまだ見いだしていないことを示している
- 「誰もがあらゆることにAIを使う」というメディアの物語は、初期受容した知識労働者や技術メディア周辺のバブルを反映している可能性がある
- 企業、論者、政策立案者は、人々がAIについて実際にどう感じ、どう行動しているかを無視すべきではない
- AI利用は、全員利用か全員非利用かという二分法ではなく、さまざまな意見と利用強度が混在する 連続体 である
主要な比喩: 肉の消費とAIの消費
- AIの消費は 肉の消費 に似ており、積極的に受け入れる人、利用を減らす人、完全に避ける人に分かれる
- タンパク質が食生活で重要だというメッセージは、生産性にAIが有用だというメッセージに似ており、肉がタンパク質の主要供給源である点は、AIチャットツールが生成AIへの主要な入口である点に対応する
- 米国における肉の消費嗜好も、全員が消費する構造ではない
- 95% は肉を食べる
- 70% は赤身肉の消費を減らしていると答える
- 30% はあらゆる肉をまれに、または時々しか食べない
- 12% は赤身肉を食べない
- 4% はベジタリアンで、いかなる肉も食べない
- 1% はヴィーガンで、いかなる動物性製品も摂取しない
- 肉の消費を制限する理由には健康、コスト、環境、倫理があり、これはAI消費における主要な懸念とも重なる
市場機会と製品の選択肢
- 肉の消費の比喩は、AIに対する感情や特定の懸念が異なる人々に向けた市場機会を示している
- DuckDuckGoはすべてのAI機能をオプションにし、duck.ai をプライバシー懸念に対応する非公開チャットボットの代替として提供している
- このアプローチは、メニューに多様な選択肢を置くレストランに近く、非公開AI、AI利用の縮小、AIオフといった選択肢が共存する
- AI利用者のスペクトラム全体を考慮するには、単一のAI強制利用よりも、選択可能な構造が必要である
今後の変化の可能性と現時点での結論
- 現在、まれにまたは時々しかAIを使わない約3分の1が、永遠に同じ利用パターンを維持するとみなすことはできない
- AIは肉と異なり、技術環境が急速に変化しているため、製品と規制がどこに到達するかは非常に不確実である
- 製品の進化は、平均的な人にとってAIをより有用にする可能性があり、規制は懸念を減らせるかもしれない
- 現時点の基準では、意味のある割合の人々が現在のAIを試したうえで、利用を積極的に制限することを選んでいる
1件のコメント
Hacker Newsの意見
今、大学院を卒業して就職活動中なのですが、技術面接やホワイトボード面接ではたいてい「LLMをどう使っていますか?」と聞かれます
答えにくいのは、相手がAIに熱狂的なのか慎重なのかわからない状態で、どちらにも合うように無難に話したくなってしまうことです
なので、「この技術をどのプロセスに組み込むかには明確な学習曲線があり、常に複数回検証しています」といった感じで長めに答えています
実際には、チャット/質問機能は毎日、素早いデバッグや新しい技術の学習に使っていますが、完全なエージェントやコンピュータ操作系の製品は何度か試した結果がよくなく、まだほとんど使っていません
何十年も前のFortran+Cの大規模リポジトリを最新のコンパイラ/OS向けにリファクタリングしようとして、一部は動いたものの結局断念しました
単語を一つ言い間違えただけで、読心術で当てるべきだったと騒ぐような場所で、ロールプレイまでしながら働きたいのかも疑問です
それは職場というより、有害な関係に近く見えます
AIを好む会社か慎重な会社かも重要ですが、質問を「自分がこの組織に合うか、この組織が自分に合うか」に切り替えることを勧めます
LLMがどの作業に適しているかをどう判断するのか、そして結果を実際に改善したかをどう確認するのかを簡潔に示せれば、強い回答になります
自分で探ってみて、興味深い観察を説明できるくらい考えてきたというシグナルになり、相手が関心を持てばさらに深く話せる準備もできます
エンジニアリングリードは、同じチームに多様な背景や視点を持つ人を求めることがよくあります
正直に答えれば、むしろ無難で過剰に防御的な回答をした応募者たちより目立てるかもしれません
「AIが良くなりすぎて、引っかかる気持ちがあっても皆がAIを使う」という話は、私の経験では ケースバイケース です
昨日書いたこのコメント[0]が、現在の作業とLLMの統合のしかたをよく示しています
プロジェクトではバックエンド(PHP)とフロントエンド(Swift)の両方で使いましたが、どちらも大きく役立った一方で、Swift側は警告事例に近いものでした
ネイティブのUIKit Swiftアプリ開発では本当に大人の監督が必要で、生成されたコードがどれほどひどいかを実感しているところです
一方でPHP側では妥当な設計判断を行い、私が書くコードよりよいコードを出してくれました
Swift側では現実の問題にぶつかったとき、経験の浅いエンジニアのようにうろたえ、書き直すコードはもっと単純で堅牢なアプローチにする予定です
それでも全体としては生産性を大きく引き上げる純増効果があり、問題を見つけるのには向いているが、直すのにはそれほど向いていないという教訓を得ました
[0] https://news.ycombinator.com/item?id=48515217
インターネットで何か検索すると、AI生成コンテンツが何ページ分も出てくる可能性が非常に高いです
だから最近では、自分でプロンプトを入れて答えを得たほうがましなことが多いです
答えそのものが優れているからではなく、検索を通した間接的なプロンプトより、自分でプロンプトを制御できるからです
高品質なコンテンツがゴミの海に沈んで、ほとんど見つけられなくなっていくのを見るのは悲しいです
PHPは何十年にもわたって人々が遭遇してきた コーナーケース がインターネット上に長く文書化されていますが、Swiftは比較的新しく、資料も少ないです
AIの能力を、エンジニアのキャリア期間を10〜20倍に圧縮したものと見れば、少し理解しやすくなります
新しいものやニッチなものには直感的に弱いでしょうし、今後ほかのLLMが吐いたゴミを学習すればさらに悪化するかもしれません
最近、飛行機の中で妻のイヤホンをMacBookに接続しようとしたのですが、以前のAirPods Proケースに慣れていたせいで、ペアリングモードの入り方がわかりませんでした
そこでオフラインでLM Studioの Gemma4 26B A4B に聞いたところ、ケース前面を2回タップするというジェスチャーを教えてくれて、実際にうまくいきました
こういう状況は、ローカルLLMがなければずっといらだたしいものになっていたはずです
不正確なことはあっても、基本的な「どうやるのか」という知識を一式持ち歩いているようなもので、ないよりはましです
問題は、LLMが原理でコーディングしているのではなく、学習データのパターン に合わせていることです
Stack Overflowで人々があれほど嫌っていた、まさにあの点でもあります
記事は良いのですが、抜けている視点があります
記事では、人々が「AIを使っている」と言う頻度を示す研究を引用し、半数を少し超える人が週1回未満しか使わないとしています
AIチャットインターフェースだけを指すなら、その通りかもしれません
しかしAI利用が増えていく形は、チャット参加を増やすことよりも、人々がすでに使っているソフトウェアに AI機能を内蔵 する方向である可能性が高いです
たとえば同じ人たちに「Google検索をどのくらいの頻度で使いますか?」と尋ねれば、数字はずっと上がるでしょう
その人たちは実質的にはAIを使っているのに、機能が内蔵されているのでそう認識していないだけです
そうした形のAI導入は 強制された採用 であり、多くの場合、ユーザーの好みと逆かもしれません
要は、人々がAIに関心を持ち有用だと感じているのかを見たいのか、それとも「人々のX%が食べ物として鉛を摂取している」に近い問いをしたいのかにかかっています
売り文句は「導入しなければ出遅れる」でしたが、私はまだ待っています
数年経っても私の日常は変わらず、マニュアルを読まなかった人たちに、今では チャットボットに聞け と教えるようになっています
私の「装飾不足」より、彼らの足りない部分はどうするのかと思ってしまいます
複数の会社が、サポートフローにある決定論的システムを、より遅く質の悪いLLM版に置き換えているのを見てきた
多くのインターフェースは、AIを付けても良くなるわけではない
明らかに繰り返しになる作業をLLMに直接やらせるのではなく、その作業を実行するプログラムやPythonスクリプトを作れと指示するほうがよい
決定論的に解けることや、5年前なら単純なコマンドラインツールで済んでいたことが、今ではLLM統合になっている
LLMで決定論的ツールを作る代わりに、そのツール群をLLMで置き換えている
完全に逆で、特にうちの会社の上位職がなぜこれを未来だと見ているのか分からない
CIパイプライン全体がLLMプロンプトだけでできているようなものは望んでいない
作るのは簡単でも、高価で遅く、予測できない形で失敗しやすい
コードレビューも同様で、単純なlintルールで済むことがLLM通過段階になっている
しかもLLMは、そうしたlintルールを作ることには本当に優れているのにだ
チーム全体がまさにこの理由で強く抵抗している
思いつくものの大半は、ただ悪化させるだけで、すでに1〜2%の超過失敗率ですら受け入れられないとも言われている
その水準を満たすには、より多くの構造と標準が必要であって、少なくてよいわけではない
[1] https://thedailywtf.com/articles/Classic-WTF-No-Quack
全体像を理解する訓練を受けた相談員を思い浮かべ、会社が、人がAIで知識を検索して関連性を判断し、そのうえで顧客をよりよく助けられるよう投資する姿を想像すればよい
だが今のAIは、「サポート要員は不要だ」という形で売られており、「どうすればより良いサービスを提供できるか」という形では売られていない
多くの製品では、より良いサービスには大した意味がなく、より安い製品がたいてい勝つ可能性が高い
人々は、より良いものにもっとお金を払いたいのではなく、同じ値段でもっと良いものを欲しがる
だから会社は、AIを正しく使う方法を見つけるために時間を投資していないのだと思う
このギャップの理由は、第一にコーディングではClaudeが驚くほど優れているからだと思う
キュレーションされた技術と、この10年余りGitHubを通じて慎重にラベリングされてきた膨大な動くコードが主な理由だ
また、チューリング完全な言語でできることは、ある程度限られてもいる
第二に、たいていの他の仕事ではLLMはかなり期待外れだ
リサーチはたいてい平凡な水準だ
厳密に見るなら、同じリサーチプロンプトを何度も繰り返し、混同行列を作って偽陽性と偽陰性がどれだけ出るか数えればよい
それ以外の用途についても、正直なところ、基本的な検索エンジンクエリやWikipediaを見る以上のことを本当にしてくれるのか自問すべきだ
一般ユーザー向け用途ではある程度便利ではあるが、革命的と言うにはほど遠い
プログラミングでは、エージェントがコンパイラとテストを実行し、うまくいくまで再試行すればよい
たとえばTシャツを縫いたいなら、AIは役に立たない
最近の米国の成人のうち、実質的にリテラシーが不足している人がどれほど多いかも考慮すべきだと思う。
2023年時点で、米国の生産年齢人口の成人の 27% が PIAAC のリテラシー5段階中レベル1以下だった。
2013年にはレベル1以下が17%だったので、この10年で大きく悪化している。
2023年の全体スコアは、レベル1以下が27%、レベル2が29%、レベル3が31%、レベル4/5が13%だった。
ちなみにレベル1は、1ページ分の文章ですら適切に扱うのが難しく、単純な1ページのウェブページならある程度処理できる程度の水準だ。
レベル2になって初めて数ページの単純な文章を扱えるが、それでも複雑な内容は難しい。
AIをまったく使わない人たちは、根本的に使えないから使わないケースが多い。
出典: https://nces.ed.gov/surveys/piaac/2023/national_results.asp
https://nces.ed.gov/surveys/piaac/measure.asp?section=1⊂_...
自分では明らかにリテラシーはあると思っているが、4/5レベルの課題をどの程度うまくこなせるのか気になる。
一般的な「リテラシー」がある人でも苦手かもしれない記憶力、知能、学習習慣のような、より広い指標とも重なっているのか気になった。
説明だけ見ると、AIに適用するのに向いたテストのように思え、複数モデルの熟達度スコアを見てみたい。
後でスクロールしてみたら最後のセクションにレベル4までの例題があり、レベル4の問題も些細に見えた。
いちばん冗長な Q Drum の記事ですら批判点は平地とコストの2つだけで、LifeStraw を知っていればメール内の似た批判もほぼ推測できる。
スコアと熟達度の説明を見て正規分布っぽく調整されており、4/5レベルは本当に難しいのだと思っていたが、実際の問題を見ると点数が低いことのほうが悲しくなった。
それでも各試験問題を「刺激」と呼ぶのは、あまりに無菌的で臨床的な感じがして笑ってしまった。
AIモバイルアプリは 音声会話 をサポートしている。
低いリテラシーは、むしろAIにテキストを生成・要約させる動機になりうる。
この統計は直感的にあまりしっくりこない。
米国人口の約3分の1が学士号を持っているのに、4/5レベルのリテラシー課題を通過できる人が 13% しかいないというのは妙だ。
例題を見る限り難しくなく、レベル4の課題も短い文章を読んで製品への批判を抜き出す程度だ。
学士号保持者が全員賢いという意味ではないが、そのうち3分の2が4/5レベルを通過できないというのは信じがたい。
修士号保持者が13%なら、4/5レベルを通過するのがその13%だけということなのかとも思う。
https://en.wikipedia.org/wiki/Educational_attainment_in_the_...
特に 読解力 がひどいという話が多く、数段落読んだあとで内容についての質問に答えられない子どもの事例が多い。
AIがあらゆる場面で使われるのが怖いのは、それが最善の解決策だからではなく、人々が本質的に怠け者で、ただ仕事を終わらせたがり、品質をあまり気にしないからだ。
「低い労力と利便性」は「最高品質」に安定して勝つようで、これはあらゆるものを皆にとって劣化させるだろう。
Windows 11 と 98 を比べると、11 のほうがより多くのことができて、クラッシュしにくいのは確かだ。
だが、それ以外で本当に優れているのか。両者ができることのうち、どちらがよりうまくこなすのか。どちらがより速いのか。どちらがより使いやすいのか。
その程度なら問題ないと思う。
個人的には、「AIを使う」が正確に何を意味するのか、もっと議論されてほしい。
これが人々の持つ「技術」「AI」「道徳と感情」のような高次の考えとどうつながるのかも気になる。
少なくとも自分にとっては、その境界は少し曖昧になり始めている。
たとえば、自分のパートナーが一日中 Google.com をよく使い、検索結果ページの最上部にあるAI生成の要約をほぼ毎回選んで信じているなら、実質的に「AIを使っている」と言うべきだろうか。
それとも「AIを使う」とは、SFに出てくるマットレスの上で1000個のサブエージェントを走らせる吸血鬼みたいな子どもたちに近いものなのだろうか。
基本的なスマホ利用にさえ今やAIが大量に入り込んでいるのだから、そう呼ぶかどうかにかかわらず、この全体のスペクトラムはかなり興味深いと思う。
「人は肉を食べるようにAIを消費する。受け入れる人もいれば、使用を制限する人もいれば、完全に避ける人もいる」という比喩は興味深い。
実際の生態学的な問題や肉食への原則的な反対論があるにもかかわらず、世界的には多くの国で 肉類消費 が数十年にわたって概ね増加してきたからだ。