- ユーチューブが一部の人気チャンネル動画にAIベースの補正技術を適用し、クリエイターや視聴者に知らせずに行っていたことが明らかになった
- 音楽ユーチューバーのRick BeatoとRhett Shullが、自身の動画で肌、髪、服のしわなどが微妙に変わっていることを発見し、問題を提起した
- ユーチューブは「一部のShorts動画に限定した実験」として、従来型の機械学習で動画の鮮明度とノイズを改善したと説明した
- しかし専門家は「機械学習もAIの一部」として、用語のすり替えと透明性の不足を批判し、コンテンツ信頼性の毀損懸念を示した
- クリエイターの同意なしにコンテンツが修正される今回の事例は、デジタルメディアの真実性と信頼問題を露わにした事件として評価されている
ユーチューブの非公開AI動画補正実験
- ユーチューブが一部の人気クリエイターの動画にAIベースの映像向上技術を非公開で適用
- クリエイターや視聴者へ事前通知なしに、動画の視覚的要素を修正
- Rick BeatoとRhett Shullが、自身の動画で肌の質感、髪の毛、服のしわ、耳の形が変化しているのを発見
- Beatoは「髪が奇妙に見え、メイクをしたように感じた」と述べた
- Shullは「AIが生成したもののように見える」とし、視聴者との信頼が損なわれる可能性を指摘した
実験の確認とユーチューブの見解
- ユーチューブは一部のShorts動画で小規模実験を進めていることを認めた
- クリエイターリエゾンのRene RitchieがX(旧Twitter)を通じて、「従来の機械学習で動画の鮮明度とノイズを改善する実験」と説明した
- スマートフォンの自動補正機能と同等のレベルだと主張
- しかし、ピッツバーグ大学のSamuel Woolley教授は「機械学習はAIの下位概念」とし、ユーチューブの説明が誤解を招く表現だと批判
AI事前処理の拡大と信頼性の問題
- 専門家は今回の事例が、AIがコンテンツを事前処理する広範な傾向の一環だと指摘
- サムスンはAIで月面写真をシャープにする機能を使っており、Google Pixelの「Best Take」は複数の表情を合成して1枚の完璧な写真を生成する
- Woolleyは「クリエイターの同意なしにコンテンツを修正して配信する行為」とし、視聴者とメディアの間に見えない改変層が生まれると警告した
- これはコンテンツの真正性と透明性に関する懸念を招く
クリエイターと専門家の反応
- Beatoはユーチューブの試みに対し「常に新しいツールを試しているプラットフォーム」として肯定的な姿勢を示した
- 「ユーチューブは私の人生を変えた」と述べ、批判を控えた
- 一方、評論家は事前通知なしの修正が危険な先例を残すと指摘
- ユーチューブは娯楽だけでなくニュース・教育・情報コンテンツの主要プラットフォームであるため、正確性と真正性が特に重要だと強調
デジタルメディアの将来の方向性
- この事例は、AIがユーザーの認知段階より先でコンテンツを再構成する未来を予告している
- 視聴者が再生ボタンを押す前から、すでにAIが介入した動画が提示される可能性を示している
- 透明なAI利用告知とクリエイター同意手続きの必要性が浮き彫りになっている
1件のコメント
Hacker Newsのコメント
リップメイク動画では唇が大きくなり、アイメイク動画では目が大きくなるといった具合に、AIがコンテンツの種類を検知して自動でフィルターをかけている現象だという
関連動画はこちらで見られる。クリエイターのアップロード内容を同意なしに改変するなんて衝撃的だ
インフルエンサーが非技術者だからAIフィルターだと勘違いしたのだと思う。動きのブロックが画面上を漂うのは高圧縮の典型的な現象だ
技術フォーラムでこうした主張がそのまま受け入れられているのは不思議だ。動画全体が細部に乏しく、圧縮の痕跡がはっきりしている
利用規約上、プラットフォームが「好きなようにできる」という条項があるので、あとで「ユーザー設定」だと言って正当化するかもしれない
「Metaが自動音声翻訳をするとき、口の動きを音声に合わせるためにAIフィルターを追加するのだが、その過程で顔全体に変なフィルターがかかることがある」
コンテンツの種類ごとにフィルターを変えて適用しているというのは、陰謀論レベルの過剰な推測に思える
肌が過度になめらかになり、髪はワックスを塗ったように見え、動く物体の周囲に妙なリングが生じる
最初はクライアント側のアップスケーリングかと思ったが、サーバーで処理されているのでオフにもできない
人々がこういう画質に慣れてしまうと、あとでAI生成コンテンツが混ざっても気づきにくくなる気がする
人々は延々とスクロールし、広告と脳を溶かすようなコンテンツだけを見ることになるだろう
ffmpeg -i source.mkv -i suspect.mkv -filter_complex "blend=all_mode=difference" diff_output.mkvというコマンドを使うこうした主張は多いのに、実際に比較動画(diff) を上げた人はまだ見たことがない。誰かやってくれたら面白そうだ
YouTube動画の0:31でShortsと元動画を並べて見せている
Patreonに上がっている高画質版では差がずっとはっきりしている
最近はサムネイルをキャプチャしてChatGPTに質問したり、動画URLを文字起こし抽出ツールに入れてGeminiで分析したりしている
クリックベイト制作者は今や「ChatGPTに聞くための話題提供者」程度にまで落ちぶれている
クリエイターに知らせもせずにこんな「改善」をするのは賢明ではない
よりよいプラットフォームを試す人がもっと増えるべきだ。特に虚偽の著作権申告に苦しんでいる中小クリエイターのためにも
代替としてはFediverseのPeerTubeのようなプラットフォームがある
エンゲージメントを高めるのはクリエイターの役目であって、プラットフォームが介入すれば結局ユーザーは離れていく
関連例はこの記事にある
非可逆圧縮と適応量子化によって肌がなめらかに見える現象が起きる
科学者、政治家、経済学者、技術専門家たちが丸ごとAIで複製されて登場している
関連記事: The Guardianの報道
Googleが外部にきれいなデータを提供する理由はないと思う
たとえばこのチャンネルは、実際の動画フレームではなく、Stable Diffusionで生成したような要約画像を使っている
私のチャンネルでも一度見たことがあるが、今はオプションが消えている。フォローしているチャンネルの大半がこの機能を使っている
個人的には気に入らない
たとえば「英語をゲール語に変える」「オヤジギャグをlorem ipsumに置き換える」「犬を宇宙生命体に変える」といったプロンプトを動画の下に入力できるようにするといい
ブラウザ上でローカル実行できたら素晴らしいが、そのころにはたぶん法的に禁止されているかもしれない