2 ポイント 投稿者 GN⁺ 2024-02-22 | 1件のコメント | WhatsAppで共有
  • OculusのCTOも務めたジョン・カーマックのツイート

    "プロンプトエンジニアリングとフィルタリングで設定されたAIの行動ガードレールは公開されるべきであり、開発者は社会にとって最善が何かという自らのビジョンと、それを命令とコードで具体化したプロセスを誇りを持って明らかにするべきです。
    実際、多くの人が恥を覚えていると思います。
    もちろん、人間のフィードバックを通じて強化学習でエンコードされた数千の小さなナッジは、はるかに説得力のある悪用可能性をもたらします。"

1件のコメント

 
GN⁺ 2024-02-22
Hacker Newsのコメント
  • Googleは、画像認識モデルで黒人をゴリラとして誤認識したなどの批判を受けた後、画像生成システムで多様性を過度に反映しようとしたように見える。
  • 大規模なコンテンツ管理やモデレーションに直接関わったことはないが、一般的に自動化されたルールが公開されないのは、セキュリティのためにある種の「暗号化」が必要だからだと理解している。例えば、禁止ワードリストを公開してしまうと、人々がリストにない語を使って問題のある内容を表現する方法を簡単に見つけられてしまうことになる。しかし現時点では、より良いアプローチがないようだ。
  • Geminiは白人のキャラクター生成に問題があり、さらに差別的な問題を引き起こす可能性がある。多様性、公平性、包摂性(DEI)への取り組みは、逆に失敗を招いてしまうかもしれない。
  • Geminiのガードレールは非常に厳しく、無害なプロンプトでも何度も引っかかる。ChatGPTも同様だが、Geminiほどひどくはない。フィードバックを通じてガードレールをもう少し緩めてくれればと思うが、近い将来はこのまま続きそうだ。
  • ローカルでLLM(大規模言語モデル)とStable Diffusionを簡単に実行でき、ユーザーのリクエストに従って動く。十分な性能のPCがあれば、OpenAIやGeminiより速く動くこともある。LM StudioとAUTOMATIC1111は、それぞれローカルでLLMとStable Diffusionを実行することを簡単にしてくれる。
  • 検閲は、検閲対象が何か分からない場合にしか効果がない。検閲される内容自体がメッセージを運んでしまう。
  • AIの安全機能の透明性を高める動きは見たいが、すぐに実現するとは思わない。透明性は、安全機能の回避をはるかに容易にしてしまう可能性がある。
  • 人々が黒人女性をリクエストしたときに白人男性が生成されることに腹を立てるだろうと知って、Googleは安全な道を選んだのだろうが、現状の結果も容認されるべきではないことを示す必要がある。
  • この安全機能を作ったチームの地理的背景と言語が気になる。生成物は南アジア系(とくに南アジア女性)と黒人を主に生成する傾向があり、ラテン系はほぼ生成されない。米国ベースのチームであればこれは大きな漏れになり得る。しかし、ステレオタイプの先住民や東アジア人は時々生成される。
  • これはあなたを傷つける可能性がある。あなたを傷つけないためのものだ。しかし、どのように害が生じるか、どのように守るべきかは分からない。