社会的価値導入のための提案:言語モデルで一貫して推論可能な意志を構築する[翻訳]
(docs.google.com)- OpenAIのアラインメントチームのリードであるJan Leikeがブログに投稿した文章をDeepLで翻訳
- Alignmentは「1つのAIシステムを1人の人間に整合させること」
- 「個人の選好(誰もが自分に整合したAIを望む)」と「集団の選好(AIをどのような用途に使えるべきか、またデフォルトの動作はどうあるべきか)」に合わせて整合させる2つのカテゴリーがある
- この記事は2つ目のカテゴリーに関するもの
提案:シミュレートされた熟議型民主主義
- 中核となるアイデアは、大規模言語モデルを「熟議型民主主義」を模倣する学習に使うこと
- 熟議型民主主義とは、無作為に選ばれた少数の市民(「ミニ・パブリック」)が明示的に熟議する意思決定または政策決定のプロセス
- シミュレートされた熟議型民主主義の構築方法
- 価値に関する質問データセットの収集
- 人間の熟議の記録
- 背景条件付き模倣学習
- シミュレーション:新しい価値に関する質問
1件のコメント
チェ・スンジュンさんの「この記事の文脈に関する補足説明」もあわせてお読みください。(文書の前半にもリンクがあります)
https://facebook.com/seungjoon.choi/posts/…