5 ポイント 投稿者 GN⁺ 2024-08-19 | 1件のコメント | WhatsAppで共有

マルコフ連鎖とは何か

  • LLMs(大規模言語モデル)が初めて登場したとき、人々はこれを非常に賢いマルコフ連鎖だと説明していた
  • 最近では、人々はマルコフ連鎖よりもLLMsのほうになじみがある
  • マルコフ連鎖は、非常に小さく、非常に単純で、非常に素朴なLLMだと言える
  • マルコフ連鎖は現在の文脈に基づいて次の単語を予測するが、意味論、次元性、その他の複雑なベクトル数学は考慮しない
  • マルコフ連鎖は原始的な統計モデルである
  • 携帯電話キーボードの「次の単語候補」機能は、一般的にマルコフ連鎖を使用している
  • マルコフ連鎖は実行コストが低く、ユーザーのテキストスタイルに合わせて簡単に更新できる
  • LLMsとマルコフ連鎖の動作原理は深く説明できるが、ここではマルコフ連鎖がLLMsよりもタスク遂行能力で劣る、ということだけ知っていればよい

面白さとは何か

  • ユーモアは、深刻ではない驚きに関するものである
  • 最高のジョークには、楽しくて重要な「スナップ」が含まれる
  • 「スナップ」は、驚きから来る衝撃を意味する
  • 驚きが少ないほど、面白さは減る
  • ジョークをたくさん聞くほど面白くなくなる理由はこれである
  • 「ランダム」なユーモアは、予測不可能さが予測可能であるため面白くない
  • ジョークを書くことは、パターンを破ることに関係している
  • 「場面の実現」によってスナップを強めることができる
  • より独創的または描写的な言語を使うと、場面はより現実的に見える
  • ジョークには多様性があり、ユーモアは主観的である

LLMsの予測可能性

  • 文をうまく予測するには、多くの文脈が必要である
  • LLMsは多くの文脈を持っている
  • LLMsは多くの数学的計算を通じて、最も可能性の高い次のトークンを見つける
  • 「より良い」LLMは、より予測可能である
  • LLMsは創作的な文章には向いていない
  • LLMsは平均的な結果を生成する
  • ジョークを生成するには、LLMが驚きを与えなければならない
  • 良いLLMはこれをうまくできない
  • LLMsは芸術的表現には適していない
  • LLMsは興味深い概念を見落とすことがある
  • このフレームワークを通じて、新しい言語モデルを作れるかもしれない

なぜこれが興味深いのか

  • これは、より深い何かを示している
  • これは、魂対機械という論争ではない
  • これは、モデルに内在する欠陥を示している
  • ChatGPTのメッセージは高校のエッセイのように見える
  • これは平均的な出力を再現したものである
  • これは個性が取り除かれ、学術的厳密さによって補強されたものである
  • これは平板で企業的な口調である
  • 偽のAmazonレビューは簡単に見分けられる
  • LLM検出モデルは、まもなく個性を検査しなければならなくなるだろう

GN⁺のまとめ

  • この記事は、マルコフ連鎖とLLMsの違いを説明し、ユーモアの本質を探っている
  • マルコフ連鎖は単純な統計モデルであり、LLMsより予測能力が低い
  • ユーモアは深刻ではない驚きに基づき、ジョークを書くことはパターンを破ることに関係している
  • LLMsは予測可能性が高く、創作的な文章には向いていない
  • この記事はLLMsの限界を示し、新しい言語モデルの可能性を提示している

1件のコメント

 
GN⁺ 2024-08-19
Hacker Newsの意見
  • 数年前にサイドプロジェクトをしていて、同じ結論に達した

    • AWSブログ記事を生成するサイトを作った
    • マルコフ連鎖ジェネレーターでAWSの発表記事を学習させた
    • HTMLとCSSをコピーして、PythonとJSで組み合わせた
    • 結果はかなり面白かった
    • GPTを使ってアップグレードしようとしたが、あまり面白くなかった
    • 現代のLLMはリアルすぎて、面白さが薄い
    • 初期のマルコフ生成器のユーモアは、ばかばかしさから生まれていた
    • 現代のLLMはたまに間違うが、ばかばかしくはない
  • Claude 3.5 Sonnetに、マルコフ連鎖がLLMより面白いというテーマで短いジョークを10個書いてくれと頼んだ

    • マルコフ連鎖が道路を渡った理由は、予測不能性の向こう側へ行くためだ
    • LLMとマルコフ連鎖がバーに入ったとき、LLMは統計的にもっともありそうな飲み物を注文し、マルコフ連鎖はチーズ製のランプシェードを注文した
    • マルコフ連鎖がオヤジギャグを言うとき、それを「Mark-ov Twain」と呼ぶ
    • LLMは電球を替える最適な方法を20分かけて説明する
    • マルコフ連鎖が「Markov chain reaction of nonsensical hilarity」と言う
    • LLM、マルコフ連鎖、GPT-4がバーに入ったとき、GPT-4は帰り、LLMは倫理問題を議論し、マルコフ連鎖はスパゲッティ製の自転車を注文する
    • LLMの好きな映画は「Predictable and Furious 17: The Safest Driving Yet」だ
    • マルコフ連鎖が「バナナのお城に住むお姫様と、感情を持つトースターの王国」の話をする
    • マルコフ連鎖がLLMに「お前の母親はそろばんで、父親はシリコン臭い」と言う
    • マルコフ連鎖がよいカウンセラーではない理由は、「感情をバナナにして帽子みたいに作れ」と助言するからだ
  • だからといってマルコフ連鎖のほうが優れているという意味ではない

    • 予測のために訓練されたモデルは、私たちの内的な予測エンジンと大きく違っていないはずだ
    • 問題は、テキストの不気味の谷に近づいていることだ
  • 大学時代、友人たちが大学新聞の「警察レポート」欄にマルコフ連鎖ジェネレーターを使っていた

    • 生成物の10%がいちばん面白かった
    • 現代のLLMは高水準の意味を保とうとするので、こういうばかばかしさを避ける
  • 聖書をこういう実験に使うのは居心地が悪い

    • イエスの磔刑の画像をAI画像修正モデルに使うのと同じだ
  • 実証的な証拠として、/r/subreddit simulator はマルコフベースのRedditパロディだ

    • /r/SubSimulatorGPT2 はLLMベース版だ
    • マルコフ版のほうがアップボートを多く集め、より面白かった
  • Redditに「AIが書いた偽のXYZ」を何度か投稿した

    • いちばん反応がよかったモデルはGPT-2だった
    • マルコフ連鎖は1〜2文を超えると面白さが続かない
    • GPT-3以降のモデルは整いすぎていて退屈だ
    • GPT-2は文法はだいたい合っていて、一貫したアイデアも保ちながら、特定の話題に関する知識が不足しているので、より面白い
  • 10年ほど前、学生だったころにマルコフTwitterボットを作った

    • Linus TorvaldsのLKMLメールと、イエスのキング・ジェームズ聖書の引用を学習させた
    • 2つの訓練セットがほとんど重ならなかったので、ヒステリシスを追加しなければならなかった
  • AI weirdnessブログの進化がこの考えを裏づけている

    • 初期のLLM、特にGPT-3以前の版のほうが面白かった
    • たとえば、Ada版GPTが生成したシリアル名は、Da Vinci版よりも面白かった
  • 個人Discordサーバーに2つのボットがある

    • 1つはチャット履歴全体を学習した基本的なマルコフ連鎖ボットだ
    • もう1つはちゃんとしたLLMボットだ
    • マルコフ連鎖ボットのほうがいつも面白い