1 ポイント 投稿者 GN⁺ 2023-12-15 | 1件のコメント | WhatsAppで共有

FunSearch: 数学・科学における新たな発見のための大規模言語モデル活用

  • 大規模言語モデル(LLM)は概念を組み合わせる能力に優れており、読解、執筆、コーディングを通じて問題解決を助ける有用なツールである。
  • LLMはときに事実ではない情報を「幻覚」として生成する傾向があるため、検証可能で正確な発見を行うことは難しい。
  • FunSearchは、創造的な解決策を提示する事前学習済みLLMと、誤ったアイデアをふるい落とす自動「評価者」を組み合わせて、新しい数学およびコンピュータサイエンスの解法を探索する手法である。

言語モデルによる進化で発見を推進

  • FunSearchは、最も高いスコアを得たアイデアを発展させる進化的手法を用い、これらのアイデアは自動的に実行・評価できるコンピュータプログラムとして表現される。
  • ユーザーは問題をコードの形で記述し、それはプログラムを評価する手順と、初期プログラムプールを初期化するシードプログラムで構成される。
  • FunSearchは反復的な手順であり、各反復ごとに現在のプログラムプールからいくつかのプログラムを選んでLLMに与え、LLMは新しいプログラムを生成して評価する。

数学に新たな道を切り開く

  • FunSearchは、数十年にわたり数学者たちを悩ませてきたキャップセット問題に対する新しい解法を発見した。
  • キャップセット問題は、高次元グリッド上で一直線上に3点が並ばない最大の点集合を見つける問題で、極値組合せ論における重要なモデルである。
  • FunSearchは、いくつかの設定において、この20年間で見つかったものの中で最大のキャップセットを発見した。

FunSearchは簡潔で人間が解釈可能なプログラムを好む

  • FunSearchは単に問題の解を生成するだけでなく、その解がどのように導かれたのかを説明するプログラムを生成する。
  • FunSearchは、コルモゴロフ複雑性が低い、すなわち非常に簡潔なプログラムによって解を見つけることを好む。
  • FunSearchのプログラム出力は研究者にとって理解しやすく、実行可能な洞察を提供する。

コンピューティング分野の悪名高い難題を解く

  • FunSearchは理論的なキャップセット問題で成功した後、コンピュータサイエンスにおける重要な実用課題である「ビンパッキング」問題にも適用された。
  • FunSearchは、既存のヒューリスティックよりも少ないビンで同じ数のアイテムを詰め込むことに成功した。

LLM主導の発見が科学とその先への道を開く

  • LLMの幻覚を防ぐことができれば、これらのモデルの力を活用して新たな数学的発見を生み出すだけでなく、重要な現実世界の問題に対する影響力のある解決策を明らかにできる。
  • 多くの科学および産業上の問題に対して、LLM主導のアプローチを用いて効果的で用途に合わせたアルゴリズムを生成することが一般的な実践になると予想される。

GN⁺の見解

  • FunSearchは、数学的問題解決における人工知能の新たな可能性を示している。特に、キャップセット問題のような長年未解決だった問題に対して新しい解法を提示したことで、数学分野におけるAIの役割はさらに重要になるだろう。
  • この技術が、データセンターの効率向上のような実際の産業課題に適用されることで、AIが実用的な問題解決にも貢献できることを示している。
  • FunSearchが生成するプログラムは人間が解釈可能であり、研究者がより深い洞察を得て、AIと協力して問題を解決する助けになるだろう。

1件のコメント

 
GN⁺ 2023-12-15
Hacker Newsの意見
  • LLMの必要性に関する疑問:

    • LLMの目的は、与えられた型シグネチャに合うPython関数を生成することのように見える。
    • LLMがなくても、与えられた型シグネチャに合うランダムで正しいPython関数を生成できるはずである。
    • より制限された言語の方が効率的である可能性を示唆し、PushGPのような言語を例に挙げている。
    • LLMが価値を付加しているのか、他の遺伝的プログラミング手法と比べて競争力があるのか、従来のアプローチと比べて計算コストに差があるのかを問うている。
  • 組合せ論における発見に関する重要な文脈:

    • ある特定の組合せ論の数が、以前に知られていた範囲よりも狭い範囲内にあることが明らかになった。
    • この発見は、論理中心の数学的証明ではなく、特別な性質を持つ数列を見つける方法によって実現された。
    • 遺伝的アルゴリズムとLLMを使う方法として、興味深く有用である可能性がある。
  • 「自己対戦」に関する関連コメント:

    • FunSearchは、LLMを用いた進化的手法を使って最も高いスコアを得るアイデアを発展させる。
    • ユーザーはコードの形で問題を記述し、プログラムを評価・初期化するために使われるプログラムプールを生成する。
    • 各反復でFunSearchは現在のプールからいくつかのプログラムを選び、LLMがそれをもとに新しいプログラムを生成して自動的に評価する。最良のプログラムは既存のプールに再び追加され、自己改善ループを生み出す。
  • Web検索に関する個人的な利用経験:

    • pplx.aiやphind.comを使って質問し、Webリンクを見つけている。
    • 質問を磨いたり追加の質問をしたりして、別の、あるいはより深い参照先を見つけている。
    • Tech Twitterのコンテンツも有用であり、研究にGrokを使うことを期待している。
  • DeepMindの発見に関するTwitter投稿:

    • もしニューラルネットワークが本当に新しい知識を生成できるなら、それは火の発見以来もっとも重要な発見になるだろう。
    • このような発見が事実なら、なぜ誰もがそれについて話していないのかという疑問を提起している。
    • Palm 2で達成されたことへの感銘と、今後のモデルがこの方法を活用するときの可能性への期待を表明している。
  • Twitter投稿の要約:

    • AIの機能は継続的に向上しており、AIオートコンプリート、リファクタリング、コードレビューの差分生成などを通じて個人の生産性が20〜30%向上している。
    • AIモデルを使ってビジネスフローの一部を接続すれば、システムを「改善」することはモデルを置き換えるのと同じくらい簡単になる。
    • 初期統合の後は、数年にわたってあらゆるものが魔法のように改善されると期待している。
  • プログラム生成に関する要約:

    • プログラムテンプレート/スケルトンと適応度関数が与えられた状態で、LLMを用いてプログラム集団を生成する。
    • 新しいプログラムを生成するプロンプトを使い、入力に対してプログラムを実行して適応度関数でスコアを付ける。
    • 進化にはアイランドモデルを用い、LLM呼び出し回数は約1e6と少ない。
    • プログラム評価/スコアリングにおける深さと広さのトレードオフについて考察している。
  • キャップセット問題へのアプローチ:

    • キャップセット問題は、高次元グリッドで3点が一直線上にない最大の点集合を見つける問題である。
    • FunSearchはこの問題に対して、最大のキャップセットを発見するプログラムという形の解を生成する。
    • これは過去20年間のキャップセットの大きさの増加としては最大の増加を示している。
  • LLMと記号的推論の統合可能性への関心。

  • 新しい知識を生成しているかどうかにかかわらず、AIモデルのサイズやその他の規制措置に基づくAIアクセス制限を考える際のケーススタディとして興味深い。

  • 普遍近似定理に関連して、ReLUを使う人工ニューラルネットワークで関数を正確に近似できることに言及している。

    • このアプローチは似ているが、最終的にはコードを提供する。