6 ポイント 投稿者 xguru 2024-09-14 | 2件のコメント | WhatsAppで共有
  • OpenAIの強化された推論システム「Strawberry」について先行アクセスして試すことができ、今では公開されたので考えを共有できるようになった
  • 新しいAIモデルであるo1-previewは、問題を解く前にAIが「考える」ことを可能にする
  • これにより、計画と反復が必要な非常に難しい問題を扱うことができ、実際に極めて難しい物理学の問題を解くうえで人間の博士レベルの専門家を上回ることがある
  • このシステムは驚くべきものだが、依然として制限があり、今後の発展の方向性を示している
  • しかしo1-previewはあらゆる面で優れているわけではなく、たとえばGPT-4oより文章作成が得意というわけではない
  • クロスワードパズルはLLMにとって特に難しい
    • 相互に影響し合う多くの答えを試し、却下する反復的な解法プロセスが必要だからである
    • LLMは一度に1つのトークン/単語しか回答に追加できないため、これを実行できない
    • Claudeのような一般的なLLMはクロスワードパズルをきちんと解けない
    • しかしStrawberryは108秒間「考えた」後、クロスワードパズルをほぼ完璧に解いてみせた
  • o1-previewはStrawberryなしでは不可能だったことを可能にするが、それでも完璧ではない
    • エラーやハルシネーションは依然として発生し、ベースモデルであるGPT-4oの「知能」によって制約される
    • 新モデルを受け取った後も文体批評にはClaudeを使い続けており、文体の面ではClaudeが依然として優れている
    • しかし複雑な計画や問題解決に関わる作業ではClaudeの利用をやめており、この点で大きな飛躍を示している

共同知能(Co-Intelligence)にて..

  • o1-previewを使うと、AIにおけるパラダイムシフトに直面することになる
  • 計画とは、AIが自ら問題解決の方法を導き出す形の行為である
  • AIが多くの思考と作業を通じて完全な結果を出すことで、人間のパートナーの役割が縮小していると感じられる
  • AIが自ら答えを提示し、ユーザーはAIの推論過程を検討して誤りを見つけることはできるが、成果物へのつながりや解決の方向性への貢献度は小さくなる
  • こうした変化が必ずしも悪いわけではないが、従来とは異なる
  • システムが真の自律エージェントへと発展するにつれ、私たちは誤りを見つけ、自分たちが解こうとしている問題の流れを把握するために、どう関与していくべきかを考えなければならない
  • o1-previewは、現在の限界にもかかわらず、私たちが予想していなかったAIの能力を示している
  • 重要な問いは、AIが発展するにつれて、私たちがAIとの協業の仕方をどのように発展させていくかにある
  • この問題は、まだo1-previewが解決できていない部分である

2件のコメント

 
bluekai17 2024-09-19

「重要な問いは、AIが発展するにつれて、私たちがAIとの協業のあり方をどのように発展させていくかにある」

難しいですね

 
xguru 2024-09-14

筆者はペンシルベニア大学ウォートン・スクールの教授である Ethan Mollick です。彼は起業家精神とイノベーション、そして AI について研究しています。
上記の内容は彼の Substack である One Useful Thing に掲載されたもので、このニュースレターの購読者は約19万人です。