20 ポイント 投稿者 xguru 2023-10-30 | まだコメントはありません。 | WhatsAppで共有
  • SnowflakeのAI/ML戦略責任者であるAhmad Khanの発表内容

「非構造化」データ活用による収益化

  • 企業データの大半、その80%以上は、Word文書、画像、音声/動画ファイルのような「非構造化データ」
  • しかし大半の企業はこうした情報をほとんど活用しておらず、これはビジネス上の意思決定で利用可能なデータの20%未満しか使っていないことを意味する
  • このような非構造化データを大規模言語モデルのそばに配置してチャットボットを効果的に構築すれば、現在は活用度の低い膨大な情報の解釈と分析に役立てることができる
  • こうした企業が属する特定の業界に合わせたモデルを作れる可能性は無限にある

個人情報保護とセキュリティ

  • 自社データが、競合他社を含む他社でも使えるモデルの学習に利用される可能性があるという懸念が企業の間で高まっている
  • その結果、企業はより良いセキュリティを提供する性能で劣る製品で妥協することも多く、これはより安全な製品の市場を生み出している
  • たとえば、Llama 2は最も高性能な大規模言語モデルではないが、それでも顧客はChat GPTのように統制しにくいモデルではなくLlama 2を選んでいる
  • 多くの企業はデータの独自性を強みとしているため、データが公共のインターネット上に公開される状況を避けたがっている

優れたユーザー体験を提供して競争優位を確保

  • スタートアップはどうすれば大企業の規模に対抗して競争できるのか?
  • 魅力的なユーザーインターフェースを作るなど、心地よいユーザー体験を生み出すことに集中するよう提案
  • これがSnowflakeの取ったアプローチ
  • 特に自社サービスの大半はAmazon Web Servicesのようなクラウド事業者と競争できないため、高い価格設定を正当化できる優れたユーザー体験の構築に注力

バーティカルに集中

  • ダビデがゴリアテに勝つもう1つの方法として、汎用アプリケーションよりも製造、金融、医療、エンターテインメントのような特定業種に集中するのがよい
  • 「その業種の企業が何を求めているのかを把握し、そのニーズを満たすサービスを提供すべきだ」と助言
  • たとえばGoogleが医療向け大規模言語モデルを開発する可能性は高いが、特別に深く取り組む可能性は高くないため、小規模企業にはそのモデルを構築できる機会がある

データアトリビューションへの需要はますます高まっている

  • 著作権のある資料を追跡し、資料の元の制作者に報酬を支払うことで、その制作者がさらに多くの資料を開発する動機を与える新しいモデルの可能性
  • Khanは、さまざまな法的理由からオープンソースモデルを使えない複数の事例を挙げ、画像生成にオープンソースモデルを使いたがらないある映画スタジオを例として示した
  • このスタジオはライセンス料と費用を支払い、Getty Imagesのデータで学習したモデルを使用
  • 今後、アトリビューション付きデータセットを使う同様のモデルの市場はますます拡大していくだろう

まだコメントはありません。

まだコメントはありません。