Meta AI Demos

(aidemos.meta.com)

1 ポイント投稿者 GN⁺ 2025-02-10 | 1件のコメント | WhatsAppで共有

Metaが最新のAI実験と技術デモを1か所に集め、新しいツールを早期に試せる場
FAIRやMeta内の他の研究チームの実験を含み、研究・創造性・技術が交差するアイデアを扱う
デモは最新モデルベースのツール、Segment Anything関連ツール、遊び心のある軽量デモ、研究成果中心の技術デモに分かれる
ユーザーは新しいAIツールをテストしながら、AI技術の開発プロセスに貢献できる
一部の技術は今後Meta製品に統合される可能性があり、実験段階の機能を先取りして確認できる窓口となる

MetaのAI実験探索スペース

AI DemosはMetaが作成した最新のAI実験と技術デモをまとめて紹介する
FAIRとMetaの他の研究チームが作成したデモが含まれる
ユーザーは新しいAIツールに早期アクセスし、直接テストできる

デモ構成

Featured Experiments
- 最新モデルの機能で動くツールを見ることができる
Featured Segment Anything tools
- Segment Anything関連ツールを別カテゴリとしてまとめている
Playful Ideas
- 創造性と遊びのための軽量デモを扱う
Technical Explorations
- 新しい研究成果を示す技術デモが含まれる
- ユーザーのテストはAI技術開発に貢献でき、一部の技術は今後Meta製品に統合される可能性がある

1件のコメント

GN⁺ 2025-02-10

Hacker Newsの意見

デモツール集で、Segment Anything 2 は数回クリックするだけで動画の切り抜きや視覚効果を作れる。
Seamless Translation は別の言語で話す自分の声を聞かせてくれ、Animated Drawings は手描きのスケッチをアニメーションとして生き生き動かし、Audiobox はAI生成の音声と音でオーディオストーリーを作れるようにしてくれる。
- 「この研究デモは、IllinoisまたはTexasの居住者、あるいは当該州からアクセスしている人には公開されていない」と表示される。
  IllinoisやTexasではアクセスできず、おそらく音声変換まわりが原因でAI関連法に引っかかっているのだと思う。
  立法者には有益なユースケースも見て、生成AI全体を大ざっぱに封じるのではなく、悪用を狙い撃ちするよう法律を直してほしい。
Seamless Translation はかなり驚き。
英語とスペイン語を話せるので、英語の文を録音してスペイン語の出力を聞いてみたところ、自分のスペイン語にかなり近かった。
もちろん自分のスペイン語にはカスティーリャ風の表現が多いが、そこまで分かるとは期待していなかった。
- 本当のテストは、Argentina Mendoza出身の友人に使わせてみることだと思う。
  私はバイリンガルだが、いまだにその友人の言っていることが分からず、発話の半分が本当に単語なのかも確信が持てない。
- 使ってみたが、まったく自分の声には聞こえず、ただ何か「一般的な」男性の声が自分の言ったことをドイツ語に翻訳している程度だった。
  妻が「いまいち、全然あなたの声っぽくない」と言っていて、それで十分だ。
- 実際に声が自分のように聞こえたかが肝心だが、私の場合はまったくそうは聞こえなかった。
- 翻訳技術が「もう到達したのか」はまだ議論の余地があるが、どこかの時点で大半の実用用途には十分に良いと見なされ、言語の壁を実質的になくすことになりそうだ。
  その時には間違いなく話し言葉にもある程度影響し始めるはずで、怖くもあり面白くもある。
- 提供されている例があまりにひどくロボットっぽかったので残念だった。
  自分で試してみる気が削がれたが、考え直してもいいかもしれない。
HNのタイトルのように、意図的にAidemosと続けて書いたのか、それともAI Demosが正しいのか気になる。
- HNは投稿タイトルの大文字・小文字を自動的に調整するので、もともとは「AIDemos by Meta」として投稿された可能性がありそうだ。
Seamless Translation のデモは素晴らしい。
翻訳された声も自分の実際の声として見られるレベルで、これをリアルタイムでできるようになったらすごいことになりそうだ。
- すでに可能。
  Kyutaiが先週、デバイス上で動作するリアルタイム音声翻訳のデモを公開しており、今はiPhone 16 Proでフランス語→英語翻訳のみ動作する: https://x.com/neilzegh/status/1887498102455869775
  推論コードと重みも公開しており、GitHubで見られる: https://github.com/kyutai-labs/hibiki
MetaがAIで何を狙っているのか、よく分からない
研究はたくさんしているようだが、最終目標が何なのか曖昧で、GoogleやMSFTは理解できるものの、Metaはいまひとつピンとこない
- Metaは、AI競争の果てにお金が生まれる場所はデータセンターやモデルではなく、クローズドなエコシステムと独占データだと見ているように思う
  モデルとデータセンターが制約である間は、誰かがMetaを揺さぶれないよう、できることは何でもするだろう
  Googleが検索を阻むクローズドなエコシステムを防ぐために、Webのアプリケーション層を収益化しにくくしたのと似ている
  競争の末にモデルとハードウェアがコモディティ化すれば、Metaは個人および集団レベルの完全な心理プロファイルを持ち、それを研究し、極めて精密なコンテンツを提供できる
  本当の競合は、人々をソーシャルメディアから引き離して各自の孤立した世界へ送り込む「her」のようなアプリかもしれないし、ある意味ではDiscordがMetaエコシステムの代替世界だ。超集中型の招待制小規模コミュニティという点でそう言える
- https://gwern.net/complement
  Joel Spolskyが2002年に語ったテクノロジービジネスの大きなパターンは、補完財のコモディティ化である
  垂直統合の代わりに、複数の必須レイヤーで構成される製品において一つのレイヤーを支配し、その上下のレイヤーの競争を促進して競合する独占者が現れないようにし、スタックの別の場所の価格を限界費用まで下げ、全体価格を下げて需要を増やす戦略である
  元の商品がどれほど価値があり課金できるものであっても、別の場所の利益を大きくするなら、無料にするほうがより価値を持つことがある
  古典的な例は、MicrosoftのOS独占がPCハードウェアをコモディティ化し、IBMには不利に、MSには有利に働いたことだ
  このパターンは、大手テック企業が一見無関係だったり自傷的に見えたりする分野に参入する理由も説明する。インターネット企業による高いオープンソース貢献率、広告会社がスマートフォン製造・Webブラウザ開発・統計ソフトウェア・光ファイバー網・自治体WiFi・無線周波数オークション・DNSに参入するGoogleの事例などは、いずれもスタック内の別会社を先手でコモディティ化する、あるいは自分がそうされないための防衛と見なせる
- 自分も気になっていたが、今は大半が探索段階のように見える
  以前にcryptoを少し触り、今ではほぼ終わった「metaverse」実験をしていたのと似ている。もちろん、こうした探索にも時には莫大なお金がかかる
  これらのデモはAIをどこに使えるかを示してはいるが、それがMetaの事業にとって本当にゲームチェンジャーと言えるほど重要なのか、一般ユーザーにとって良いことなのかは、まだ未確定だ
  FacebookとInstagramの古くてひどいUIは10年以上ほとんど変わっておらず、7万人が働く会社であるにもかかわらず、最近は有用性よりも広告をさらに攻撃的に押し込むことに集中しているように見える
  事業が古くてバグだらけの20年物のFacebookと10年以上前からあるInstagramアプリのままであり続けるとしても、Reactの時のようにオープンソースモデルの発展に貢献するなら、全体としては利益になると思う
- 「metaverse」が失敗した後、次の**The Future(TM)**になるかもしれない別の場所にお金を使いたくて仕方がないのかもしれない
  LLMが次の大きな流れになる可能性は低いと思っていたとしても、Metaの立場ではかなり合理的かもしれない。お金も売上も非常に多いので、新しい流行のたびに乗っておき、そのうち一つが本物なら出遅れない、そうでなくても耐えられるという戦略が可能だ
  ほとんどのBig TechがLLMに関心を持つ理由も、結局はリスク管理に近いのではないかと疑っている
- 関係者から聞いた話をかみ砕くと、MetaのAIの目的は広告ターゲティングの改善だ
  より良い分類とクラスタリング、広告主向けのより良い「レコメンド」、視覚要素・文言・動画まで含まれる
  こうしたデモは副次効果、あるいは一種の「グリーンウォッシング」に近い。Metaの中核であり唯一の事業は広告で、他の収益化はすべて失敗している
Segment Anythingのデモはかなり印象的だが、実際の製品のどこかに統合されているのか気になる
趣味で友人たちの簡単な動画編集をしているので、かなり便利そうに見える
[0] https://sam2.metademolab.com/
- Photoroom [0]はY Combinator出身で、製品は本質的にSAMに多くの磨き込みと良いユーザー体験を載せたものに近い
  実際に使っているかは分からないが、使っていないなら使うべきだと思う
  [0] https://www.photoroom.com/
- 画像生成モデル用フロントエンドのSwarmUIはSAM2を統合しており、インペインティングのような作業で画像の一部を素早くマスクできるようにしている
  とても良い
- おそらくすでに使われているだろうが、そういう形で宣伝されることはなさそうだ
気になる人のために補足すると、Meta FAIRは「Facebook Artificial Intelligence Research」の略称で、その後「Meta AI」に改称された[1]
[1]: https://en.wikipedia.org/wiki/Meta_AI
リストがすべてではない
例えば、ヒューマノイド制御モデルであるMeta Motivoのデモ https://metamotivo.metademolab.com/ が抜けている
MetaはGPT-3とChatGPTの違いがもたらす影響を深く理解している
モデルは出発点であり、そのモデルに何をさせるかというユーザー体験が知能を浮かび上がらせる
特に視覚モデルではより顕著で、SAM2が「何でも見られる」と言うのは興味深い程度だが、サッカーボールをクリックしたときに、遮られても動画全体で滑らかに追跡するのを見るのは驚きだ
「現在、この地域ではサイトを利用できません」と表示される
- 国際市場や米国の一部の州ではそれぞれ異なるAI規制があるため、企業はAI製品を非常に慎重に扱う必要がある
  そのため、最先端モデルが特定の地域で遅れて提供されることがよくある
  小さなデモごとにすべてのコンプライアンスを確認して文書化する作業は、かかるコストに対して価値が低いので、おそらく米国と一部地域でのみ許可するようにしているのだと思う
- 米国でもこのメッセージが表示される
- 米国内でこのメッセージを見たが、VPNをLAに設定したら回避できた
  Metaのエンジニアがそこにいるからなのかなと思った ¯_(ツ)_/¯
  接続後には、次のような文言があった:
  「この研究デモは、IllinoisまたはTexasの居住者、あるいは該当州からアクセスする人には公開されていない」
  私はTexasにいる

Meta AI Demos

MetaのAI実験探索スペース

デモ構成

Featured Experiments

Featured Segment Anything tools

Playful Ideas

Technical Explorations

関連記事

1件のコメント

Hacker Newsの意見