Meta AI、動画上のすべての点(ピクセル)を追跡するモデル「CoTracker」を発表
(co-tracker.github.io)- Meta AIが、動画内のポイント(ピクセル)を追跡するための新しいモデル「CoTracker」を発表
- CoTrackerは、ポイント間の相関関係を考慮し、動画全体にわたって複数のポイントを追跡することを目的としている
- アーキテクチャは、オプティカルフローとトラッキング分野の文献におけるアイデアを基盤としており、専用のアテンションレイヤーを備えたTransformerネットワークを使用
- スライディングウィンドウ方式を用いることで長い動画にも適用でき、他のポイント追跡手法と比べて効率的で精度が高いことが示されている
- このモデルは、特に遮蔽がある場合でも、よりクリーンで線形的な追跡を生成
- CoTrackerは、精度の面でTAPIRやMulti-Flow Trackingといった他の研究より優れた性能を示している
- ソフトウェアエンジニアにとって、動画内のポイントを追跡するための新たな強力なツールを提供し、性能と精度を向上させる重要な進展
3件のコメント
デモがなんだかきれいですね。VRで必要なものを考えると、ビジネス的にもある程度一致する部分があるような気もしますが……
Hacker Newsの意見
メタの研究部門のビジネス面での方向性は明確ではなく、中核事業との関係も理解できません。
これが核心を突いたコメントですね。研究は良いのですが、ビジネスとのアラインメントがよく分からない部分も多いです。
まるで昔のGoogleを見ているような感じもしますが…