VLMがユーザーの視線をどこまで予測できるのか、実際のアイトラッキングデータで比較
(arxiv.org)こんにちは。他のニュースはいつも私より早く投稿される方がいるので、Show GN が成り行きで初投稿になりました。
UIでユーザーがどこを見るのかを VLM で予測できるのか気になり、自分で実験して論文にまとめました。
UEyes というデータセットを使って、VLM の視線予測結果を実際のアイトラッキングデータと比較しました。
arxiv の endorsement についても UEyes(cs.HC) の第1著者に問い合わせたところ、快く承諾してくださいました。
paper: https://arxiv.org/abs/2604.26352
github: https://github.com/dunward/uigaze
まだコメントはありません。