Voila-A: Aligning Vision-Language Models with User' s Gaze Attention

Kun Yan, Zeyu Wang, Lei Ji, Yuntao Wang, Nan Duan, Shuai Ma

January 2024

PDF

类型

会议文章

出版物

Advances in Neural Information Processing Systems