Visual programming language Visual Language Examples

DiViCo: Disentangled Visual Token Compression for Efficient Large Vision-Language Model

Abstract: Large Vision-Language Models have drawn much attention and become increasingly applicable in complicated multimodal tasks such as visual question answering, video grounding, etc. However, it ...

IEEE

Monocular Multi-Object 3D Visual Language Tracking

Abstract: Visual Language Tracking (VLT) enables machines to perform tracking in real world through human-like language descriptions. However, existing VLT methods are limited to 2D spatial tracking ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

DiViCo: Disentangled Visual Token Compression for Efficient Large Vision-Language Model

Monocular Multi-Object 3D Visual Language Tracking

Trending now