Computer Vision

Referring expression generation

13 papers with code • 0 benchmarks • 1 datasets

Generate referring expressions

Benchmarks

Add a Result

These leaderboards are used to track progress in Referring expression generation

No evaluation results yet. Help compare methods by submitting evaluation metrics.

Datasets

A Game Of Sorts

Most implemented papers

Most implemented Social Latest No code

Enhancing Visual Grounding and Generalization: A Multi-Task Cycle Training Approach for Vision-Language Models

anonymgiant/vilam • • 21 Nov 2023

Furthermore, we contribute a VG dataset, especially with multi-tasks.

Paper
Code

Elysium: Exploring Object-level Perception in Videos via MLLM

hon-wong/elysium • 25 Mar 2024

Multi-modal Large Language Models (MLLMs) have demonstrated their ability to perceive objects in still images, but their application in video-related tasks, such as object tracking, remains understudied.