Audio-visual Question Answering

12 papers with code • 1 benchmarks • 1 datasets

This task has no description! Would you like to contribute one?

Benchmarks

Add a Result

These leaderboards are used to track progress in Audio-visual Question Answering

Trend	Dataset	Best Model	Paper	Code	Compare
	MUSIC-AVQA	VAST			See all

Datasets

MUSIC-AVQA

Most implemented papers

Most implemented Social Latest No code

Answering Diverse Questions via Text Attached with Key Audio-Visual Clues

rikeilong/mcd-foravqa • 11 Mar 2024

Audio-visual question answering (AVQA) requires reference to video content and auditory information, followed by correlating the question to predict the most precise answer.

Paper
Code

Look, Listen, and Answer: Overcoming Biases for Audio-Visual Question Answering

reml-group/music-avqa-r • • 18 Apr 2024

The former leads to a large, diverse test space, while the latter results in a comprehensive robustness evaluation on rare, frequent, and overall questions.