Audio-Video Question Answering (AVQA)

1 papers with code • 0 benchmarks • 0 datasets

This task has no description! Would you like to contribute one?

Benchmarks

Add a Result

These leaderboards are used to track progress in Audio-Video Question Answering (AVQA)

No evaluation results yet. Help compare methods by submitting evaluation metrics.

Most implemented papers

Most implemented Social Latest No code

VALOR: Vision-Audio-Language Omni-Perception Pretraining Model and Dataset

TXH-mercury/VALOR • • 17 Apr 2023

Different from widely-studied vision-language pretraining models, VALOR jointly models relationships of vision, audio and language in an end-to-end manner.

Paper
Code

Audio-Video Question Answering (AVQA)

Benchmarks Add a Result

Most implemented papers

VALOR: Vision-Audio-Language Omni-Perception Pretraining Model and Dataset

Content

Benchmarks

Add a Result