TED-LIUM

Introduced by Rousseau et al. in TED-LIUM: an Automatic Speech Recognition dedicated corpus

The TED-LIUM corpus consists of English-language TED talks. It includes transcriptions of these talks. The audio is sampled at 16kHz. The dataset spans a range of 118 to 452 hours of transcribed speech data.

Homepage

Benchmarks

Add a new result Link an existing benchmark

Trend	Task	Dataset Variant	Best Model	Paper	Code
	Speech Recognition	Tedlium	parakeet-rnnt-1.1b
	Speech Recognition	TED-LIUM	ConformerXXL-PS

Papers

Paper	Code	Results	Date	Stars

Dataset Loaders

Add Remove

tensorflow/datasets

4,178

pytorch/audio

2,379

Tasks

Speech Recognition
Language Modelling

Similar Datasets

LibriSpeech

Earnings-21

Artie Bias Corpus

ASR-GLUE

Usage

TED-LIUM

Benchmarks Edit Add a new result Link an existing benchmark

Papers

Dataset Loaders Edit Add Remove

Tasks Edit

Similar Datasets

LibriSpeech

Earnings-21

Artie Bias Corpus

ASR-GLUE

Usage

License Edit

Modalities Edit

Languages Edit

Benchmarks

Add a new result Link an existing benchmark

Dataset Loaders

Add Remove

Tasks

License

Modalities

Languages