TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK	EXTRA DATA	REMOVE
Speech Recognition	Common Voice vi	Vietnamese end-to-end speech recognition using wav2vec 2.0 by VietAI	Test WER	11.52	# 2
Speech Recognition	VIVOS	Vietnamese end-to-end speech recognition using wav2vec 2.0 by VietAI	Test WER	6.15	# 1

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/vietnamese-end-to-end-speech-recognition/speech-recognition-on-vivos)](https://paperswithcode.com/sota/speech-recognition-on-vivos?p=vietnamese-end-to-end-speech-recognition)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/vietnamese-end-to-end-speech-recognition/speech-recognition-on-common-voice-vi)](https://paperswithcode.com/sota/speech-recognition-on-common-voice-vi?p=vietnamese-end-to-end-speech-recognition)`

Vietnamese end-to-end speech recognition using wav2vec 2.0

https://github.com/vietai/ASR 2021 · Thai Binh Nguyen ·

Our models are pre-trained on 13k hours of Vietnamese youtube audio (un-label data) and fine-tuned on 250 hours labeled of VLSP ASR dataset on 16kHz sampled speech audio. We use wav2vec2 architecture for the pre-trained model. For fine-tuning phase, wav2vec2 is fine-tuned using Connectionist Temporal Classification (CTC), which is an algorithm that is used to train neural networks for sequence-to-sequence problems and mainly in Automatic Speech Recognition and handwriting recognition. On the Vivos dataset, we achieved a WER score of 6.15

PDF

Code

Add Remove Mark official

vietai/ASR

↳ Quickstart in

Colab

Tasks

Add Remove

Automatic Speech Recognition

Automatic Speech Recognition (ASR)

Handwriting Recognition

speech-recognition

Speech Recognition

Datasets

Common Voice

VIVOS

Results from the Paper

Add Remove

Ranked #1 on Speech Recognition on VIVOS (using extra training data)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Uses Extra Training Data	Benchmark
Speech Recognition	Common Voice vi	Vietnamese end-to-end speech recognition using wav2vec 2.0 by VietAI	Test WER	11.52	# 2		Compare
Speech Recognition	VIVOS	Vietnamese end-to-end speech recognition using wav2vec 2.0 by VietAI	Test WER	6.15	# 1		Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Vietnamese end-to-end speech recognition using wav2vec 2.0

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit Add Remove

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Add Remove

Methods

Add Remove