TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Chinese Sentence Pair Classification	BQ	ERNIE 2.0 Large	Accuracy	85.2	# 2
Chinese Sentence Pair Classification	BQ	ERNIE 2.0 Base	Accuracy	85.0	# 3
Chinese Sentence Pair Classification	BQ Dev	ERNIE 2.0 Large	Accuracy	86.5	# 1
Chinese Sentence Pair Classification	BQ Dev	ERNIE 2.0 Base	Accuracy	86.4	# 2
Chinese Sentiment Analysis	ChnSentiCorp	ERNIE 2.0 Large	Accuracy	95.8	# 1
Chinese Sentiment Analysis	ChnSentiCorp	ERNIE 2.0 Base	Accuracy	95.5	# 2
Chinese Sentiment Analysis	ChnSentiCorp Dev	ERNIE 2.0 Large	Accuracy	96.1	# 1
Chinese Sentiment Analysis	ChnSentiCorp Dev	ERNIE 2.0 Base	Accuracy	95.7	# 2
Chinese Reading Comprehension	CMRC 2018 (Simplified Chinese) Dev	ERNIE 2.0 Base	EM	69.1	# 1
Chinese Reading Comprehension	CMRC 2018 (Simplified Chinese) Dev	ERNIE 2.0 Large	EM	28.5	# 3
Linguistic Acceptability	CoLA	ERNIE 2.0 Base	Accuracy	55.2%	# 34
Linguistic Acceptability	CoLA	ERNIE 2.0 Large	Accuracy	63.5%	# 27
Chinese Reading Comprehension	DRCD (Traditional Chinese)	ERNIE 2.0 Large	EM	89	# 2
Chinese Reading Comprehension	DRCD (Traditional Chinese)	ERNIE 2.0 Base	EM	88.0	# 3
Chinese Reading Comprehension	DRCD (Traditional Chinese) Dev	ERNIE 2.0 Large	EM	89.7	# 1
Chinese Reading Comprehension	DRCD (Traditional Chinese) Dev	ERNIE 2.0 Base	EM	88.5	# 3
Open-Domain Question Answering	DuReader	ERNIE 2.0 Large	EM	64.2	# 1
Open-Domain Question Answering	DuReader	ERNIE 2.0 Base	EM	61.3	# 2
Chinese Sentence Pair Classification	LCQMC	ERNIE 2.0 Base	Accuracy	87.9	# 2
Chinese Sentence Pair Classification	LCQMC	ERNIE 2.0 Large	Accuracy	87.9	# 2
Chinese Sentence Pair Classification	LCQMC Dev	ERNIE 2.0 Base	Accuracy	90.9	# 1
Chinese Sentence Pair Classification	LCQMC Dev	ERNIE 2.0 Large	Accuracy	90.9	# 1
Semantic Textual Similarity	MRPC	ERNIE 2.0 Base	Accuracy	86.1%	# 33
Semantic Textual Similarity	MRPC	ERNIE 2.0 Large	Accuracy	87.4%	# 28
Chinese Named Entity Recognition	MSRA	ERNIE 2.0 Base	F1	93.8	# 14
Chinese Named Entity Recognition	MSRA	ERNIE 2.0 Large	F1	95	# 10
Chinese Named Entity Recognition	MSRA Dev	ERNIE 2.0 Large	F1	96.3	# 1
Chinese Named Entity Recognition	MSRA Dev	ERNIE 2.0 Base	F1	95.2	# 2
Natural Language Inference	MultiNLI	ERNIE 2.0 Large	Matched	88.7	# 13
Natural Language Inference	MultiNLI	ERNIE 2.0 Large	Mismatched	88.8	# 9
Natural Language Inference	MultiNLI	ERNIE 2.0 Base	Matched	86.1	# 26
Natural Language Inference	MultiNLI	ERNIE 2.0 Base	Mismatched	85.5	# 18
Chinese Sentence Pair Classification	NLPCC-DBQA	ERNIE 2.0 Large	MRR	95.8	# 1
Chinese Sentence Pair Classification	NLPCC-DBQA	ERNIE 2.0 Base	MRR	95.7	# 2
Chinese Sentence Pair Classification	NLPCC-DBQA Dev	ERNIE 2.0 Base	MRR	95.7	# 2
Chinese Sentence Pair Classification	NLPCC-DBQA Dev	ERNIE 2.0 Large	MRR	95.9	# 1
Natural Language Inference	QNLI	ERNIE 2.0 Base	Accuracy	92.9%	# 24
Natural Language Inference	QNLI	ERNIE 2.0 Large	Accuracy	94.6%	# 14
Question Answering	Quora Question Pairs	ERNIE 2.0 Large	Accuracy	90.1%	# 7
Question Answering	Quora Question Pairs	ERNIE 2.0 Base	Accuracy	89.8%	# 10
Natural Language Inference	RTE	ERNIE 2.0 Large	Accuracy	80.2%	# 35
Natural Language Inference	RTE	ERNIE 2.0 Base	Accuracy	74.8%	# 45
Sentiment Analysis	SST-2 Binary classification	ERNIE 2.0 Base	Accuracy	95	# 25
Semantic Textual Similarity	STS Benchmark	ERNIE 2.0 Large	Pearson Correlation	0.912	# 12
Semantic Textual Similarity	STS Benchmark	ERNIE 2.0 Base	Pearson Correlation	0.876	# 23
Natural Language Inference	WNLI	ERNIE 2.0 Large	Accuracy	67.8	# 19
Natural Language Inference	XNLI Chinese	ERNIE 2.0 Base	Accuracy	79.7	# 2
Natural Language Inference	XNLI Chinese	ERNIE 2.0 Large	Accuracy	81	# 1
Natural Language Inference	XNLI Chinese Dev	ERNIE 2.0 Base	Accuracy	81.2	# 2
Natural Language Inference	XNLI Chinese Dev	ERNIE 2.0 Large	Accuracy	82.6	# 1

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-sentence-pair-classification-on-bq-1)](https://paperswithcode.com/sota/chinese-sentence-pair-classification-on-bq-1?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-sentiment-analysis-on-chnsenticorp-1)](https://paperswithcode.com/sota/chinese-sentiment-analysis-on-chnsenticorp-1?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-sentiment-analysis-on-chnsenticorp)](https://paperswithcode.com/sota/chinese-sentiment-analysis-on-chnsenticorp?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-reading-comprehension-on-cmrc-2018)](https://paperswithcode.com/sota/chinese-reading-comprehension-on-cmrc-2018?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-reading-comprehension-on-drcd)](https://paperswithcode.com/sota/chinese-reading-comprehension-on-drcd?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/open-domain-question-answering-on-dureader)](https://paperswithcode.com/sota/open-domain-question-answering-on-dureader?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-sentence-pair-classification-on-lcqmc-1)](https://paperswithcode.com/sota/chinese-sentence-pair-classification-on-lcqmc-1?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-named-entity-recognition-on-msra-dev)](https://paperswithcode.com/sota/chinese-named-entity-recognition-on-msra-dev?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-sentence-pair-classification-on-nlpcc)](https://paperswithcode.com/sota/chinese-sentence-pair-classification-on-nlpcc?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-sentence-pair-classification-on-nlpcc-1)](https://paperswithcode.com/sota/chinese-sentence-pair-classification-on-nlpcc-1?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/natural-language-inference-on-xnli-chinese-1)](https://paperswithcode.com/sota/natural-language-inference-on-xnli-chinese-1?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/natural-language-inference-on-xnli-chinese)](https://paperswithcode.com/sota/natural-language-inference-on-xnli-chinese?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-sentence-pair-classification-on-bq)](https://paperswithcode.com/sota/chinese-sentence-pair-classification-on-bq?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-reading-comprehension-on-drcd-1)](https://paperswithcode.com/sota/chinese-reading-comprehension-on-drcd-1?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-sentence-pair-classification-on-lcqmc)](https://paperswithcode.com/sota/chinese-sentence-pair-classification-on-lcqmc?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/question-answering-on-quora-question-pairs)](https://paperswithcode.com/sota/question-answering-on-quora-question-pairs?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/chinese-named-entity-recognition-on-msra)](https://paperswithcode.com/sota/chinese-named-entity-recognition-on-msra?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/semantic-textual-similarity-on-sts-benchmark)](https://paperswithcode.com/sota/semantic-textual-similarity-on-sts-benchmark?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/natural-language-inference-on-multinli)](https://paperswithcode.com/sota/natural-language-inference-on-multinli?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/natural-language-inference-on-qnli)](https://paperswithcode.com/sota/natural-language-inference-on-qnli?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/natural-language-inference-on-wnli)](https://paperswithcode.com/sota/natural-language-inference-on-wnli?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/sentiment-analysis-on-sst-2-binary)](https://paperswithcode.com/sota/sentiment-analysis-on-sst-2-binary?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/linguistic-acceptability-on-cola)](https://paperswithcode.com/sota/linguistic-acceptability-on-cola?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/semantic-textual-similarity-on-mrpc)](https://paperswithcode.com/sota/semantic-textual-similarity-on-mrpc?p=ernie-20-a-continual-pre-training-framework)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/ernie-20-a-continual-pre-training-framework/natural-language-inference-on-rte)](https://paperswithcode.com/sota/natural-language-inference-on-rte?p=ernie-20-a-continual-pre-training-framework)`

ERNIE 2.0: A Continual Pre-training Framework for Language Understanding

29 Jul 2019 · Yu Sun, Shuohuan Wang, Yukun Li, Shikun Feng, Hao Tian, Hua Wu, Haifeng Wang ·

Recently, pre-trained models have achieved state-of-the-art results in various language understanding tasks, which indicates that pre-training on large-scale corpora may play a crucial role in natural language processing. Current pre-training procedures usually focus on training the model with several simple tasks to grasp the co-occurrence of words or sentences. However, besides co-occurring, there exists other valuable lexical, syntactic and semantic information in training corpora, such as named entity, semantic closeness and discourse relations. In order to extract to the fullest extent, the lexical, syntactic and semantic information from training corpora, we propose a continual pre-training framework named ERNIE 2.0 which builds and learns incrementally pre-training tasks through constant multi-task learning. Experimental results demonstrate that ERNIE 2.0 outperforms BERT and XLNet on 16 tasks including English tasks on GLUE benchmarks and several common tasks in Chinese. The source codes and pre-trained models have been released at https://github.com/PaddlePaddle/ERNIE.

PDF Abstract

Code

Add Remove Mark official

PaddlePaddle/ERNIE official

6,197

PaddlePaddle/PaddleNLP

11,418

DataScienceNigeria/ERNIE-2.0-from-B…

Tasks

Add Remove

Chinese Named Entity Recognition

Chinese Reading Comprehension

Chinese Sentence Pair Classification

Chinese Sentiment Analysis

Linguistic Acceptability

Multi-Task Learning

Named Entity Recognition (NER)

Natural Language Inference

Open-Domain Question Answering

Question Answering

Semantic Textual Similarity

Sentiment Analysis

Datasets

GLUE

SST

MultiNLI SST-2

QNLI

MRPC

CoLA

XNLI

Quora

CMRC

DuReader

Quora Question Pairs RTE

DRCD CMRC 2018 STS Benchmark MSRA CN NER WNLI LCQMC

Results from the Paper

Edit

Ranked #1 on Chinese Sentence Pair Classification on LCQMC Dev

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Chinese Sentence Pair Classification	BQ	ERNIE 2.0 Large	Accuracy	85.2	# 2	Compare
Chinese Sentence Pair Classification	BQ	ERNIE 2.0 Base	Accuracy	85.0	# 3	Compare
Chinese Sentence Pair Classification	BQ Dev	ERNIE 2.0 Large	Accuracy	86.5	# 1	Compare
Chinese Sentence Pair Classification	BQ Dev	ERNIE 2.0 Base	Accuracy	86.4	# 2	Compare
Chinese Sentiment Analysis	ChnSentiCorp	ERNIE 2.0 Large	Accuracy	95.8	# 1	Compare
Chinese Sentiment Analysis	ChnSentiCorp	ERNIE 2.0 Base	Accuracy	95.5	# 2	Compare
Chinese Sentiment Analysis	ChnSentiCorp Dev	ERNIE 2.0 Large	Accuracy	96.1	# 1	Compare
Chinese Sentiment Analysis	ChnSentiCorp Dev	ERNIE 2.0 Base	Accuracy	95.7	# 2	Compare
Chinese Reading Comprehension	CMRC 2018 (Simplified Chinese) Dev	ERNIE 2.0 Base	EM	69.1	# 1	Compare
Chinese Reading Comprehension	CMRC 2018 (Simplified Chinese) Dev	ERNIE 2.0 Large	EM	28.5	# 3	Compare
Linguistic Acceptability	CoLA	ERNIE 2.0 Base	Accuracy	55.2%	# 34	Compare
Linguistic Acceptability	CoLA	ERNIE 2.0 Large	Accuracy	63.5%	# 27	Compare
Chinese Reading Comprehension	DRCD (Traditional Chinese)	ERNIE 2.0 Large	EM	89	# 2	Compare
Chinese Reading Comprehension	DRCD (Traditional Chinese)	ERNIE 2.0 Base	EM	88.0	# 3	Compare
Chinese Reading Comprehension	DRCD (Traditional Chinese) Dev	ERNIE 2.0 Large	EM	89.7	# 1	Compare
Chinese Reading Comprehension	DRCD (Traditional Chinese) Dev	ERNIE 2.0 Base	EM	88.5	# 3	Compare
Open-Domain Question Answering	DuReader	ERNIE 2.0 Large	EM	64.2	# 1	Compare
Open-Domain Question Answering	DuReader	ERNIE 2.0 Base	EM	61.3	# 2	Compare
Chinese Sentence Pair Classification	LCQMC	ERNIE 2.0 Base	Accuracy	87.9	# 2	Compare
Chinese Sentence Pair Classification	LCQMC	ERNIE 2.0 Large	Accuracy	87.9	# 2	Compare
Chinese Sentence Pair Classification	LCQMC Dev	ERNIE 2.0 Base	Accuracy	90.9	# 1	Compare
Chinese Sentence Pair Classification	LCQMC Dev	ERNIE 2.0 Large	Accuracy	90.9	# 1	Compare
Semantic Textual Similarity	MRPC	ERNIE 2.0 Base	Accuracy	86.1%	# 33	Compare
Semantic Textual Similarity	MRPC	ERNIE 2.0 Large	Accuracy	87.4%	# 28	Compare
Chinese Named Entity Recognition	MSRA	ERNIE 2.0 Base	F1	93.8	# 14	Compare
Chinese Named Entity Recognition	MSRA	ERNIE 2.0 Large	F1	95	# 10	Compare
Chinese Named Entity Recognition	MSRA Dev	ERNIE 2.0 Large	F1	96.3	# 1	Compare
Chinese Named Entity Recognition	MSRA Dev	ERNIE 2.0 Base	F1	95.2	# 2	Compare
Natural Language Inference	MultiNLI	ERNIE 2.0 Large	Matched	88.7	# 13	Compare
Natural Language Inference	MultiNLI	ERNIE 2.0 Large	Mismatched	88.8	# 9	Compare
Natural Language Inference	MultiNLI	ERNIE 2.0 Base	Matched	86.1	# 26	Compare
Natural Language Inference	MultiNLI	ERNIE 2.0 Base	Mismatched	85.5	# 18	Compare
Chinese Sentence Pair Classification	NLPCC-DBQA	ERNIE 2.0 Large	MRR	95.8	# 1	Compare
Chinese Sentence Pair Classification	NLPCC-DBQA	ERNIE 2.0 Base	MRR	95.7	# 2	Compare
Chinese Sentence Pair Classification	NLPCC-DBQA Dev	ERNIE 2.0 Base	MRR	95.7	# 2	Compare
Chinese Sentence Pair Classification	NLPCC-DBQA Dev	ERNIE 2.0 Large	MRR	95.9	# 1	Compare
Natural Language Inference	QNLI	ERNIE 2.0 Base	Accuracy	92.9%	# 24	Compare
Natural Language Inference	QNLI	ERNIE 2.0 Large	Accuracy	94.6%	# 14	Compare
Question Answering	Quora Question Pairs	ERNIE 2.0 Large	Accuracy	90.1%	# 7	Compare
Question Answering	Quora Question Pairs	ERNIE 2.0 Base	Accuracy	89.8%	# 10	Compare
Natural Language Inference	RTE	ERNIE 2.0 Large	Accuracy	80.2%	# 35	Compare
Natural Language Inference	RTE	ERNIE 2.0 Base	Accuracy	74.8%	# 45	Compare
Sentiment Analysis	SST-2 Binary classification	ERNIE 2.0 Base	Accuracy	95	# 25	Compare
Semantic Textual Similarity	STS Benchmark	ERNIE 2.0 Large	Pearson Correlation	0.912	# 12	Compare
Semantic Textual Similarity	STS Benchmark	ERNIE 2.0 Base	Pearson Correlation	0.876	# 23	Compare
Natural Language Inference	WNLI	ERNIE 2.0 Large	Accuracy	67.8	# 19	Compare
Natural Language Inference	XNLI Chinese	ERNIE 2.0 Base	Accuracy	79.7	# 2	Compare
Natural Language Inference	XNLI Chinese	ERNIE 2.0 Large	Accuracy	81	# 1	Compare
Natural Language Inference	XNLI Chinese Dev	ERNIE 2.0 Base	Accuracy	81.2	# 2	Compare
Natural Language Inference	XNLI Chinese Dev	ERNIE 2.0 Large	Accuracy	82.6	# 1	Compare

Methods

Add Remove

Adam • Attention Dropout • BERT • BPE • Dense Connections • Dropout • ERNIE • GELU • Layer Normalization • Linear Layer • Linear Warmup With Linear Decay • Multi-Head Attention • Residual Connection • Scaled Dot-Product Attention • SentencePiece • Softmax • Weight Decay • WordPiece • XLNet

Edit Social Preview

ERNIE 2.0: A Continual Pre-training Framework for Language Understanding

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove