LCCC (Large-scale Cleaned Chinese Conversation corpus)

Introduced by Wang et al. in A Large-Scale Chinese Short-Text Conversation Dataset

Contains a base version (6.8million dialogues) and a large version (12.0 million dialogues).

Source: A Large-Scale Chinese Short-Text Conversation Dataset

Homepage

No benchmarks yet. Start a new benchmark or link an existing one.

Paper	Code	Results	Date	Stars

18,406

1,688

MMChat