WikiText-TL-39

Introduced by Cruz et al. in Evaluating Language Model Finetuning Techniques for Low-resource Languages

WikiText-TL-39 is a benchmark language modeling dataset in Filipino that has 39 million tokens in the training set.

Source: Evaluating Language Model Finetuning Techniques for Low-resource Languages

Homepage

No benchmarks yet. Start a new benchmark or link an existing one.

Paper	Code	Results	Date	Stars

18,406

NewsPH-NLI