Uniformisation de corpus anglais annot\'es en sens (Unification of sense annotated English corpora for word sense disambiguation)
Pour la d{\'e}sambigu{\"\i}sation lexicale en anglais, on compte aujourd{'}hui une quinzaine de corpus annot{\'e}s en sens dans des formats souvent diff{\'e}rents et provenant de diff{\'e}rentes versions du Princeton WordNet. Nous pr{\'e}sentons un format pour uniformiser ces corpus, et nous fournissons {\`a} la communaut{\'e} l{'}ensemble des corpus annot{\'e}s en anglais port{\'e}s {\`a} notre connaissance avec des sens uniformis{\'e}s du Princeton WordNet 3.0, lorsque les droits le permettent et le code source pour construire l{'}ensemble des corpus {\`a} partir des donn{\'e}es originales.
PDF Abstract