Comparaison de listes d'erreurs de transcription automatique de la parole : quelle compl\'ementarit\'e entre les diff\'erentes m\'etriques ? (Comparing error lists for ASR systems : contribution of different metrics)
Le travail que nous pr{\'e}sentons ici s{'}inscrit dans le domaine de l{'}{\'e}valuation des syst{\`e}mes de reconnaissance automatique de la parole en vue de leur utilisation dans une t{\^a}che aval, ici la reconnaissance des entit{\'e}s nomm{\'e}es. Plus largement, la question que nous nous posons est {``}que peut apporter une m{\'e}trique d{'}{\'e}valuation en dehors d{'}un score ?''. Nous nous int{\'e}ressons particuli{\`e}rement aux erreurs des syst{\`e}mes et {\`a} leur analyse et {\'e}ventuellement {\`a} l{'}utilisation de ce que nous connaissons de ces erreurs. Nous {\'e}tudions dans ce travail les listes ordonn{\'e}es d{'}erreurs g{\'e}n{\'e}r{\'e}es {\`a} partir de diff{\'e}rentes m{\'e}triques et analysons ce qui en ressort. Nous avons appliqu{\'e} la m{\^e}me m{\'e}thode sur les sorties de diff{\'e}rents syst{\`e}mes de reconnaissance de la parole. Nos exp{\'e}riences mettent en {\'e}vidence que certaines m{\'e}triques apportent une information plus pertinente {\'e}tant donn{\'e} une t{\^a}che et transverse {\`a} diff{\'e}rents syst{\`e}mes.
PDF Abstract