Utilisation de mesures de confiance pour am\'eliorer le d\'ecodage en traduction de parole
Les mesures de confiance au niveau mot (Word Confidence Estimation - WCE) pour la traduction auto- matique (TA) ou pour la reconnaissance automatique de la parole (RAP) attribuent un score de confiance {\`a} chaque mot dans une hypoth{\`e}se de transcription ou de traduction. Dans le pass{\'e}, l{'}estimation de ces mesures a le plus souvent {\'e}t{\'e} trait{\'e}e s{\'e}par{\'e}ment dans des contextes RAP ou TA. Nous proposons ici une estimation conjointe de la confiance associ{\'e}e {\`a} un mot dans une hypoth{\`e}se de traduction automatique de la parole (TAP). Cette estimation fait appel {\`a} des param{\`e}tres issus aussi bien des syst{\`e}mes de transcription de la parole (RAP) que des syst{\`e}mes de traduction automatique (TA). En plus de la construction de ces estimateurs de confiance robustes pour la TAP, nous utilisons les informations de confiance pour re-d{\'e}coder nos graphes d{'}hypoth{\`e}ses de traduction. Les exp{\'e}rimentations r{\'e}alis{\'e}es montrent que l{'}utilisation de ces mesures de confiance au cours d{'}une seconde passe de d{\'e}codage permettent d{'}obtenir une am{\'e}lioration significative des performances de traduction ({\'e}valu{\'e}es avec la m{\'e}trique BLEU - gains de deux points par rapport {\`a} notre syst{\`e}me de traduc- tion de parole de r{\'e}f{\'e}rence). Ces exp{\'e}riences sont faites pour une t{\^a}che de TAP (fran{\c{c}}ais-anglais) pour laquelle un corpus a {\'e}t{\'e} sp{\'e}cialement con{\c{c}}u (ce corpus, mis {\`a} la disposition de la communaut{\'e} TALN, est aussi d{\'e}crit en d{\'e}tail dans l{'}article).
PDF Abstract