Int\'egration de la similarit\'e entre phrases comme crit\`ere pour le r\'esum\'e multi-document (Integrating sentence similarity as a constraint for multi-document summarization)

JEPTALNRECITAL 2016 · Ma{\^a}li Mnasri, Ga{\"e}l de Chalendar, Olivier Ferret ·

multi-document Ma{\^a}li Mnasri1, 2 Ga{\"e}l de Chalendar1 Olivier Ferret1 (1) CEA, LIST, Laboratoire Vision et Ing{\'e}nierie des Contenus, Gif-sur-Yvette, F-91191, France. (2) Universit{\'e} Paris-Sud, Universit{\'e} Paris-Saclay, F-91405 Orsay, France. maali.mnasri@cea.fr, gael.de-chalendar@cea.fr, olivier.ferret@cea.fr R {\'E}SUM{\'E} {\`A} la suite des travaux de Gillick {\&} Favre (2009), beaucoup de travaux portant sur le r{\'e}sum{\'e} par extraction se sont appuy{\'e}s sur une mod{\'e}lisation de cette t{\^a}che sous la forme de deux contraintes antagonistes : l{'}une vise {\`a} maximiser la couverture du r{\'e}sum{\'e} produit par rapport au contenu des textes d{'}origine tandis que l{'}autre repr{\'e}sente la limite du r{\'e}sum{\'e} en termes de taille. Dans cette approche, la notion de redondance n{'}est prise en compte que de fa{\c{c}}on implicite. Dans cet article, nous reprenons le cadre d{\'e}fini par Gillick {\&} Favre (2009) mais nous examinons comment et dans quelle mesure la prise en compte explicite de la similarit{\'e} s{\'e}mantique des phrases peut am{\'e}liorer les performances d{'}un syst{\`e}me de r{\'e}sum{\'e} multi-document. Nous v{\'e}rifions cet impact par des {\'e}valuations men{\'e}es sur les corpus DUC 2003 et 2004.

PDF Abstract