D\'eclasser les voisins non s\'emantiques pour am\'eliorer les th\'esaurus distributionnels
La plupart des m{\'e}thodes d{'}am{\'e}lioration des th{\'e}saurus distributionnels se focalisent sur les moyens {--} repr{\'e}sentations ou mesures de similarit{\'e} {--} de mieux d{\'e}tecter la similarit{\'e} s{\'e}mantique entre les mots. Dans cet article, nous proposons un point de vue inverse : nous cherchons {\`a} d{\'e}tecter les voisins s{\'e}mantiques associ{\'e}s {\`a} une entr{\'e}e les moins susceptibles d{'}{\^e}tre li{\'e}s s{\'e}mantiquement {\`a} elle et nous utilisons cette information pour r{\'e}ordonner ces voisins. Pour d{\'e}tecter les faux voisins s{\'e}mantiques d{'}une entr{\'e}e, nous adoptons une approche s{'}inspirant de la d{\'e}sambigu{\"\i}sation s{\'e}mantique en construisant un classifieur permettant de diff{\'e}rencier en contexte cette entr{\'e}e des autres mots. Ce classifieur est ensuite appliqu{\'e} {\`a} un {\'e}chantillon des occurrences des voisins de l{'}entr{\'e}e pour rep{\'e}rer ceux les plus {\'e}loign{\'e}s de l{'}entr{\'e}e. Nous {\'e}valuons cette m{\'e}thode pour des th{\'e}saurus construits {\`a} partir de cooccurrents syntaxiques et nous montrons l{'}int{\'e}r{\^e}t de la combiner avec les m{\'e}thodes d{\'e}crites dans (Ferret, 2013b) selon une strat{\'e}gie de type vote.
PDF Abstract