Un Corpus de Flux TV Annot\'es pour la Pr\'ediction de Genres (A Genre Annotated Corpus of French Multi-channel TV Streams for Genre Prediction)
Cet article pr{\'e}sente une m{\'e}thode de pr{\'e}diction de genres d{'}{\'e}missions t{\'e}l{\'e}vis{\'e}es couvrant 2 jours de diffusion de 4 cha{\^\i}nes TV fran{\c{c}}aises structur{\'e}s en {\'e}missions annot{\'e}es en genres. Ce travail traite des m{\'e}dias de masse de flux de cha{\^\i}nes t{\'e}l{\'e}vis{\'e}es et rejoint l{'}effort global d{'}extraction de connaissance {\`a} partir de cette grande quantit{\'e} de donn{\'e}es produites continuellement. Le corpus employ{\'e} est fourni par l{'}entreprise EDD, anciennement appel{\'e}e {``}L{'}Europ{\'e}enne de Donn{\'e}es{''}, une entreprise sp{\'e}cialis{\'e}e dans la gestion des flux multim{\'e}dias. Les exp{\'e}riences d{\'e}taill{\'e}es dans cet article montrent qu{'}une approche simple fond{\'e}e sur un mod{\`e}le de n-grammes permet de pr{\'e}dire le genre d{'}une {\'e}mission selon un historique avec une pr{\'e}cision avoisinant les 50 {\%}.
PDF Abstract