1 code implementation • COLING 2022 • Jesus Lovon-Melgarejo, Jose G. Moreno, Romaric Besançon, Olivier Ferret, Lynda Tamine
Despite the success of state-of-the-art pre-trained language models (PLMs) on a series of multi-hop reasoning tasks, they still suffer from their limited abilities to transfer learning from simple to complex tasks and vice-versa.
no code implementations • LREC 2022 • Nicolas Hiebel, Olivier Ferret, Karën Fort, Aurélie Névéol
We introduce a definition of similarity that is guided by clinical facts and apply it to the development of a new French corpus of 1, 000 sentence pairs manually annotated according to similarity scores.
no code implementations • LREC 2022 • Hicham El Boukkouri, Olivier Ferret, Thomas Lavergne, Pierre Zweigenbaum
BERT models used in specialized domains all seem to be the result of a simple strategy: initializing with the original BERT and then resuming pre-training on a specialized corpus.
no code implementations • LREC 2022 • Olivier Ferret
In this article, we propose a new method for building word or type-level embeddings from contextual models.
no code implementations • JEP/TALN/RECITAL 2022 • Olivier Ferret
Même si les modèles de langue contextuels sont aujourd’hui dominants en traitement automatique des langues, les représentations qu’ils construisent ne sont pas toujours adaptées à toutes les utilisations.
no code implementations • JEP/TALN/RECITAL 2021 • Emanuela Boros, Romaric Besançon, Olivier Ferret, Brigitte Grau
Cet article aborde la tâche de détection d’événements, visant à identifier et catégoriser les mentions d’événements dans les textes.
no code implementations • JEP/TALN/RECITAL 2021 • Olivier Ferret
De nombreuses études ont récemment été réalisées pour étudier les propriétés des modèles de langue contextuels mais, de manière surprenante, seules quelques-unes d’entre elles se concentrent sur les propriétés de ces modèles en termes de similarité sémantique.
no code implementations • JEP/TALN/RECITAL 2022 • Nicolas Hiebel, Karën Fort, Aurélie Névéol, Olivier Ferret
Le TAL repose sur la disponibilité de corpus annotés pour l’entraînement et l’évaluation de modèles.
no code implementations • JEP/TALN/RECITAL 2022 • Paul Lerner, Olivier Ferret, Camille Guinaudeau, Hervé Le Borgne, Romaric Besançon, Jose Moreno, Jesús Lovón-Melgarejo
Dans le contexte général des traitements multimodaux, nous nous intéressons à la tâche de réponse à des questions visuelles à propos d’entités nommées en utilisant des bases de connaissances (KVQAE).
no code implementations • JEP/TALN/RECITAL 2022 • Tiphaine Le Clercq de Lannoy, Romaric Besançon, Olivier Ferret, Julien Tourille, Frédérique Brin-Henry, Bianca Vieru
Dans un contexte où peu de corpus annotés pour l’extraction d’entités médicales sont disponibles, nous étudions dans cet article une approche hybride combinant utilisation de connaissances spécialisées et adaptation de modèles de langues en mettant l’accent sur l’effet du pré-entraînement d’un modèle de langue généraliste (CamemBERT) sur différents corpus.
no code implementations • JEP/TALN/RECITAL 2022 • Aboubacar Tuo, Romaric Besançon, Olivier Ferret, Julien Tourille
Les méthodes actuelles pour la détection d’évènements, qui s’appuient essentiellement sur l’apprentissage supervisé profond, s’avèrent très coûteuses en données annotées.
1 code implementation • 11 Jan 2024 • Paul Lerner, Olivier Ferret, Camille Guinaudeau
Knowledge-based Visual Question Answering about Named Entities is a challenging task that requires retrieving information from a multimodal Knowledge Base.
no code implementations • 15 Dec 2023 • Jesús Lovón-Melgarejo, Jose G. Moreno, Romaric Besançon, Olivier Ferret, Lynda Tamine
In this work, we propose a task-agnostic evaluation method able to evaluate to what extent PLMs can capture complex taxonomy relations, such as ancestors and siblings.
1 code implementation • 11 Jul 2023 • Paul Grimal, Hervé Le Borgne, Olivier Ferret, Julien Tourille
While several metrics have been proposed to assess the rendering of images, it is crucial for Text-to-Image (T2I) models, which generate images based on a prompt, to consider additional aspects such as to which extent the generated image matches the important content of the prompt.
1 code implementation • 11 Jan 2023 • Paul Lerner, Olivier Ferret, Camille Guinaudeau
We present a new pre-training method, Multimodal Inverse Cloze Task, for Knowledge-based Visual Question Answering about named Entities (KVQAE).
1 code implementation • SIGIR 2022 • Paul Lerner, Olivier Ferret, Camille Guinaudeau, Hervé Le Borgne, Romaric Besançon, Jose G Moreno, Jesús Lovón Melgarejo
To benchmark this task, called KVQAE (Knowledge-based Visual Question Answering about named Entities), we provide ViQuAE, a dataset of 3. 7K questions paired with images.
no code implementations • 23 Nov 2021 • Olivier Ferret
Many studies were recently done for investigating the properties of contextual language models but surprisingly, only a few of them consider the properties of these models in terms of semantic similarity.
2 code implementations • 7 Apr 2021 • Omar Adjali, Romaric Besançon, Olivier Ferret, Herve Le Borgne, Brigitte Grau
In many information extraction applications, entity linking (EL) has emerged as a crucial task that allows leveraging information about named entities from a knowledge base.
2 code implementations • COLING 2020 • Hicham El Boukkouri, Olivier Ferret, Thomas Lavergne, Hiroshi Noji, Pierre Zweigenbaum, Junichi Tsujii
Due to the compelling improvements brought by BERT, many recent representation models adopted the Transformer architecture as their main building block, consequently inheriting the wordpiece tokenization system despite it not being intrinsically linked to the notion of Transformers.
Ranked #1 on Semantic Similarity on ClinicalSTS
Clinical Concept Extraction Drug–drug Interaction Extraction +3
no code implementations • JEPTALNRECITAL 2020 • Julien Tourille, Olivier Ferret, Aur{\'e}lie N{\'e}v{\'e}ol, Xavier Tannier
La r{\'e}solution de la cor{\'e}f{\'e}rence est un {\'e}l{\'e}ment essentiel pour la constitution automatique de chronologies m{\'e}dicales {\`a} partir des dossiers m{\'e}dicaux {\'e}lectroniques.
no code implementations • JEPTALNRECITAL 2020 • Dorian Kodelja, Romaric Besan{\c{c}}on, Olivier Ferret
Dans cet article, focalis{\'e} sur l{'}extraction supervis{\'e}e de mentions d{'}{\'e}v{\'e}nements dans les textes, nous proposons d{'}{\'e}tendre un mod{\`e}le op{\'e}rant au niveau phrastique et reposant sur une architecture neuronale de convolution de graphe exploitant les d{\'e}pendances syntaxiques.
no code implementations • LREC 2020 • Omar Adjali, Romaric Besan{\c{c}}on, Olivier Ferret, Herv{\'e} Le Borgne, Brigitte Grau
The method collects text and images to jointly build a corpus of tweets with ambiguous mentions along with a Twitter KB defining the entities.
no code implementations • LREC 2020 • Ludovic Tanguy, Pauline Brunet, Olivier Ferret
We present a study in which we compare 11 different French dependency parsers on a specialized corpus (consisting of research articles on NLP from the proceedings of the TALN conference).
no code implementations • LREC 2020 • Pauline Brunet, Olivier Ferret, Ludovic Tanguy
We present a study whose objective is to compare several dependency parsers for English applied to a specialized corpus for building distributional count-based models from syntactic dependencies.
1 code implementation • ACL 2019 • Hicham El Boukkouri, Olivier Ferret, Thomas Lavergne, Pierre Zweigenbaum
Using pre-trained word embeddings in conjunction with Deep Learning models has become the {``}de facto{''} approach in Natural Language Processing (NLP).
Ranked #4 on Clinical Concept Extraction on 2010 i2b2/VA
no code implementations • JEPTALNRECITAL 2019 • Ludovic Tanguy, Pauline Brunet, Olivier Ferret
Nous pr{\'e}sentons une {\'e}tude visant {\`a} comparer 11 diff{\'e}rents analyseurs en d{\'e}pendances du fran{\c{c}}ais sur un corpus sp{\'e}cialis{\'e} (constitu{\'e} des archives des articles de la conf{\'e}rence TALN).
no code implementations • 11 Apr 2019 • Charlotte Rudnik, Thibault Ehrhart, Olivier Ferret, Denis Teyssou, Raphaël Troncy, Xavier Tannier
News agencies produce thousands of multimedia stories describing events happening in the world that are either scheduled such as sports competitions, political summits and elections, or breaking events such as military conflicts, terrorist attacks, natural disasters, etc.
1 code implementation • WS 2018 • Julien Tourille, Matthieu Doutreligne, Olivier Ferret, Aur{\'e}lie N{\'e}v{\'e}ol, Nicolas Paris, Xavier Tannier
Many applications in biomedical natural language processing rely on sequence tagging as an initial step to perform more complex analysis.
no code implementations • ACL 2018 • Olivier Ferret
The methods proposed recently for specializing word embeddings according to a particular perspective generally rely on external knowledge.
no code implementations • JEPTALNRECITAL 2018 • Olivier Ferret
Au-del{\`a} des mod{\`e}les destin{\'e}s {\`a} construire des plongements lexicaux {\`a} partir de corpus, des m{\'e}thodes de sp{\'e}cialisation de ces repr{\'e}sentations selon diff{\'e}rentes orientations ont {\'e}t{\'e} propos{\'e}es.
no code implementations • JEPTALNRECITAL 2018 • Dorian Kodelja, Romaric Besan{\c{c}}on, Olivier Ferret
Les approches neuronales obtiennent depuis plusieurs ann{\'e}es des r{\'e}sultats int{\'e}ressants en extraction d{'}{\'e}v{\'e}nements.
no code implementations • JEPTALNRECITAL 2018 • Nicolas Wagner, Romaric Besan{\c{c}}on, Olivier Ferret
L{'}identification des entit{\'e}s nomm{\'e}es dans un texte est une {\'e}tape fondamentale pour de nombreuses t{\^a}ches d{'}extraction d{'}information.
no code implementations • IJCNLP 2017 • Ma{\^a}li Mnasri, Ga{\"e}l de Chalendar, Olivier Ferret
Following Gillick and Favre (2009), a lot of work about extractive summarization has modeled this task by associating two contrary constraints: one aims at maximizing the coverage of the summary with respect to its information content while the other represents its size limit.
no code implementations • IJCNLP 2017 • Olivier Ferret
In this article, we propose to investigate a new problem consisting in turning a distributional thesaurus into dense word vectors.
no code implementations • WS 2017 • Swen Ribeiro, Olivier Ferret, Xavier Tannier
In this paper, we present an unsupervised pipeline approach for clustering news articles based on identified event instances in their content.
no code implementations • SEMEVAL 2017 • Julien Tourille, Olivier Ferret, Xavier Tannier, Aur{\'e}lie N{\'e}v{\'e}ol
In this paper we present our participation to SemEval 2017 Task 12.
no code implementations • ACL 2017 • Julien Tourille, Olivier Ferret, Aur{\'e}lie N{\'e}v{\'e}ol, Xavier Tannier
We present a neural architecture for containment relation identification between medical events and/or temporal expressions.
no code implementations • JEPTALNRECITAL 2017 • Olivier Ferret
Dans cet article, nous nous int{\'e}ressons {\`a} un nouveau probl{\`e}me, appel{\'e} plongement de th{\'e}saurus, consistant {\`a} transformer un th{\'e}saurus distributionnel en une repr{\'e}sentation dense de mots.
no code implementations • EACL 2017 • Julien Tourille, Olivier Ferret, Xavier Tannier, Aur{\'e}lie N{\'e}v{\'e}ol
In this paper, we present a method for temporal relation extraction from clinical narratives in French and in English.
no code implementations • JEPTALNRECITAL 2016 • Ma{\^a}li Mnasri, Ga{\"e}l de Chalendar, Olivier Ferret
Dans cet article, nous reprenons le cadre d{\'e}fini par Gillick {\&} Favre (2009) mais nous examinons comment et dans quelle mesure la prise en compte explicite de la similarit{\'e} s{\'e}mantique des phrases peut am{\'e}liorer les performances d{'}un syst{\`e}me de r{\'e}sum{\'e} multi-document.
no code implementations • JEPTALNRECITAL 2016 • Julien Tourille, Olivier Ferret, Aur{\'e}lie N{\'e}v{\'e}ol, Xavier Tannier
Cette analyse repose sur l{'}extraction d{'}{\'e}v{\'e}nements, d{'}expressions temporelles et des relations entre eux.
no code implementations • JEPTALNRECITAL 2016 • Romaric Besan{\c{c}}on, Hani Daher, Olivier Ferret, Herv{\'e} Le Borgne
L{'}identification des entit{\'e}s nomm{\'e}es dans un texte est une t{\^a}che essentielle des outils d{'}extraction d{'}information dans de nombreuses applications.
no code implementations • LREC 2016 • Kiem-Hieu Nguyen, Xavier Tannier, Olivier Ferret, Romaric Besan{\c{c}}on
We detail the methodology used for building the corpus and evaluate some existing systems on this new data.
no code implementations • JEPTALNRECITAL 2015 • Olivier Ferret
La plupart des m{\'e}thodes d{'}am{\'e}lioration des th{\'e}saurus distributionnels se focalisent sur les moyens {--} repr{\'e}sentations ou mesures de similarit{\'e} {--} de mieux d{\'e}tecter la similarit{\'e} s{\'e}mantique entre les mots.
no code implementations • JEPTALNRECITAL 2015 • Kiem-Hieu Nguyen, Xavier Tannier, Olivier Ferret, Romaric Besan{\c{c}}on
Les pr{\'e}c{\'e}dentes m{\'e}thodes de la litt{\'e}rature utilisent uniquement les t{\^e}tes des syntagmes pour repr{\'e}senter les entit{\'e}s. Pourtant, le groupe complet (par exemple, {''}un homme arm{\'e}{''}) apporte une information plus discriminante (que {''}homme{''}).
no code implementations • LREC 2014 • Garcia-Fern, Anne ez, Olivier Ferret, Marco Dinarelli
The work presented in this article takes place in the field of opinion mining and aims more particularly at finding the polarity of a text by relying on machine learning methods.
no code implementations • LREC 2012 • Romaric Besan{\c{c}}on, Olivier Ferret, Ludovic Jean-Louis
Operational intelligence applications in specific domains are developed using numerous natural language processing technologies and tools.
no code implementations • LREC 2012 • Wei Wang, Romaric Besan{\c{c}}on, Olivier Ferret, Brigitte Grau
Unsupervised methods gain more and more attention nowadays in information extraction area, which allows to design more open extraction systems.