Identification de facteurs de risque pour des patients diab\'etiques \`a partir de comptes-rendus cliniques par des approches hybrides
Dans cet article, nous pr{\'e}sentons les m{\'e}thodes que nous avons d{\'e}velopp{\'e}es pour analyser des comptes- rendus hospitaliers r{\'e}dig{\'e}s en anglais. L{'}objectif de cette {\'e}tude consiste {\`a} identifier les facteurs de risque de d{\'e}c{\`e}s pour des patients diab{\'e}tiques et {\`a} positionner les {\'e}v{\'e}nements m{\'e}dicaux d{\'e}crits par rapport {\`a} la date de cr{\'e}ation de chaque document. Notre approche repose sur (i) HeidelTime pour identifier les expressions temporelles, (ii) des CRF compl{\'e}t{\'e}s par des r{\`e}gles de post-traitement pour identifier les traitements, les maladies et facteurs de risque, et (iii) des r{\`e}gles pour positionner temporellement chaque {\'e}v{\'e}nement m{\'e}dical. Sur un corpus de 514 documents, nous obtenons une F-mesure globale de 0,8451. Nous observons que l{'}identification des informations directement mentionn{\'e}es dans les documents se r{\'e}v{\`e}le plus performante que l{'}inf{\'e}rence d{'}informations {\`a} partir de r{\'e}sultats de laboratoire.
PDF Abstract