Repr\'esentation du genre dans des donn\'ees open source de parole (Gender representation in open source speech resources 1 With the rise of artificial intelligence (AI) and the growing use of deep-learning architectures, the question of ethics and transparency in AI systems has become a central concern within the research community)
Avec l{'}essor de l{'}intelligence artificielle (IA) et l{'}utilisation croissante des architectures d{'}apprentissage profond, la question de l{'}{\'e}thique et de la transparence des syst{\`e}mes d{'}IA est devenue une pr{\'e}occupation centrale au sein de la communaut{\'e} de recherche. Dans cet article, nous proposons une {\'e}tude sur la repr{\'e}sentation du genre dans les ressources de parole disponibles sur la plateforme Open Speech and Language Resource. Un tout premier r{\'e}sultat est la difficult{\'e} d{'}acc{\`e}s aux informations sur le genre des locuteurs. Ensuite, nous montrons que l{'}{\'e}quilibre entre les cat{\'e}gories de genre d{\'e}pend de diverses caract{\'e}ristiques des corpus (discours {\'e}licit{\'e} ou non, t{\^a}che adress{\'e}e). En nous appuyant sur des travaux ant{\'e}rieurs, nous reprenons quelques principes concernant les m{\'e}tadonn{\'e}es dans l{'}optique d{'}assurer une meilleure transparence des syst{\`e}mes de parole construits {\`a} l{'}aide de ces corpus.
PDF Abstract