Search Results for author: Theodoros Kouzelis

Found 4 papers, 3 papers with code

Weakly-supervised Automated Audio Captioning via text only training

1 code implementation • 21 Sep 2023 • Theodoros Kouzelis, Vassilis Katsouros

Our approach leverages the similarity between audio and text embeddings in CLAP.

AudioCaps Audio captioning

1

Paper
Code

Investigating Personalization Methods in Text to Music Generation

1 code implementation • 20 Sep 2023 • Manos Plitsis, Theodoros Kouzelis, Georgios Paraskevopoulos, Vassilis Katsouros, Yannis Panagakis

In this work, we investigate the personalization of text-to-music diffusion models in a few-shot setting.

Data Augmentation Music Generation +1

25

Paper
Code

Weakly-supervised forced alignment of disfluent speech using phoneme-level modeling

1 code implementation • 30 May 2023 • Theodoros Kouzelis, Georgios Paraskevopoulos, Athanasios Katsamanis, Vassilis Katsouros

The study of speech disorders can benefit greatly from time-aligned data.

graph construction

7

Paper
Code

Sample-Efficient Unsupervised Domain Adaptation of Speech Recognition Systems A case study for Modern Greek

no code implementations • 31 Dec 2022 • Georgios Paraskevopoulos, Theodoros Kouzelis, Georgios Rouvalis, Athanasios Katsamanis, Vassilis Katsouros, Alexandros Potamianos

Modern speech recognition systems exhibits rapid performance degradation under domain shift.

Speech Recognition Unsupervised Domain Adaptation

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.