Search Results for author: Matt Sharifi

Found 8 papers, 4 papers with code

Social Learning: Towards Collaborative Learning with Large Language Models

no code implementations • 18 Dec 2023 • Amirkeivan Mohtashami, Florian Hartmann, Sian Gooding, Lukas Zilka, Matt Sharifi, Blaise Aguera y Arcas

We present and evaluate two approaches for knowledge transfer between LLMs.

Memorization Transfer Learning

Paper
Add Code

AudioPaLM: A Large Language Model That Can Speak and Listen

no code implementations • 22 Jun 2023 • Paul K. Rubenstein, Chulayuth Asawaroengchai, Duc Dung Nguyen, Ankur Bapna, Zalán Borsos, Félix de Chaumont Quitry, Peter Chen, Dalia El Badawy, Wei Han, Eugene Kharitonov, Hannah Muckenhirn, Dirk Padfield, James Qin, Danny Rozenberg, Tara Sainath, Johan Schalkwyk, Matt Sharifi, Michelle Tadmor, Ramanovich, Marco Tagliasacchi, Alexandru Tudor, Mihajlo Velimirović, Damien Vincent, Jiahui Yu, Yongqiang Wang, Vicky Zayats, Neil Zeghidour, Yu Zhang, Zhishuai Zhang, Lukas Zilka, Christian Frank

AudioPaLM inherits the capability to preserve paralinguistic information such as speaker identity and intonation from AudioLM and the linguistic knowledge present only in text large language models such as PaLM-2.

Language Modelling Large Language Model +5

Paper
Add Code

SoundStorm: Efficient Parallel Audio Generation

1 code implementation • 16 May 2023 • Zalán Borsos, Matt Sharifi, Damien Vincent, Eugene Kharitonov, Neil Zeghidour, Marco Tagliasacchi

We present SoundStorm, a model for efficient, non-autoregressive audio generation.

Audio Generation

1,117

Paper
Code

MusicLM: Generating Music From Text

3 code implementations • 26 Jan 2023 • Andrea Agostinelli, Timo I. Denk, Zalán Borsos, Jesse Engel, Mauro Verzetti, Antoine Caillon, Qingqing Huang, Aren Jansen, Adam Roberts, Marco Tagliasacchi, Matt Sharifi, Neil Zeghidour, Christian Frank

We introduce MusicLM, a model generating high-fidelity music from text descriptions such as "a calming violin melody backed by a distorted guitar riff".

Ranked #8 on Text-to-Music Generation on MusicCaps

Music Generation Text-to-Music Generation

19,684

Paper
Code

AudioLM: a Language Modeling Approach to Audio Generation

5 code implementations • 7 Sep 2022 • Zalán Borsos, Raphaël Marinier, Damien Vincent, Eugene Kharitonov, Olivier Pietquin, Matt Sharifi, Dominik Roblek, Olivier Teboul, David Grangier, Marco Tagliasacchi, Neil Zeghidour

We introduce AudioLM, a framework for high-quality audio generation with long-term consistency.

Audio Generation Language Modelling

32,691

Paper
Code

SpeechPainter: Text-conditioned Speech Inpainting

no code implementations • 15 Feb 2022 • Zalán Borsos, Matt Sharifi, Marco Tagliasacchi

We propose SpeechPainter, a model for filling in gaps of up to one second in speech samples by leveraging an auxiliary textual input.

Paper
Add Code

Predicting Text Readability from Scrolling Interactions

1 code implementation • CoNLL (EMNLP) 2021 • Sian Gooding, Yevgeni Berzak, Tony Mak, Matt Sharifi

Judging the readability of text has many important applications, for instance when performing text simplification or when sourcing reading material for language learners.

Question Answering Reading Comprehension +1

Paper
Code

SPICE: Self-supervised Pitch Estimation

no code implementations • 25 Oct 2019 • Beat Gfeller, Christian Frank, Dominik Roblek, Matt Sharifi, Marco Tagliasacchi, Mihajlo Velimirović

We propose a model to estimate the fundamental frequency in monophonic audio, often referred to as pitch estimation.

Self-Supervised Learning Translation

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.