Search Results for author: Yerui Sun

Found 2 papers, 0 papers with code

A Speed Odyssey for Deployable Quantization of LLMs

no code implementations • 16 Nov 2023 • Qingyuan Li, Ran Meng, Yiduo Li, Bo Zhang, Liang Li, Yifan Lu, Xiangxiang Chu, Yerui Sun, Yuchen Xie

The large language model era urges faster and less costly inference.

Language Modelling Large Language Model +2

Paper
Add Code

FPTQ: Fine-grained Post-Training Quantization for Large Language Models

no code implementations • 30 Aug 2023 • Qingyuan Li, Yifan Zhang, Liang Li, Peng Yao, Bo Zhang, Xiangxiang Chu, Yerui Sun, Li Du, Yuchen Xie

In this study, we propose a novel W4A8 post-training quantization method for the available open-sourced LLMs, which combines the advantages of both two recipes.

Quantization

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.