Search Results for author: Alexander Hoffman

Found 4 papers, 0 papers with code

QGen: On the Ability to Generalize in Quantization Aware Training

no code implementations • 17 Apr 2024 • MohammadHossein AskariHemmat, Ahmadreza Jeddi, Reyhane Askari Hemmat, Ivan Lazarevich, Alexander Hoffman, Sudhakar Sah, Ehsan Saboori, Yvon Savaria, Jean-Pierre David

In this work, we investigate the generalization properties of quantized neural networks, a characteristic that has received little attention despite its implications on model performance.

Quantization

Paper
Add Code

DeepliteRT: Computer Vision at the Edge

no code implementations • 19 Sep 2023 • Saad Ashfaq, Alexander Hoffman, Saptarshi Mitra, Sudhakar Sah, MohammadHossein AskariHemmat, Ehsan Saboori

The proliferation of edge devices has unlocked unprecedented opportunities for deep learning model deployment in computer vision applications.

Quantization

Paper
Add Code

DeepGEMM: Accelerated Ultra Low-Precision Inference on CPU Architectures using Lookup Tables

no code implementations • 18 Apr 2023 • Darshan C. Ganji, Saad Ashfaq, Ehsan Saboori, Sudhakar Sah, Saptarshi Mitra, MohammadHossein AskariHemmat, Alexander Hoffman, Ahmed Hassanien, Mathieu Léonardon

A lot of recent progress has been made in ultra low-bit quantization, promising significant improvements in latency, memory footprint and energy consumption on edge devices.

Quantization

Paper
Add Code

Accelerating Deep Learning Model Inference on Arm CPUs with Ultra-Low Bit Quantization and Runtime

no code implementations • 18 Jul 2022 • Saad Ashfaq, MohammadHossein AskariHemmat, Sudhakar Sah, Ehsan Saboori, Olivier Mastropietro, Alexander Hoffman

Deep Learning has been one of the most disruptive technological advancements in recent times.

Quantization

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.