TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Fine-Grained Image Classification	Birdsnap	EffNet-L2 (SAM)	Accuracy	90.07%	# 1
Image Classification	Certificate Verification	PyramidNet (SAM)	Percentage correct	98.6	# 2
Image Classification	Certificate Verification	PyramidNet (SAM)	Top-1 Accuracy	98.6	# 2
Image Classification	CIFAR-100	CNN36	Percentage correct	36.07	# 195
Image Classification	CIFAR-100	EffNet-L2 (SAM)	Percentage correct	96.08	# 1
Image Classification	CIFAR-100	CNN39	Percentage correct	42.64	# 194
Image Classification	CIFAR-100	PyramidNet (SAM)	Percentage correct	89.7	# 28
Image Classification	Fashion-MNIST	Shake-Shake (SAM)	Percentage error	3.59	# 2
Image Classification	Fashion-MNIST	Shake-Shake (SAM)	Accuracy	96.41	# 3
Fine-Grained Image Classification	FGVC Aircraft	EffNet-L2 (SAM)	Top-1 Error Rate	4.82	# 1
Image Classification	Flowers-102	EffNet-L2 (SAM)	Accuracy	99.65%	# 5
Fine-Grained Image Classification	Food-101	EffNet-L2 (SAM)	Accuracy	96.18	# 2
Image Classification	ImageNet	EfficientNet-L2-475 (SAM)	Top 1 Accuracy	88.61%	# 43
Image Classification	ImageNet	EfficientNet-L2-475 (SAM)	Number of params	480M	# 935
Image Classification	ImageNet	ResNet-152 (SAM)	Top 1 Accuracy	81.6%	# 569
Fine-Grained Image Classification	Oxford-IIIT Pets	EffNet-L2 (SAM)	Accuracy	97.10	# 1
Fine-Grained Image Classification	Oxford-IIIT Pets	EffNet-L2 (SAM)	Top-1 Error Rate	2.90%	# 1
Fine-Grained Image Classification	Stanford Cars	EffNet-L2 (SAM)	Accuracy	95.96%	# 6
Image Classification	SVHN	WRN28-10 (SAM)	Percentage error	0.99	# 1

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/sharpness-aware-minimization-for-efficiently-1/fine-grained-image-classification-on-birdsnap)](https://paperswithcode.com/sota/fine-grained-image-classification-on-birdsnap?p=sharpness-aware-minimization-for-efficiently-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/sharpness-aware-minimization-for-efficiently-1/image-classification-on-cifar-100)](https://paperswithcode.com/sota/image-classification-on-cifar-100?p=sharpness-aware-minimization-for-efficiently-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/sharpness-aware-minimization-for-efficiently-1/fine-grained-image-classification-on-fgvc)](https://paperswithcode.com/sota/fine-grained-image-classification-on-fgvc?p=sharpness-aware-minimization-for-efficiently-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/sharpness-aware-minimization-for-efficiently-1/fine-grained-image-classification-on-oxford-2)](https://paperswithcode.com/sota/fine-grained-image-classification-on-oxford-2?p=sharpness-aware-minimization-for-efficiently-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/sharpness-aware-minimization-for-efficiently-1/image-classification-on-svhn)](https://paperswithcode.com/sota/image-classification-on-svhn?p=sharpness-aware-minimization-for-efficiently-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/sharpness-aware-minimization-for-efficiently-1/image-classification-on-certificate)](https://paperswithcode.com/sota/image-classification-on-certificate?p=sharpness-aware-minimization-for-efficiently-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/sharpness-aware-minimization-for-efficiently-1/image-classification-on-fashion-mnist)](https://paperswithcode.com/sota/image-classification-on-fashion-mnist?p=sharpness-aware-minimization-for-efficiently-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/sharpness-aware-minimization-for-efficiently-1/fine-grained-image-classification-on-food-101)](https://paperswithcode.com/sota/fine-grained-image-classification-on-food-101?p=sharpness-aware-minimization-for-efficiently-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/sharpness-aware-minimization-for-efficiently-1/image-classification-on-flowers-102)](https://paperswithcode.com/sota/image-classification-on-flowers-102?p=sharpness-aware-minimization-for-efficiently-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/sharpness-aware-minimization-for-efficiently-1/fine-grained-image-classification-on-stanford)](https://paperswithcode.com/sota/fine-grained-image-classification-on-stanford?p=sharpness-aware-minimization-for-efficiently-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/sharpness-aware-minimization-for-efficiently-1/image-classification-on-imagenet)](https://paperswithcode.com/sota/image-classification-on-imagenet?p=sharpness-aware-minimization-for-efficiently-1)`

Sharpness-Aware Minimization for Efficiently Improving Generalization

ICLR 2021 · Pierre Foret, Ariel Kleiner, Hossein Mobahi, Behnam Neyshabur ·

In today's heavily overparameterized models, the value of the training loss provides few guarantees on model generalization ability. Indeed, optimizing only the training loss value, as is commonly done, can easily lead to suboptimal model quality. Motivated by prior work connecting the geometry of the loss landscape and generalization, we introduce a novel, effective procedure for instead simultaneously minimizing loss value and loss sharpness. In particular, our procedure, Sharpness-Aware Minimization (SAM), seeks parameters that lie in neighborhoods having uniformly low loss; this formulation results in a min-max optimization problem on which gradient descent can be performed efficiently. We present empirical results showing that SAM improves model generalization across a variety of benchmark datasets (e.g., CIFAR-10, CIFAR-100, ImageNet, finetuning tasks) and models, yielding novel state-of-the-art performance for several. Additionally, we find that SAM natively provides robustness to label noise on par with that provided by state-of-the-art procedures that specifically target learning with noisy labels. We open source our code at \url{https://github.com/google-research/sam}.

PDF Abstract ICLR 2021 PDF ICLR 2021 Abstract

Code

Add Remove Mark official

google-research/sam official

521

davda54/sam

1,646

moskomule/sam.pytorch

125

sayakpaul/Sharpness-Aware-Minimizat…

↳ Quickstart in

Colab

simon20010923/DDAMFN

See all 14 implementations

Tasks

Add Remove

Fine-Grained Image Classification

Image Classification

Learning with noisy labels

Datasets

ImageNet

CIFAR-100

SVHN

Fashion-MNIST

Oxford 102 Flower

Stanford Cars

Food-101

FGVC-Aircraft

Birdsnap Oxford-IIIT Pets

Results from the Paper

Edit

Ranked #1 on Image Classification on CIFAR-100 (using extra training data)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Fine-Grained Image Classification	Birdsnap	EffNet-L2 (SAM)	Accuracy	90.07%	# 1	Compare
Image Classification	Certificate Verification	PyramidNet (SAM)	Percentage correct	98.6	# 2	Compare
Image Classification	Certificate Verification	PyramidNet (SAM)	Top-1 Accuracy	98.6	# 2	Compare
Image Classification	CIFAR-100	CNN36	Percentage correct	36.07	# 195	Compare
Image Classification	CIFAR-100	EffNet-L2 (SAM)	Percentage correct	96.08	# 1	Compare
Image Classification	CIFAR-100	CNN39	Percentage correct	42.64	# 194	Compare
Image Classification	CIFAR-100	PyramidNet (SAM)	Percentage correct	89.7	# 28	Compare
Image Classification	Fashion-MNIST	Shake-Shake (SAM)	Percentage error	3.59	# 2	Compare
Image Classification	Fashion-MNIST	Shake-Shake (SAM)	Accuracy	96.41	# 3	Compare
Fine-Grained Image Classification	FGVC Aircraft	EffNet-L2 (SAM)	Top-1 Error Rate	4.82	# 1	Compare
Image Classification	Flowers-102	EffNet-L2 (SAM)	Accuracy	99.65%	# 5	Compare
Fine-Grained Image Classification	Food-101	EffNet-L2 (SAM)	Accuracy	96.18	# 2	Compare
Image Classification	ImageNet	EfficientNet-L2-475 (SAM)	Top 1 Accuracy	88.61%	# 43	Compare
Image Classification	ImageNet	EfficientNet-L2-475 (SAM)	Number of params	480M	# 935	Compare
Image Classification	ImageNet	ResNet-152 (SAM)	Top 1 Accuracy	81.6%	# 569	Compare
Fine-Grained Image Classification	Oxford-IIIT Pets	EffNet-L2 (SAM)	Accuracy	97.10	# 1	Compare
Fine-Grained Image Classification	Oxford-IIIT Pets	EffNet-L2 (SAM)	Top-1 Error Rate	2.90%	# 1	Compare
Fine-Grained Image Classification	Stanford Cars	EffNet-L2 (SAM)	Accuracy	95.96%	# 6	Compare
Image Classification	SVHN	WRN28-10 (SAM)	Percentage error	0.99	# 1	Compare

Methods

Add Remove

Sharpness-Aware Minimization

Edit Social Preview

Sharpness-Aware Minimization for Efficiently Improving Generalization

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove