TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Neural Architecture Search	ImageNet	AlphaNet-A6	Top-1 Error Rate	19.2	# 12
Neural Architecture Search	ImageNet	AlphaNet-A6	Accuracy	80.8	# 9
Neural Architecture Search	ImageNet	AlphaNet-A6	FLOPs	709M	# 132
Image Classification	ImageNet	AlphaNet-A5	Top 1 Accuracy	80.3%	# 649
Image Classification	ImageNet	AlphaNet-A5	GFLOPs	0.491	# 53
Image Classification	ImageNet	AlphaNet-A4	Top 1 Accuracy	80.0%	# 664
Image Classification	ImageNet	AlphaNet-A4	GFLOPs	0.444	# 51
Image Classification	ImageNet	AlphaNet-A0	Top 1 Accuracy	77.8%	# 795
Image Classification	ImageNet	AlphaNet-A0	GFLOPs	0.203	# 13
Image Classification	ImageNet	AlphaNet-A6	Top 1 Accuracy	80.8%	# 623
Image Classification	ImageNet	AlphaNet-A6	GFLOPs	0.709	# 88
Image Classification	ImageNet	AlphaNet-A3	Top 1 Accuracy	79.4%	# 695
Image Classification	ImageNet	AlphaNet-A3	GFLOPs	0.357	# 36
Image Classification	ImageNet	AlphaNet-A2	Top 1 Accuracy	79.1%	# 714
Image Classification	ImageNet	AlphaNet-A2	GFLOPs	0.317	# 31
Image Classification	ImageNet	AlphaNet-A1	Top 1 Accuracy	78.9%	# 736
Image Classification	ImageNet	AlphaNet-A1	GFLOPs	0.279	# 24
Neural Architecture Search	ImageNet	AlphaNet-A0	Top-1 Error Rate	22.1	# 54
Neural Architecture Search	ImageNet	AlphaNet-A0	Accuracy	77.9	# 43
Neural Architecture Search	ImageNet	AlphaNet-A0	FLOPs	203M	# 110
Neural Architecture Search	ImageNet	AlphaNet-A1	Top-1 Error Rate	21.0	# 37
Neural Architecture Search	ImageNet	AlphaNet-A1	Accuracy	79.0	# 29
Neural Architecture Search	ImageNet	AlphaNet-A1	FLOPs	279M	# 113
Neural Architecture Search	ImageNet	AlphaNet-A2	Top-1 Error Rate	20.8	# 34
Neural Architecture Search	ImageNet	AlphaNet-A2	Accuracy	79.2	# 26
Neural Architecture Search	ImageNet	AlphaNet-A2	FLOPs	317M	# 115
Neural Architecture Search	ImageNet	AlphaNet-A3	Top-1 Error Rate	20.6	# 33
Neural Architecture Search	ImageNet	AlphaNet-A3	Accuracy	79.4	# 25
Neural Architecture Search	ImageNet	AlphaNet-A3	FLOPs	357M	# 117
Neural Architecture Search	ImageNet	AlphaNet-A4	Top-1 Error Rate	20.0	# 23
Neural Architecture Search	ImageNet	AlphaNet-A4	Accuracy	80.0	# 18
Neural Architecture Search	ImageNet	AlphaNet-A4	FLOPs	444M	# 121
Neural Architecture Search	ImageNet	AlphaNet-A5 (small)	Top-1 Error Rate	19.7	# 19
Neural Architecture Search	ImageNet	AlphaNet-A5 (small)	Accuracy	80.3	# 15
Neural Architecture Search	ImageNet	AlphaNet-A5 (small)	FLOPs	491M	# 124
Neural Architecture Search	ImageNet	AlphaNet-A5 (base)	Top-1 Error Rate	19.4	# 14
Neural Architecture Search	ImageNet	AlphaNet-A5 (base)	Accuracy	80.6	# 10
Neural Architecture Search	ImageNet	AlphaNet-A5 (base)	FLOPs	596M	# 129

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/alphanet-improved-training-of-supernet-with/neural-architecture-search-on-imagenet)](https://paperswithcode.com/sota/neural-architecture-search-on-imagenet?p=alphanet-improved-training-of-supernet-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/alphanet-improved-training-of-supernet-with/image-classification-on-imagenet)](https://paperswithcode.com/sota/image-classification-on-imagenet?p=alphanet-improved-training-of-supernet-with)`

AlphaNet: Improved Training of Supernets with Alpha-Divergence

16 Feb 2021 · Dilin Wang, Chengyue Gong, Meng Li, Qiang Liu, Vikas Chandra ·

Weight-sharing neural architecture search (NAS) is an effective technique for automating efficient neural architecture design. Weight-sharing NAS builds a supernet that assembles all the architectures as its sub-networks and jointly trains the supernet with the sub-networks. The success of weight-sharing NAS heavily relies on distilling the knowledge of the supernet to the sub-networks. However, we find that the widely used distillation divergence, i.e., KL divergence, may lead to student sub-networks that over-estimate or under-estimate the uncertainty of the teacher supernet, leading to inferior performance of the sub-networks. In this work, we propose to improve the supernet training with a more generalized alpha-divergence. By adaptively selecting the alpha-divergence, we simultaneously prevent the over-estimation or under-estimation of the uncertainty of the teacher model. We apply the proposed alpha-divergence based supernets training to both slimmable neural networks and weight-sharing NAS, and demonstrate significant improvements. Specifically, our discovered model family, AlphaNet, outperforms prior-art models on a wide range of FLOPs regimes, including BigNAS, Once-for-All networks, and AttentiveNAS. We achieve ImageNet top-1 accuracy of 80.0% with only 444M FLOPs. Our code and pretrained models are available at https://github.com/facebookresearch/AlphaNet.

PDF Abstract

Code

Add Remove Mark official

facebookresearch/AlphaNet official

facebookresearch/AttentiveNAS

103

Tasks

Add Remove

Image Classification

Neural Architecture Search

Datasets

ImageNet

Oxford 102 Flower

Food-101

Results from the Paper

Edit

Ranked #12 on Neural Architecture Search on ImageNet

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Neural Architecture Search	ImageNet	AlphaNet-A6	Top-1 Error Rate	19.2	# 12	Compare
			Accuracy	80.8	# 9	Compare
			FLOPs	709M	# 132	Compare
Image Classification	ImageNet	AlphaNet-A5	Top 1 Accuracy	80.3%	# 649	Compare
Image Classification	ImageNet	AlphaNet-A5	GFLOPs	0.491	# 53	Compare
Image Classification	ImageNet	AlphaNet-A4	Top 1 Accuracy	80.0%	# 664	Compare
Image Classification	ImageNet	AlphaNet-A4	GFLOPs	0.444	# 51	Compare
Image Classification	ImageNet	AlphaNet-A0	Top 1 Accuracy	77.8%	# 795	Compare
Image Classification	ImageNet	AlphaNet-A0	GFLOPs	0.203	# 13	Compare
Image Classification	ImageNet	AlphaNet-A6	Top 1 Accuracy	80.8%	# 623	Compare
Image Classification	ImageNet	AlphaNet-A6	GFLOPs	0.709	# 88	Compare
Image Classification	ImageNet	AlphaNet-A3	Top 1 Accuracy	79.4%	# 695	Compare
Image Classification	ImageNet	AlphaNet-A3	GFLOPs	0.357	# 36	Compare
Image Classification	ImageNet	AlphaNet-A2	Top 1 Accuracy	79.1%	# 714	Compare
Image Classification	ImageNet	AlphaNet-A2	GFLOPs	0.317	# 31	Compare
Image Classification	ImageNet	AlphaNet-A1	Top 1 Accuracy	78.9%	# 736	Compare
Image Classification	ImageNet	AlphaNet-A1	GFLOPs	0.279	# 24	Compare
Neural Architecture Search	ImageNet	AlphaNet-A0	Top-1 Error Rate	22.1	# 54	Compare
			Accuracy	77.9	# 43	Compare
			FLOPs	203M	# 110	Compare
Neural Architecture Search	ImageNet	AlphaNet-A1	Top-1 Error Rate	21.0	# 37	Compare
			Accuracy	79.0	# 29	Compare
			FLOPs	279M	# 113	Compare
Neural Architecture Search	ImageNet	AlphaNet-A2	Top-1 Error Rate	20.8	# 34	Compare
			Accuracy	79.2	# 26	Compare
			FLOPs	317M	# 115	Compare
Neural Architecture Search	ImageNet	AlphaNet-A3	Top-1 Error Rate	20.6	# 33	Compare
			Accuracy	79.4	# 25	Compare
			FLOPs	357M	# 117	Compare
Neural Architecture Search	ImageNet	AlphaNet-A4	Top-1 Error Rate	20.0	# 23	Compare
			Accuracy	80.0	# 18	Compare
			FLOPs	444M	# 121	Compare
Neural Architecture Search	ImageNet	AlphaNet-A5 (small)	Top-1 Error Rate	19.7	# 19	Compare
			Accuracy	80.3	# 15	Compare
			FLOPs	491M	# 124	Compare
Neural Architecture Search	ImageNet	AlphaNet-A5 (base)	Top-1 Error Rate	19.4	# 14	Compare
			Accuracy	80.6	# 10	Compare
			FLOPs	596M	# 129	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

AlphaNet: Improved Training of Supernets with Alpha-Divergence

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove