TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Facial Expression Recognition (FER)	AffectNet	S2D	Accuracy (7 emotion)	67.62	# 3
Facial Expression Recognition (FER)	AffectNet	S2D	Accuracy (8 emotion)	63.06	# 4
Dynamic Facial Expression Recognition	DFEW	S2D	WAR	76.03	# 2
Dynamic Facial Expression Recognition	DFEW	S2D	UAR	65.45	# 2
Dynamic Facial Expression Recognition	FERV39k	S2D	WAR	52.56	# 1
Dynamic Facial Expression Recognition	FERV39k	S2D	UAR	43.97	# 1
Dynamic Facial Expression Recognition	MAFW	S2D	WAR	57.37	# 2
Dynamic Facial Expression Recognition	MAFW	S2D	UAR	43.40	# 2
Facial Expression Recognition (FER)	RAF-DB	S2D	Overall Accuracy	92.57	# 2

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/from-static-to-dynamic-adapting-landmark-1/dynamic-facial-expression-recognition-on)](https://paperswithcode.com/sota/dynamic-facial-expression-recognition-on?p=from-static-to-dynamic-adapting-landmark-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/from-static-to-dynamic-adapting-landmark-1/dynamic-facial-expression-recognition-on-dfew)](https://paperswithcode.com/sota/dynamic-facial-expression-recognition-on-dfew?p=from-static-to-dynamic-adapting-landmark-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/from-static-to-dynamic-adapting-landmark-1/dynamic-facial-expression-recognition-on-mafw)](https://paperswithcode.com/sota/dynamic-facial-expression-recognition-on-mafw?p=from-static-to-dynamic-adapting-landmark-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/from-static-to-dynamic-adapting-landmark-1/facial-expression-recognition-on-raf-db)](https://paperswithcode.com/sota/facial-expression-recognition-on-raf-db?p=from-static-to-dynamic-adapting-landmark-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/from-static-to-dynamic-adapting-landmark-1/facial-expression-recognition-on-affectnet)](https://paperswithcode.com/sota/facial-expression-recognition-on-affectnet?p=from-static-to-dynamic-adapting-landmark-1)`

From Static to Dynamic: Adapting Landmark-Aware Image Models for Facial Expression Recognition in Videos

9 Dec 2023 · Yin Chen, Jia Li, Shiguang Shan, Meng Wang, Richang Hong ·

Dynamic facial expression recognition (DFER) in the wild is still hindered by data limitations, e.g., insufficient quantity and diversity of pose, occlusion and illumination, as well as the inherent ambiguity of facial expressions. In contrast, static facial expression recognition (SFER) currently shows much higher performance and can benefit from more abundant high-quality training data. Moreover, the appearance features and dynamic dependencies of DFER remain largely unexplored. To tackle these challenges, we introduce a novel Static-to-Dynamic model (S2D) that leverages existing SFER knowledge and dynamic information implicitly encoded in extracted facial landmark-aware features, thereby significantly improving DFER performance. Firstly, we build and train an image model for SFER, which incorporates a standard Vision Transformer (ViT) and Multi-View Complementary Prompters (MCPs) only. Then, we obtain our video model (i.e., S2D), for DFER, by inserting Temporal-Modeling Adapters (TMAs) into the image model. MCPs enhance facial expression features with landmark-aware features inferred by an off-the-shelf facial landmark detector. And the TMAs capture and model the relationships of dynamic changes in facial expressions, effectively extending the pre-trained image model for videos. Notably, MCPs and TMAs only increase a fraction of trainable parameters (less than +10\%) to the original image model. Moreover, we present a novel Emotion-Anchors (i.e., reference samples for each emotion category) based Self-Distillation Loss to reduce the detrimental influence of ambiguous emotion labels, further enhancing our S2D. Experiments conducted on popular SFER and DFER datasets show that we achieve the state of the art.

PDF Abstract

Code

Add Remove Mark official

FER-LMC/S2D official

Tasks

Add Remove

Dynamic Facial Expression Recognition

Facial Expression Recognition

Facial Expression Recognition (FER)

Datasets

AffectNet

RAF-DB

FER+ DFEW FERV39k

MAFW

Results from the Paper

Edit

Ranked #1 on Facial Expression Recognition (FER) on RAF-DB

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Facial Expression Recognition (FER)	AffectNet	S2D	Accuracy (7 emotion)	67.62	# 3	Compare
Facial Expression Recognition (FER)	AffectNet	S2D	Accuracy (8 emotion)	63.06	# 4	Compare
Dynamic Facial Expression Recognition	DFEW	S2D	WAR	76.03	# 2	Compare
Dynamic Facial Expression Recognition	DFEW	S2D	UAR	65.45	# 2	Compare
Dynamic Facial Expression Recognition	FERV39k	S2D	WAR	52.56	# 1	Compare
Dynamic Facial Expression Recognition	FERV39k	S2D	UAR	43.97	# 1	Compare
Dynamic Facial Expression Recognition	MAFW	S2D	WAR	57.37	# 2	Compare
Dynamic Facial Expression Recognition	MAFW	S2D	UAR	43.40	# 2	Compare
Facial Expression Recognition (FER)	RAF-DB	S2D	Overall Accuracy	92.57	# 2	Compare

Methods

Add Remove

Absolute Position Encodings • Adam • BPE • Dense Connections • Dropout • Label Smoothing • Layer Normalization • Linear Layer • Multi-Head Attention • Position-Wise Feed-Forward Layer • Residual Connection • Scaled Dot-Product Attention • Softmax • Transformer • Vision Transformer

Edit Social Preview

From Static to Dynamic: Adapting Landmark-Aware Image Models for Facial Expression Recognition in Videos

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove