TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Video Instance Segmentation	OVIS validation	CMaskTrack R-CNN (ResNet-50)	mask AP	15.4	# 39
Video Instance Segmentation	OVIS validation	CMaskTrack R-CNN (ResNet-50)	AP50	33.9	# 36
Video Instance Segmentation	OVIS validation	CMaskTrack R-CNN (ResNet-50)	AP75	13.1	# 39
Video Instance Segmentation	OVIS validation	CMaskTrack R-CNN (ResNet-50)	APso	28.6	# 5
Video Instance Segmentation	OVIS validation	CMaskTrack R-CNN (ResNet-50)	APmo	18.7	# 7
Video Instance Segmentation	OVIS validation	CMaskTrack R-CNN (ResNet-50)	APho	4.1	# 8
Video Instance Segmentation	OVIS validation	CSipMask (ResNet-50)	mask AP	14.3	# 42
Video Instance Segmentation	OVIS validation	CSipMask (ResNet-50)	AP50	29.9	# 40
Video Instance Segmentation	OVIS validation	CSipMask (ResNet-50)	AP75	12.5	# 40
Video Instance Segmentation	OVIS validation	CSipMask (ResNet-50)	APso	23	# 6
Video Instance Segmentation	OVIS validation	CSipMask (ResNet-50)	APmo	12.8	# 9
Video Instance Segmentation	OVIS validation	CSipMask (ResNet-50)	APho	2.7	# 9
Video Instance Segmentation	YouTube-VIS validation	CMaskTrack R-CNN	mask AP	32.1	# 47
Video Instance Segmentation	YouTube-VIS validation	CMaskTrack R-CNN	AP50	52.8	# 43
Video Instance Segmentation	YouTube-VIS validation	CMaskTrack R-CNN	AP75	34.9	# 43
Video Instance Segmentation	YouTube-VIS validation	CSipMask	mask AP	35.1	# 42
Video Instance Segmentation	YouTube-VIS validation	CSipMask	AP50	55.6	# 39
Video Instance Segmentation	YouTube-VIS validation	CSipMask	AP75	38.1	# 37

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/occluded-video-instance-segmentation/video-instance-segmentation-on-ovis-1)](https://paperswithcode.com/sota/video-instance-segmentation-on-ovis-1?p=occluded-video-instance-segmentation)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/occluded-video-instance-segmentation/video-instance-segmentation-on-youtube-vis-1)](https://paperswithcode.com/sota/video-instance-segmentation-on-youtube-vis-1?p=occluded-video-instance-segmentation)`

Occluded Video Instance Segmentation: A Benchmark

2 Feb 2021 · Jiyang Qi, Yan Gao, Yao Hu, Xinggang Wang, Xiaoyu Liu, Xiang Bai, Serge Belongie, Alan Yuille, Philip H. S. Torr, Song Bai ·

Can our video understanding systems perceive objects when a heavy occlusion exists in a scene? To answer this question, we collect a large-scale dataset called OVIS for occluded video instance segmentation, that is, to simultaneously detect, segment, and track instances in occluded scenes. OVIS consists of 296k high-quality instance masks from 25 semantic categories, where object occlusions usually occur. While our human vision systems can understand those occluded instances by contextual reasoning and association, our experiments suggest that current video understanding systems cannot. On the OVIS dataset, the highest AP achieved by state-of-the-art algorithms is only 16.3, which reveals that we are still at a nascent stage for understanding objects, instances, and videos in a real-world scenario. We also present a simple plug-and-play module that performs temporal feature calibration to complement missing object cues caused by occlusion. Built upon MaskTrack R-CNN and SipMask, we obtain a remarkable AP improvement on the OVIS dataset. The OVIS dataset and project code are available at http://songbai.site/ovis .

PDF Abstract

Code

Add Remove Mark official

qjy981010/CMaskTrack-RCNN

haochenheheda/lvvis

Tasks

Add Remove

Instance Segmentation

Segmentation

Semantic Segmentation

Video Instance Segmentation

Video Understanding

Datasets

Introduced in the Paper:

OVIS

Used in the Paper:

MS COCO

YouTube-VIS 2019 YouTube-VIS 2021

Results from the Paper

Edit

Ranked #39 on Video Instance Segmentation on OVIS validation

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Video Instance Segmentation	OVIS validation	CMaskTrack R-CNN (ResNet-50)	mask AP	15.4	# 39	Compare
			AP50	33.9	# 36	Compare
			AP75	13.1	# 39	Compare
			APso	28.6	# 5	Compare
			APmo	18.7	# 7	Compare
			APho	4.1	# 8	Compare
Video Instance Segmentation	OVIS validation	CSipMask (ResNet-50)	mask AP	14.3	# 42	Compare
			AP50	29.9	# 40	Compare
			AP75	12.5	# 40	Compare
			APso	23	# 6	Compare
			APmo	12.8	# 9	Compare
			APho	2.7	# 9	Compare
Video Instance Segmentation	YouTube-VIS validation	CMaskTrack R-CNN	mask AP	32.1	# 47	Compare
			AP50	52.8	# 43	Compare
			AP75	34.9	# 43	Compare
Video Instance Segmentation	YouTube-VIS validation	CSipMask	mask AP	35.1	# 42	Compare
			AP50	55.6	# 39	Compare
			AP75	38.1	# 37	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Occluded Video Instance Segmentation: A Benchmark

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove