TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Medical Visual Question Answering	PMC-VQA	PMC-CLIP	Accuracy	24.7	# 3
Visual Question Answering (VQA)	PMC-VQA	PMC-CLIP	Accuracy	24.7	# 3
Medical Visual Question Answering	VQA-RAD	PMC-CLIP	Close-ended Accuracy	84.0	# 5
Medical Visual Question Answering	VQA-RAD	PMC-CLIP	Open-ended Accuracy	67.0	# 5
Medical Visual Question Answering	VQA-RAD	PMC-CLIP	Overall Accuracy	77.6	# 4

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/pmc-clip-contrastive-language-image-pre/medical-visual-question-answering-on-pmc-vqa)](https://paperswithcode.com/sota/medical-visual-question-answering-on-pmc-vqa?p=pmc-clip-contrastive-language-image-pre)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/pmc-clip-contrastive-language-image-pre/visual-question-answering-vqa-on-pmc-vqa)](https://paperswithcode.com/sota/visual-question-answering-vqa-on-pmc-vqa?p=pmc-clip-contrastive-language-image-pre)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/pmc-clip-contrastive-language-image-pre/medical-visual-question-answering-on-vqa-rad)](https://paperswithcode.com/sota/medical-visual-question-answering-on-vqa-rad?p=pmc-clip-contrastive-language-image-pre)`

PMC-CLIP: Contrastive Language-Image Pre-training using Biomedical Documents

13 Mar 2023 · Weixiong Lin, Ziheng Zhao, Xiaoman Zhang, Chaoyi Wu, Ya zhang, Yanfeng Wang, Weidi Xie ·

Foundation models trained on large-scale dataset gain a recent surge in CV and NLP. In contrast, development in biomedical domain lags far behind due to data scarcity. To address this issue, we build and release PMC-OA, a biomedical dataset with 1.6M image-caption pairs collected from PubMedCentral's OpenAccess subset, which is 8 times larger than before. PMC-OA covers diverse modalities or diseases, with majority of the image-caption samples aligned at finer-grained level, i.e., subfigure and subcaption. While pretraining a CLIP-style model on PMC-OA, our model named PMC-CLIP achieves state-of-the-art results on various downstream tasks, including image-text retrieval on ROCO, MedMNIST image classification, Medical VQA, i.e. +8.1% R@10 on image-text retrieval, +3.9% accuracy on image classification.

PDF Abstract

Code

Add Remove Mark official

WeixiongLin/PMC-CLIP official

105

Tasks

Add Remove

Image Classification

Medical Visual Question Answering

Retrieval

Text Retrieval

Visual Question Answering (VQA)

Datasets

Introduced in the Paper:

PMC-OA

Used in the Paper:

VQA-RAD

SLAKE PMC-VQA MedICaT

Results from the Paper

Add Remove

Ranked #3 on Medical Visual Question Answering on PMC-VQA

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Medical Visual Question Answering	PMC-VQA	PMC-CLIP	Accuracy	24.7	# 3	Compare
Visual Question Answering (VQA)	PMC-VQA	PMC-CLIP	Accuracy	24.7	# 3	Compare
Medical Visual Question Answering	VQA-RAD	PMC-CLIP	Close-ended Accuracy	84.0	# 5	Compare
			Open-ended Accuracy	67.0	# 5	Compare
			Overall Accuracy	77.6	# 4	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

PMC-CLIP: Contrastive Language-Image Pre-training using Biomedical Documents

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit Add Remove

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Add Remove

Methods

Add Remove