TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Image Captioning	IU X-Ray	BiomedGPT	CIDEr	36.0	# 1
Natural Language Inference	MedNLI	BiomedGPT-B	Accuracy	83.83	# 4
Text Summarization	MeQSum	BiomedGPT	RougeL	52.3	# 1
Medical Visual Question Answering	PathVQA	BiomedGPT	Free-form Accuracy	28.0	# 4
Medical Visual Question Answering	PathVQA	BiomedGPT	Yes/No Accuracy	88.0	# 2
Medical Visual Question Answering	PathVQA	BiomedGPT	Overall Accuracy	58.1	# 4
Image Captioning	Peir Gross	BiomedGPT	CIDEr	122.7	# 1
Image Captioning	Peir Gross	BiomedGPT	METEOR	15.4	# 1
Image Captioning	Peir Gross	BiomedGPT	ROUGE-L	30.2	# 1
Medical Visual Question Answering	SLAKE-English	BiomedGPT	Overall Accuracy	86.1	# 1
Medical Visual Question Answering	SLAKE-English	BiomedGPT	Close-ended Accuracy	89.9	# 2
Medical Visual Question Answering	SLAKE-English	BiomedGPT	Open-ended Accuracy	84.3	# 1
Medical Visual Question Answering	VQA-RAD	BiomedGPT	Close-ended Accuracy	81.3	# 9
Medical Visual Question Answering	VQA-RAD	BiomedGPT	Open-ended Accuracy	60.9	# 7
Medical Visual Question Answering	VQA-RAD	BiomedGPT	Overall Accuracy	73.2	# 8

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/biomedgpt-a-unified-and-generalist-biomedical/image-captioning-on-iu-x-ray)](https://paperswithcode.com/sota/image-captioning-on-iu-x-ray?p=biomedgpt-a-unified-and-generalist-biomedical)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/biomedgpt-a-unified-and-generalist-biomedical/text-summarization-on-meqsum)](https://paperswithcode.com/sota/text-summarization-on-meqsum?p=biomedgpt-a-unified-and-generalist-biomedical)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/biomedgpt-a-unified-and-generalist-biomedical/image-captioning-on-peir-gross)](https://paperswithcode.com/sota/image-captioning-on-peir-gross?p=biomedgpt-a-unified-and-generalist-biomedical)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/biomedgpt-a-unified-and-generalist-biomedical/medical-visual-question-answering-on-pathvqa)](https://paperswithcode.com/sota/medical-visual-question-answering-on-pathvqa?p=biomedgpt-a-unified-and-generalist-biomedical)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/biomedgpt-a-unified-and-generalist-biomedical/medical-visual-question-answering-on-vqa)](https://paperswithcode.com/sota/medical-visual-question-answering-on-vqa?p=biomedgpt-a-unified-and-generalist-biomedical)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/biomedgpt-a-unified-and-generalist-biomedical/natural-language-inference-on-mednli)](https://paperswithcode.com/sota/natural-language-inference-on-mednli?p=biomedgpt-a-unified-and-generalist-biomedical)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/biomedgpt-a-unified-and-generalist-biomedical/medical-visual-question-answering-on-vqa-rad)](https://paperswithcode.com/sota/medical-visual-question-answering-on-vqa-rad?p=biomedgpt-a-unified-and-generalist-biomedical)`

BiomedGPT: A Unified and Generalist Biomedical Generative Pre-trained Transformer for Vision, Language, and Multimodal Tasks

26 May 2023 · Kai Zhang, Jun Yu, Eashan Adhikarla, Rong Zhou, Zhiling Yan, Yixin Liu, Zhengliang Liu, Lifang He, Brian Davison, Xiang Li, Hui Ren, Sunyang Fu, James Zou, Wei Liu, Jing Huang, Chen Chen, Yuyin Zhou, Tianming Liu, Xun Chen, Yong Chen, Quanzheng Li, Hongfang Liu, Lichao Sun ·

Conventional task- and modality-specific artificial intelligence (AI) models are inflexible in real-world deployment and maintenance for biomedicine. At the same time, the growing availability of biomedical data, coupled with the advancements in modern multi-modal multi-task AI techniques, has paved the way for the emergence of generalist biomedical AI solutions. These solutions hold the potential to interpret different medical modalities and produce expressive outputs such as free-text reports or disease diagnosis. Here, we propose BiomedGPT, the first open-source and generalist visual language AI for diverse biomedical tasks. BiomedGPT achieved 16 state-of-the-art results across five clinically significant tasks on 26 datasets. Notably, it outperformed OpenAI's GPT-4 with vision (GPT-4V) in radiology human evaluation and surpassed Google's Med-PaLM M (12B) in breast cancer diagnosis and medical visual question answering. Moreover, BiomedGPT facilitates zero-shot transfer learning, greatly enhancing its utility as a biomedical assistant, similar to ChatGPT. Our method demonstrates effective training with diverse datasets can lead to more practical biomedical AI.

PDF Abstract

Code

Add Remove Mark official

taokz/biomedgpt official

288

Tasks

Add Remove

Image Captioning

Medical Visual Question Answering

Natural Language Inference

Question Answering

Text Summarization

Transfer Learning

Visual Question Answering

Datasets

MIMIC-III

MIMIC-CXR

VQA-RAD

SLAKE

PathVQA

MeQSum IU X-Ray

MedNLI

SLAKE-English Peir Gross

Results from the Paper

Edit

Ranked #1 on Text Summarization on MeQSum

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Image Captioning	IU X-Ray	BiomedGPT	CIDEr	36.0	# 1	Compare
Natural Language Inference	MedNLI	BiomedGPT-B	Accuracy	83.83	# 4	Compare
Text Summarization	MeQSum	BiomedGPT	RougeL	52.3	# 1	Compare
Medical Visual Question Answering	PathVQA	BiomedGPT	Free-form Accuracy	28.0	# 4	Compare
			Yes/No Accuracy	88.0	# 2	Compare
			Overall Accuracy	58.1	# 4	Compare
Image Captioning	Peir Gross	BiomedGPT	CIDEr	122.7	# 1	Compare
			METEOR	15.4	# 1	Compare
			ROUGE-L	30.2	# 1	Compare
Medical Visual Question Answering	SLAKE-English	BiomedGPT	Overall Accuracy	86.1	# 1	Compare
			Close-ended Accuracy	89.9	# 2	Compare
			Open-ended Accuracy	84.3	# 1	Compare
Medical Visual Question Answering	VQA-RAD	BiomedGPT	Close-ended Accuracy	81.3	# 9	Compare
			Open-ended Accuracy	60.9	# 7	Compare
			Overall Accuracy	73.2	# 8	Compare

Methods

Add Remove

Absolute Position Encodings • Adam • BPE • Dense Connections • Dropout • GPT-4 • Label Smoothing • Layer Normalization • Linear Layer • Multi-Head Attention • Position-Wise Feed-Forward Layer • Residual Connection • Scaled Dot-Product Attention • Softmax • Transformer

Edit Social Preview

BiomedGPT: A Unified and Generalist Biomedical Generative Pre-trained Transformer for Vision, Language, and Multimodal Tasks

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove