Search Results for author: Keqin Chen

Found 2 papers, 2 papers with code

SPHINX: The Joint Mixing of Weights, Tasks, and Visual Embeddings for Multi-modal Large Language Models

1 code implementation • 13 Nov 2023 • Ziyi Lin, Chris Liu, Renrui Zhang, Peng Gao, Longtian Qiu, Han Xiao, Han Qiu, Chen Lin, Wenqi Shao, Keqin Chen, Jiaming Han, Siyuan Huang, Yichi Zhang, Xuming He, Hongsheng Li, Yu Qiao

We present SPHINX, a versatile multi-modal large language model (MLLM) with a joint mixing of model weights, tuning tasks, and visual embeddings.

Ranked #2 on Visual Question Answering on BenchLMM

Described Object Detection Language Modelling +4

2,496

Paper
Code

Shikra: Unleashing Multimodal LLM's Referential Dialogue Magic

1 code implementation • 27 Jun 2023 • Keqin Chen, Zhao Zhang, Weili Zeng, Richong Zhang, Feng Zhu, Rui Zhao

Referential dialogue is a superset of various vision-language (VL) tasks.

Ranked #10 on Visual Question Answering on ViP-Bench

Image Captioning Referring Expression Segmentation +1

679

Paper
Code

Cannot find the paper you are looking for? You can Submit a new open access paper.