Search Results for author: Shaochong Jia

Found 2 papers, 0 papers with code

An Intermediate Fusion ViT Enables Efficient Text-Image Alignment in Diffusion Models

no code implementations • 25 Mar 2024 • Zizhao Hu, Shaochong Jia, Mohammad Rostami

Diffusion models have been widely used for conditional data cross-modal generation tasks such as text-to-image and text-to-video.

Text-to-Image Generation

Paper
Add Code

Efficient Multimodal Diffusion Models Using Joint Data Infilling with Partially Shared U-Net

no code implementations • 28 Nov 2023 • Zizhao Hu, Shaochong Jia, Mohammad Rostami

Recently, diffusion models have been used successfully to fit distributions for cross-modal data translation and multimodal data generation.

Image Inpainting

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.