2025

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2025

GSmoothFace: Generalized Smooth Talking Face Generation via Fine Grained 3D Face Guidance

Haiming Zhang, Zhihao Yuan, Chaoda Zheng, Xu Yan, Baoyuan Wang, Guanbin Li, Song Wu, Shuguang Cui

IEEE Transactions on Visualization and Computer Graphics

Project

ODMixer: Fine-grained Spatial-temporal MLP for Metro Origin-Destination Prediction

Yang Liu; Binglin Chen; Yongsen Zheng; Lechao Cheng; Guanbin Li; Liang Lin

IEEE Transactions on Knowledge and Data Engineering

Project

RoomTour3D: Geometry-Aware Video-Instruction Tuning for Embodied Navigation

Mingfei Han, Liang Ma, Kamila Zhumakhanova, Ekaterina Radionova, Jingyi Zhang, Xiaojun Chang, Xiaodan Liang, Ivan Laptev;

CVPR 2025

Project

Realistic and Efficient Face Swapping: A Unified Approach with Diffusion Models

Sanoojan Baliah; Qinliang Lin; Shengcai Liao; Xiaodan Liang; Muhammad Haris Khan

2025 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)

Project

Navcot: Boosting llm-based vision-and-language navigation via learning disentangled reasoning

Bingqian Lin, Yunshuang Nie, Ziming Wei, Jiaqi Chen, Shikui Ma, Jianhua Han, Hang Xu, Xiaojun Chang, Xiaodan Liang

IEEE Transactions on Pattern Analysis and Machine Intelligence

Project

Getting More Juice Out of Your Data: Hard Pair Refinement Enhances Visual-Language Models Without Extra Data

Haonan Wang, Minbin Huang, Runhui Huang, Lanqing Hong, Hang Xu, Tianyang Hu, Xiaodan Liang, Zhenguo Li, Hong Cheng, Kenji Kawaguchi

Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies

Project

Dreamvideo: High-fidelity image-to-video generation with image retention and text guidance

Cong Wang, Jiaxi Gu, Panwen Hu, Yuanfan Guo, Xiao Dong, Hang Xu, Xiaodan Liang

ICASSP 2025-2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

Project

Affordances-oriented planning using foundation models for continuous vision-language navigation

Jiaqi Chen, Bingqian Lin, Xinmin Liu, Lin Ma, Xiaodan Liang, Kwan-Yee K Wong

Proceedings of the AAAI Conference on Artificial Intelligence

Project

DigitalLLaVA Incorporating Digital Cognition Capability for Physical World Comprehension in Multimodal LLMs

Shiyu Li, Pengxu Wei, Pengchong Qiao, Chang Liu, Jie Chen

Proceedings of the AAAI Conference on Artificial Intelligence

Project

Cross-Modal Causal Representation Learning for Radiology Report Generation

Weixing Chen, Yang Liu*, Ce Wang, Jiarui Zhu, Guanbin Li, Cheng-Lin Liu, Liang Lin

IEEE Transactions on Image Processing

3DAffordSplat: Efficient Affordance Reasoning with 3D Gaussians

Zeming Wei, Junyi Lin, Yang Liu*, Weixing Chen, Jingzhou Luo, Guanbin Li, Liang Lin

ACM International Conference on Multimedia (ACM MM)

Project

MedSoft-Diffusion: Medical Semantic-Guided Diffusion Model with Soft Mask Conditioning for Vertebral Disease Diagnosis

Shidan He, Enyuan Hu, Zixuan Tang, Bin Chen, Dongdong Yu, Yuan Hong, Zhenzhong Liu, Mengtang Li, Lei Liu, Shen Zhao

Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

Project

Free on the Fly: Enhancing Flexibility in Test-Time Adaptation with Online EM

Qiyuan Dai, Sibei Yang

CVPR 2025

Project

Beyond the Destination: A Novel Benchmark for Exploration-Aware Embodied Question Answering

Kaixuan Jiang, Yang Liu, Weixing Chen, Jingzhou Luo, Ziliang Chen, Ling Pan, Guanbin Li, Liang Lin

IEEE International Conference on Computer Vision（ICCV）, 2025

Project

Can We Achieve Efficient Diffusion without Self-Attention? Distilling Self-Attention into Convolutions

ZiYi Dong, Chengxing Zhou, Weijian Deng, Pengxu Wei, Xiangyang Ji, Liang Lin

IEEE International Conference on Computer Vision（ICCV）, 2025

Project

DreamFuse: Adaptive Image Fusion with Diffusion Transformer

Junjia Huang, Pengxiang Yan, Jiyang Liu, Jie Wu, Zhao Wang, Yitong Wang, Liang Lin, Guanbin Li

IEEE International Conference on Computer Vision（ICCV）, 2025

Project

DreamLayer: Simultaneous Multi-Layer Generation via Diffusion Mode

Junjia Huang, Pengxiang Yan, Jinhang Cai, Jiyang Liu, Zhao Wang, Yitong Wang, Xinglong Wu, Guanbin Li

IEEE International Conference on Computer Vision（ICCV）, 2025

Project

DriveMM: All-in-One Large Multimodal Model for Autonomous Driving

Zhijian Huang, Chengjian Feng, Feng Yan, Baihui Xiao, Zequn Jie, Yujie Zhong, Xiaodan Liang, Lin Ma

IEEE International Conference on Computer Vision（ICCV）, 2025

Project

GeoSplatting: Towards Geometry Guided Gaussian Splatting for Physically-based Inverse Rendering

Kai Ye, Chong Gao, Guanbin Li, Wenzheng Chen, Baoquan Chen

IEEE International Conference on Computer Vision（ICCV）, 2025

Project

RoboPearls: Editable Video Simulation for Robot Manipulation

Tao Tang, Likui Zhang, Youpeng Wen, Kaidong Zhang, Jia-Wang Bian, xia zhou, Tianyi Yan, Kun Zhan, Peng Jia, Hefeng Wu, Liang Lin, Xiaodan Liang

IEEE International Conference on Computer Vision（ICCV）, 2025

Project

RoBridge: A Hierarchical Architecture Bridging Cognition and Execution for General Robotic Manipulation

Kaidong Zhang, Rongtao Xu, Pengzhen Ren, Junfan Lin, Hefeng Wu, Liang Lin, Xiaodan Liang

IEEE International Conference on Computer Vision（ICCV）, 2025

Project

Towards Long-Horizon Vision-Language Navigation: Platform, Benchmark and Method

Xinshuai Song, Weixing Chen, Yang Liu, Weikai Chen, Guanbin Li, Liang Lin

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

Cross-modal Causal Relation Alignment for Video Question Grounding

Weixing Chen, Yang Liu, Binglin Chen, Jiandong Su, Yongsen Zheng, Liang Lin

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Highlight

Project

DSPNet: Dual-vision Scene Perception for Robust 3D Question Answering

Jingzhou Luo, Yang Liu, Weixing Chen, Zhen Li, Yaowei Wang, Guanbin Li, Liang Lin

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

VTON 360: High-Fidelity Virtual Try-On from Any Viewing Direction

Zijian He, Yuwei Ning, Yipeng Qin, Wangrun Wang, Sibei Yang, Liang Lin, Guanbin Li

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

Reproducible Vision-Language Models Meet Concepts Out of Pre-Training

Ziliang Chen, Xin Huang, Xiaoxuan Fan, Keze Wang, Yuyu Zhou, Quanlong Guan, Liang Lin

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

DAGSM: Disentangled Avatar Generation with GS-enhanced Mesh

Jingyu Zhuang, Di Kang, Linchao Bao, Liang Lin, Guanbin Li

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

LLM-driven Multimodal and Multi-Identity Listening Head Generation

Peiwen Lai, Weizhi Zhong, Yipeng Qin, Xiaohang Ren, Baoyuan Wang, Guanbin Li

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

HiRes-LLaVA: Restoring Fragmentation Input in High-Resolution Large Vision-Language Models

Runhui Huang, Xinpeng Ding, Chunwei Wang, Jianhua Han, Yulong Liu, Hengshuang Zhao, Hang Xu, Lu Hou, Wei Zhang, Xiaodan Liang

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

FireEdit: Fine-grained Instruction-based Image Editing via Region-aware Vision Language Model

Jun Zhou, Jiahao Li, Zunnan Xu, Hanhui Li, Yiji Cheng, Fa-Ting Hong, Qin Lin, Qinglin Lu, Xiaodan Liang

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions

Kai Chen, Yunhao Gou, Runhui Huang, Zhili Liu, Daxin Tan, Jing Xu, Chunwei Wang, Yi Zhu, Yihan Zeng, Kuo Yang, Dingdong Wang, Kun Xiang, Haoyuan Li, Haoli Bai, Jianhua Han, Xiaohui Li, Weike Jin, Nian

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

PS-Diffusion: Photorealistic Subject-Driven Image Editing with Disentangled Control and Attention

Weicheng Wang, Guoli Jia, Zhongqi Zhang, Liang Lin, Jufeng Yang

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

Boosting the Dual-Stream Architecture in Ultra-High Resolution Segmentation with Resolution-Biased Uncertainty Estimation

Rong Qin, Xingyu Liu, Jinglei Shi, Liang Lin, Jufeng Yang

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

No Pains, More Gains: Recycling Sub-Salient Patches for Efficient High-Resolution Image Recognition

Rong Qin, Xin Liu, Xingyu Liu, Jiaxuan Liu, Jinglei Shi, Liang Lin, Jufeng Yang

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

Empowering Large Language Models with 3D Situation Awareness

Zhihao Yuan, Yibo Peng, Jinke Ren, Yinghong Liao, Yatong Han, Chun-Mei Feng, Hengshuang Zhao, Guanbin Li, Shuguang Cui, Zhen Li

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

Rethinking Query-based Transformer for Continual Image Segmentation

Yuchen Zhu, Cheng Shi, Dingyou Wang, Jiajin Tang, Zhengxuan Wei, Yu Wu, Guanbin Li, Sibei Yang

IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2025

Project

Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI

Yang Liu, Weixing Chen, Yongjie Bai, Guanbin Li, Wen Gao, Liang Lin.

IEEE/ASME Transactions on Mechatronics

Project

Contrastive Decoupled Representation Learning and Regularization for Speech-Preserving Facial Expression Manipulation

Tianshui Chen, Jianman Lin, Zhijing Yang, Chumei Qing, Yukai Shi, Liang Lin

International Journal of Computer Vision

Project

A Causality-Aware Paradigm for Evaluating Creativity of Multimodal Large Language Models

Zhongzhan Huang; Shanshan Zhong; Pan Zhou; Shanghua Gao; Marinka Zitnik; Liang Lin

IEEE Transactions on Pattern Analysis and Machine Intelligence

Project

VideoQA in the Era of LLMs: An Empirical Study

Junbin Xiao, Nanxin Huang, Hangyu Qin, Dongyang Li, Yicong Li, Fengbin Zhu, Zhulin Tao, Jianxing Yu, Liang Lin, Tat-Seng Chua & Angela Yao

International Journal of Computer Vision 2025

Project

CrossFuse: Learning Infrared and Visible Image Fusion by Cross-Sensor Top-K Vision Alignment and Beyond

Yukai Shi; Cidan Shi; Zhipeng Weng; Yin Tian; Xiaoyu Xian; Liang Lin

IEEE Transactions on Circuits and Systems for Video Technology

Project

DFVO: Learning Darkness-Free Visible and Infrared Image Disentanglement and Fusion All at Once

Qi Zhou, Yukai Shi, Xiaojun Yang∗ , Xiaoyu Xian, Lunjia Liao, Ruimao Zhang, and Liang Lin

IEEE Transactions on Instrumentation and Measurement

Project

Hierarchically controlled deformable 3D gaussians for talking head synthesis

Zhenhua Wu, Linxuan Jiang, Xiang Li, Chaowei Fang, Yipeng Qin, Guanbin Li

Proceedings of the AAAI Conference on Artificial Intelligence

Project

Bridging Knowledge Gap Between Image Inpainting and Large-Area Visible Watermark Removal

Yicheng Leng, Chaowei Fang, Junye Chen, Yixiang Fang, Sheng Li, Guanbin Li

Proceedings of the AAAI Conference on Artificial Intelligence

Project

2024

HyCoRec: Hypergraph-Enhanced Multi-Preference Learning for Alleviating Matthew Effect in Conversational Recommendation

Yongsen Zheng, Ruilin Xu, Ziliang Chen, Guohua Wang, Mingjie Qian, Jinghui Qin, Liang Lin

ACL 2024

Paper Code Project

MLP Can Be A Good Transformer Learner

Sihao Lin, Pumeng Lyu, Dongrui Liu, Tao Tang, Xiaodan Liang, Andy Song, Xiaojun Chang

CVPR 2024 Oral paper (Best Paper Candidate)

Project

NeRF-HuGS: Improved Neural Radiance Fields in Non-static Scenes Using Heuristics-Guided Segmentation

Jiahao Chen, Yipeng Qin, Lingjie Liu, Jiangbo Lu, Guanbin Li

CVPR 2024 Oral paper (Best Paper Candidate)

Project

MUSTARD: MASTERING UNIFORM SYNTHESIS OF THEOREM AND PROOF DATA

Yinya Huang, Xiaohan Lin, Zhengying Liu, Qingxing Cao, Huajian Xin, Haiming Wang, Zhenguo Li, Linqi Song, Xiaodan Liang

ICLR 2024

Project

DNA Family: Boosting Weight-Sharing NAS with Block-Wise Supervisions

Guangrun Wang†, Changlin Li†, Liuchun Yuan, Jiefeng Peng, Xiaoyu Xian, Xiaodan Liang, Xiaojun Chang, and Liang Lin

TPAMI 2024

Project

AlignMiF: Geometry-Aligned Multimodal Implicit Field for LiDAR-Camera Joint Synthesis

Tang Tao, Guangrun Wang, Yixing Lao, Peng Chen, Jie Liu, Liang Lin, Kaicheng Yu, Xiaodan Liang

CVPR 2024

Project

VidMan: Exploiting Implicit Dynamics from Video Diffusion Model for Effective Robot Manipulation

Youpeng Wen, Junfan Lin, Yi Zhu, Jianhua Han, Hang Xu, Shen Zhao, Xiaodan Liang

Annual Conference on Neural Information Processing Systems 2024

Project

TIP-Editor: An Accurate 3D Editor Following Both Text-Prompts And Image-Prompts

Jingyu Zhuang, Di Kang, Yan-Pei Cao, Guanbin Li, Liang Lin, Ying Shan

Siggraph 2024 & ACM Transactions on Graphics (TOG)

Project

《多模态大模型：新一代人工智能技术范式》

刘阳，林倞

电子工业出版社

入选中山大学本科教材系列

Code Project

Customize your NeRF: Adaptive Source Driven 3D Scene Editing via Local-Global Iterative Training

Runze He, Shaofei Huang, Xuecheng Nie, Tianrui Hui, Luoqi Liu, Jiao Dai, Jizhong Han, Guanbin Li, Si Liu

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition

OVER-NAV: Elevating Iterative Vision-and-Language Navigation with Open-Vocabulary Detection and StructurEd Representation

Ganlong Zhao, Guanbin Li, Weikai Chen, Yizhou Yu

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition

Project

Universal semi-supervised model adaptation via collaborative consistency training

Zizheng Yan, Yushuang Wu, Yipeng Qin, Xiaoguang Han, Shuguang Cui, Guanbin Li

Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision

Open-vocabulary segmentation with semantic-assisted calibration

Yong Liu, Sule Bai, Guanbin Li, Yitong Wang, Yansong Tang

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition

Decoupled Pseudo-labeling for Semi-Supervised Monocular 3D Object Detection

Jiacheng Zhang, Jiaming Li, Xiangru Lin, Wei Zhang, Xiao Tan, Junyu Han, Errui Ding, Jingdong Wang, Guanbin Li

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition

Project

Learning background prompts to discover implicit knowledge for open vocabulary object detection

Jiaming Li, Jiacheng Zhang, Jichang Li, Ge Li, Si Liu, Liang Lin, Guanbin Li

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition

Project

Alignsam: Aligning segment anything model to open context via reinforcement learning

Duojun Huang, Xinyu Xiong, Jie Ma, Jichang Li, Zequn Jie, Lin Ma, Guanbin Li

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition

Inter-domain mixup for semi-supervised domain adaptation

Jichang Li, Guanbin Li, Yizhou Yu

Pattern Recognition

FedDiv: Collaborative Noise Filtering for Federated Learning with Noisy Labels

Jichang Li, Guanbin Li, Hui Cheng, Zicheng Liao, Yizhou Yu

Proceedings of the AAAI Conference on Artificial Intelligence

Removing Interference and Recovering Content Imaginatively for Visible Watermark Removal

Yicheng Leng, Chaowei Fang, Gen Li, Yixiang Fang, Guanbin Li

Proceedings of the AAAI Conference on Artificial Intelligence

Variance-Insensitive and Target-Preserving Mask Refinement for Interactive Image Segmentation

Chaowei Fang, Ziyin Zhou, Junye Chen, Hanjing Su, Qingyao Wu, Guanbin Li

Proceedings of the AAAI Conference on Artificial Intelligence

Structure embedded nucleus classification for histopathology images

Wei Lou, Xiang Wan, Guanbin Li, Xiaoying Lou, Chenghang Li, Feng Gao, Haofeng Li

IEEE Transactions on Medical Imaging

3D Visibility-aware Generalizable Neural Radiance Fields for Interacting Hands

Xuan Huang, Hanhui Li, Zejun Yang, Zhisheng Wang, Xiaodan Liang

AAAI 2024

Project

Correctable Landmark Discovery via Large Models for Vision-Language Navigation

Bingqian Lin∗ , Yunshuang Nie∗ , Ziming Wei, Yi Zhu, Hang Xu, Shikui Ma, Jianzhuang Liu, Xiaodan Liang†

TPAMI 2024

Project

2023

Attractive deep morphology-aware active contour network for vertebral body contour extraction with extensions to heterogeneous and semi-supervised scenarios

Shen Zhao, Jinhong Wang, Xinxin Wang, Yikang Wang, Hanying Zheng, Bin Chen, An Zeng, Fuxin Wei, Sadeer Al-Kindi, Shuo Li

Medical image analysis

Project

No More Sibling Rivalry: Debiasing Human-Object Interaction Detection

Bin Yang, Yulin Zhang, Hong-Yu Zhou, Sibei Yang

ICCV 2025

Project

Language-Aware Spatial-Temporal Collaboration for Referring Video Segmentation

Tianrui Hui, Si Liu, Zihan Ding, Shaofei Huang, Guanbin Li, Wenguan Wang, Luoqi Liu, Jizhong Han

IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI), 2023

Unpaired Image-to-Image Translation based Domain Adaptation for Polyp Segmentation

Xinyu Xiong, Siying Li, Guanbin Li

International Symposium on Biomedical Imaging (ISBI), 2023

Adapting Object Size Variance and Class Imbalance for Semi-Supervised Object Detection

Yuxiang Nie, Chaowei Fang, Lechao Cheng, Liang Lin, Guanbin Li*

Thirty-Seventh AAAI Conference on Artificial Intelligenc (AAAI), 2023

De-biased Teacher: Rethinking IoU Matching for Semi-Supervised Object Detection

Kuo Wang, Jingyu Zhuang, Guanbin Li*, Chaowei Fang, Lechao Cheng, Liang Lin, Fan Zhou

Thirty-Seventh AAAI Conference on Artificial Intelligenc (AAAI), 2023

Being Comes from Not-being: Open-vocabulary Text-to-Motion Generation with Wordless Training

Junfan Lin，Jianlong Chang，Lingbo Liu，Guanbin Li， Liang Lin，Qi Tian，Chang-wen Chen