教师简介
刘阳,中山大学计算机学院,副教授,硕士生导师。主要研究方向为具身智能、多模态空间感知、因果推理。已累计发表论文40余篇,包括TPAMI,TIP,TMECH,TKDE,CVPR,ICCV,ACM MM,IJCAI 等,3篇会议论文入选Oral/Highlight,2篇期刊论文入选ESI高被引和热点论文,2篇期刊论文进入期刊影响因子贡献度前十。出版专著《多模态大模型:新一代人工智能技术范式》,销量过万,入选中山大学本科教材系列,并获得2024电子工业出版社年度优秀作者。主持多模态因果推理开源框架CausalVLR和具身智能资源仓库。承担了国家自然科学基金重点、青年等省部级项目十余项,获得2023中国软件大会机器人大模型与具身智能挑战赛优胜奖以及2023广东省第三届计算机科学青年学术秀一等奖。
研究领域
具身智能:三维场景空间推理、视觉语言导航、具身交互、机器人操控
多模态推理:数学题推理、视觉问答、医学报告生成
因果推理:因果关系发现、因果模型学习、反事实推理
获奖及荣誉
广东省第三届计算机科学青年学术秀一等奖,2023
电子工业出版社年度优秀作者,2024
中国软件大会机器人大模型与具身智能挑战赛三等奖,2023
博士生国家奖学金,2018
全国英语竞赛三等奖,2013
全国数学建模竞赛二等奖,2012
教育背景
西安电子科技大学,通信与信息系统,博士,2019.6(推荐免试,硕博连读)
长安大学,通信工程,学士,2014.7
工作经历
副教授,中山大学,2024.10 -至今
副研究员,中山大学,2021.10-2024.10
博士后,中山大学,2019.8-2021.10
主要学术兼职
广东省图象图形学会视觉专委会 副秘书长
CCF YOCSEF 广州学术界委员
CSIG视觉大数据专委会委员
ACM广州分会执行委员会委员
主持科研项目
1. 国家自然科学基金重点项目,基于神经符号系统的数学推理研究,2025.01-2029.12,229万,单位负责人
2. 国家自然科学基金青年项目,基于多模态传感器知识迁移与融合的人体行为识别关键技术,2021.01-2023.12,24万,主持
3. 广东省自然科学基金面上项目, 因果关系驱动的可解释问答推理与定位,2025.01-2027.12,10万,主持
4. 广东省自然科学基金面上项目, 基于跨模态因果关系推理的事件级视觉问答,2023.01-2025.12,10万,主持
5. 广州市科技计划项目,基于时域对比图的自监督视频表征学习,2023.04-2025.04,5万,主持
6. 广东省自然科学基金面上项目,基于自适应知识蒸馏的多模态人体行为识别关键技术,2021.01-2023.12,10万,主持
7. 博士后自然科学基金面上项目,基于视觉和可穿戴传感器知识迁移与融合的多模态人体行为识别,2020.08-2022.08,8万,主持
8. 中央高校基本科研业务费-青年教师培育项目, 2020-2022,12万,主持
9. 企业横向项目,基于多模态智能问答的智慧教育系统,2020-2021,10万,主持
10. 国家人工智能重大项目,因果推理与决策理论模型研究,2021-2025,500万,课题骨干
代表性论著
近五年部分代表性论著(#表示共同一作,✉表示通讯作者)
[CVPR-25] Xinshuai Song*, Weixing Chen*, Yang Liu✉, Weikai Chen, Guanbin Li, Liang Lin; Towards Long-Horizon Vision-Language Navigation: Platform, Benchmark and Method, IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025. [CCF A]
[CVPR-25] Jingzhou Luo, Yang Liu✉, Weixing Chen, Zhen Li, Yaowei Wang, Guanbin Li, Liang Lin; DSPNet: Dual-vision Scene Perception for Robust 3D Question Answering, IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025. [CCF A]
[CVPR-25] Weixing Chen, Yang Liu✉, Binglin Chen, Jiandong Su, Yongsen Zheng, Liang Lin; Cross-modal Causal Relation Alignment for Video Question Grounding, IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025. [CCF A][Highlight]
[TMECH-25] Yang Liu, Weixing Chen, Yongjie Bai, Xiaodan Liang, Guanbin Li, Wen Gao, Liang Lin; Aligning cyber space with physical world: A comprehensive survey on embodied ai, IEEE/ASME Transactions on Mechatronics (T-MECH), 2025. [中科院一区][机器人控制领域顶刊]
[TKDE-25] Yang Liu, Binglin Chen, Yongsen Zheng, Lechao Cheng, Guanbin Li, Liang Lin, ODMixer: Fine-grained Spatial-temporal MLP for Metro Origin-Destination Prediction, IEEE Transactions on Knowledge and Data Engineering (T-KDE), 2025. [CCF A]
[TIP-25] Weixing Chen, Yang Liu✉, Ce Wang, Jiarui Zhu, Guanbin Li, Cheng-Lin Liu, Liang Lin, Cross-Modal Causal Intervention for Radiology Report Generation, IEEE Transactions on Image Processing (T-IP), 2025. [CCF A]
[教材-24] 刘阳, 林倞;《多模态大模型:新一代人工智能技术范式》,电子工业出版社,2024.
[TPAMI-23] Yang Liu, Guanbin Li, Liang Lin; Cross-Modal Causal Relational Reasoning for Event-Level Visual Question Answering, IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI), 2023. [CCF A][ESI高被引&热点]
[ICCV-23] Hong Yan, Yang Liu✉, Yushen Wei, Zhen Li, Guanbin Li, Liang Lin; SkeletonMAE: Graph-based Masked Autoencoder for Skeleton Sequence Pre-training, IEEE/CVF International Conference on Computer Vision (ICCV), 2023. [CCF A]
[ACM MM-23] Yushen Wei#, Yang Liu#, Hong Yan, Guanbin Li, Liang Lin; Visual Causal Scene Refinement for Video Question Answering; ACM International Conference on Multimedia (ACM MM), 2023. [CCF A] [Oral]
[IJCAI-23] Junfan Lin, Yuying Zhu, Lingbo Liu, Yang Liu✉; Guanbin Li, Liang Lin; DenseLight: Efficient Control for Large-scale Traffic Signals with Dense Feedback, International Joint Conference on Artificial Intelligence (IJCAI), 2023. [CCF A]
[T-II-23] Yuying Zhu, Yang Zhang, Lingbo Liu, Yang Liu✉, Guanbin Li, Mingzhi Mao, Liang Lin; Hybrid-Order Representation Learning for Electricity Theft Detection, IEEE Transactions on Industrial Informatics (T-II), 2023. [中科院一区]
[INS-23] Kuo Wang, Lingbo Liu, Yang Liu✉, Guanbin Li, Liang Lin; Urban Regional Function Guided Traffic Flow Prediction, Information Sciences (INS), 2023. [中科院一区]
[MIR-22] Yang Liu, Yushen Wei, Hong Yan, Guanbin Li, Liang Lin; Causal Reasoning Meets Visual Representation Learning: A Prospective Study, Machine Intelligence Research (MIR), 2022. [JCR Q1]
[TIP-22] Yang Liu, Keze Wang, Lingbo Liu, Haoyuan Lan, Liang Lin; TCGL: Temporal Contrastive Graph for Self-supervised Video Representation Learning, IEEE Transactions on Image Processing (T-IP), 2022. [CCF A] [ESI高被引&热点]
[TIP-21] Yang Liu, Keze Wang, Guanbin Li, Liang Lin; Semantics-aware Adaptive Knowledge Distillation for Sensor-to-Vision Action Recognition, IEEE Transactions on Image Processing (T-IP), 2021. [CCF A]
[TIP-20] Yang Liu, Zhaoyang Lu, Jing Li, Tao Yang, Chao Yao, Deep Image-to-Video Adaptation and Fusion Networks for Action Recognition, IEEE Transactions on Image Processing (T-IP), 2020. [CCF A]
[TCSVT-19] Yang Liu, Zhaoyang Lu, Jing Li, Tao Yang; Hierarchically Learned View-Invariant Representations for Cross View Action Recognition, IEEE Transactions on Circuits and Systems for Video Technology (T-CSVT), 2019. [中科院一区]

教师简介
刘阳,中山大学计算机学院,副教授,硕士生导师。主要研究方向为具身智能、多模态空间感知、因果推理。已累计发表论文40余篇,包括TPAMI,TIP,TMECH,TKDE,CVPR,ICCV,ACM MM,IJCAI 等,3篇会议论文入选Oral/Highlight,2篇期刊论文入选ESI高被引和热点论文,2篇期刊论文进入期刊影响因子贡献度前十。出版专著《多模态大模型:新一代人工智能技术范式》,销量过万,入选中山大学本科教材系列,并获得2024电子工业出版社年度优秀作者。主持多模态因果推理开源框架CausalVLR和具身智能资源仓库。承担了国家自然科学基金重点、青年等省部级项目十余项,获得2023中国软件大会机器人大模型与具身智能挑战赛优胜奖以及2023广东省第三届计算机科学青年学术秀一等奖。
研究领域
具身智能:三维场景空间推理、视觉语言导航、具身交互、机器人操控
多模态推理:数学题推理、视觉问答、医学报告生成
因果推理:因果关系发现、因果模型学习、反事实推理
获奖及荣誉
广东省第三届计算机科学青年学术秀一等奖,2023
电子工业出版社年度优秀作者,2024
中国软件大会机器人大模型与具身智能挑战赛三等奖,2023
博士生国家奖学金,2018
全国英语竞赛三等奖,2013
全国数学建模竞赛二等奖,2012
教育背景
西安电子科技大学,通信与信息系统,博士,2019.6(推荐免试,硕博连读)
长安大学,通信工程,学士,2014.7
工作经历
副教授,中山大学,2024.10 -至今
副研究员,中山大学,2021.10-2024.10
博士后,中山大学,2019.8-2021.10
主要学术兼职
广东省图象图形学会视觉专委会 副秘书长
CCF YOCSEF 广州学术界委员
CSIG视觉大数据专委会委员
ACM广州分会执行委员会委员
主持科研项目
1. 国家自然科学基金重点项目,基于神经符号系统的数学推理研究,2025.01-2029.12,229万,单位负责人
2. 国家自然科学基金青年项目,基于多模态传感器知识迁移与融合的人体行为识别关键技术,2021.01-2023.12,24万,主持
3. 广东省自然科学基金面上项目, 因果关系驱动的可解释问答推理与定位,2025.01-2027.12,10万,主持
4. 广东省自然科学基金面上项目, 基于跨模态因果关系推理的事件级视觉问答,2023.01-2025.12,10万,主持
5. 广州市科技计划项目,基于时域对比图的自监督视频表征学习,2023.04-2025.04,5万,主持
6. 广东省自然科学基金面上项目,基于自适应知识蒸馏的多模态人体行为识别关键技术,2021.01-2023.12,10万,主持
7. 博士后自然科学基金面上项目,基于视觉和可穿戴传感器知识迁移与融合的多模态人体行为识别,2020.08-2022.08,8万,主持
8. 中央高校基本科研业务费-青年教师培育项目, 2020-2022,12万,主持
9. 企业横向项目,基于多模态智能问答的智慧教育系统,2020-2021,10万,主持
10. 国家人工智能重大项目,因果推理与决策理论模型研究,2021-2025,500万,课题骨干
代表性论著
近五年部分代表性论著(#表示共同一作,✉表示通讯作者)
[CVPR-25] Xinshuai Song*, Weixing Chen*, Yang Liu✉, Weikai Chen, Guanbin Li, Liang Lin; Towards Long-Horizon Vision-Language Navigation: Platform, Benchmark and Method, IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025. [CCF A]
[CVPR-25] Jingzhou Luo, Yang Liu✉, Weixing Chen, Zhen Li, Yaowei Wang, Guanbin Li, Liang Lin; DSPNet: Dual-vision Scene Perception for Robust 3D Question Answering, IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025. [CCF A]
[CVPR-25] Weixing Chen, Yang Liu✉, Binglin Chen, Jiandong Su, Yongsen Zheng, Liang Lin; Cross-modal Causal Relation Alignment for Video Question Grounding, IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025. [CCF A][Highlight]
[TMECH-25] Yang Liu, Weixing Chen, Yongjie Bai, Xiaodan Liang, Guanbin Li, Wen Gao, Liang Lin; Aligning cyber space with physical world: A comprehensive survey on embodied ai, IEEE/ASME Transactions on Mechatronics (T-MECH), 2025. [中科院一区][机器人控制领域顶刊]
[TKDE-25] Yang Liu, Binglin Chen, Yongsen Zheng, Lechao Cheng, Guanbin Li, Liang Lin, ODMixer: Fine-grained Spatial-temporal MLP for Metro Origin-Destination Prediction, IEEE Transactions on Knowledge and Data Engineering (T-KDE), 2025. [CCF A]
[TIP-25] Weixing Chen, Yang Liu✉, Ce Wang, Jiarui Zhu, Guanbin Li, Cheng-Lin Liu, Liang Lin, Cross-Modal Causal Intervention for Radiology Report Generation, IEEE Transactions on Image Processing (T-IP), 2025. [CCF A]
[教材-24] 刘阳, 林倞;《多模态大模型:新一代人工智能技术范式》,电子工业出版社,2024.
[TPAMI-23] Yang Liu, Guanbin Li, Liang Lin; Cross-Modal Causal Relational Reasoning for Event-Level Visual Question Answering, IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI), 2023. [CCF A][ESI高被引&热点]
[ICCV-23] Hong Yan, Yang Liu✉, Yushen Wei, Zhen Li, Guanbin Li, Liang Lin; SkeletonMAE: Graph-based Masked Autoencoder for Skeleton Sequence Pre-training, IEEE/CVF International Conference on Computer Vision (ICCV), 2023. [CCF A]
[ACM MM-23] Yushen Wei#, Yang Liu#, Hong Yan, Guanbin Li, Liang Lin; Visual Causal Scene Refinement for Video Question Answering; ACM International Conference on Multimedia (ACM MM), 2023. [CCF A] [Oral]
[IJCAI-23] Junfan Lin, Yuying Zhu, Lingbo Liu, Yang Liu✉; Guanbin Li, Liang Lin; DenseLight: Efficient Control for Large-scale Traffic Signals with Dense Feedback, International Joint Conference on Artificial Intelligence (IJCAI), 2023. [CCF A]
[T-II-23] Yuying Zhu, Yang Zhang, Lingbo Liu, Yang Liu✉, Guanbin Li, Mingzhi Mao, Liang Lin; Hybrid-Order Representation Learning for Electricity Theft Detection, IEEE Transactions on Industrial Informatics (T-II), 2023. [中科院一区]
[INS-23] Kuo Wang, Lingbo Liu, Yang Liu✉, Guanbin Li, Liang Lin; Urban Regional Function Guided Traffic Flow Prediction, Information Sciences (INS), 2023. [中科院一区]
[MIR-22] Yang Liu, Yushen Wei, Hong Yan, Guanbin Li, Liang Lin; Causal Reasoning Meets Visual Representation Learning: A Prospective Study, Machine Intelligence Research (MIR), 2022. [JCR Q1]
[TIP-22] Yang Liu, Keze Wang, Lingbo Liu, Haoyuan Lan, Liang Lin; TCGL: Temporal Contrastive Graph for Self-supervised Video Representation Learning, IEEE Transactions on Image Processing (T-IP), 2022. [CCF A] [ESI高被引&热点]
[TIP-21] Yang Liu, Keze Wang, Guanbin Li, Liang Lin; Semantics-aware Adaptive Knowledge Distillation for Sensor-to-Vision Action Recognition, IEEE Transactions on Image Processing (T-IP), 2021. [CCF A]
[TIP-20] Yang Liu, Zhaoyang Lu, Jing Li, Tao Yang, Chao Yao, Deep Image-to-Video Adaptation and Fusion Networks for Action Recognition, IEEE Transactions on Image Processing (T-IP), 2020. [CCF A]
[TCSVT-19] Yang Liu, Zhaoyang Lu, Jing Li, Tao Yang; Hierarchically Learned View-Invariant Representations for Cross View Action Recognition, IEEE Transactions on Circuits and Systems for Video Technology (T-CSVT), 2019. [中科院一区]