马飞
  • 发布时间:2024-04-29
  • 作者:光明实验室
  • 浏览:11506次

马飞 研究员

媒体智能团队负责人


学习经历:

2017-2022 清华大学 信息与通信工程 博士

2013-2017 电子科技大学 通信工程 学士(专业排名:1/363


工作经历:

2024-     光明实验室研究员

2022-2024 华为高级工程师


研究领域:

聚焦以人为中心的多模态内容理解与生成研究,具体包括1)数字人、人与物及场景的交互生成、(2)多模态大模型,及与情感智能的结合等方向。


个人主页:

https://feima09.github.io/


代表性成果:

AIGC短剧《嫦娥奔月》, https://mp.weixin.qq.com/s/-MjvqUjeotfluCVocuqHqw


发表论文论著:

1.H. Xue, X. Luo, Z. Hu, X. Zhang, X. Xiang, Y. Dai, J. Liu, Z. Zhang, M. Li, J. Yang, F. Ma #, Z. Wu, C. Yang, Z. Dai, F. Yu. Human Motion Video Generation: A survey. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2025. (中科院一区TopCCF A,影响因子:18.6,通讯)

2.F. Ma #, Y. Xie, Y. Li, Y. He, Y. Zhang, H. Ren, Z. Liu, W. Yao, F. Ren, F. Yu, S. Ni. A review of human emotion synthesis based on generative technology. IEEE Transactions on Affective Computing , 2025. (中科院一区Top,影响因子:9.8,一作)

3.F. Ma #, Y. Yuan, Y. Xie, H. Ren, I. Liu, Y. He, F. Ren, F. Yu, S. Ni. Generative Technology for Human Emotion Recognition: A Scoping Review. Information Fusion, 2025. (中科院一区Top,影响因子:14.7,一作)

4.C Zhang, J Peng, Z Wang, Y Lai, H Sun, H Chang, F. Ma #, W Yu. VReST: Enhancing Reasoning in Large Vision-Language Models through Tree Search and Self-Reward Mechanism. ACL 2025. (CCF A

5.Y. Ji, Y. Liu, Y. Zhuo, W. Yu, F. Ma #, Z. Huang, F. Yu. OnlineHOI: Towards Online Human-Object Interaction Generation and Perception. ACM MM 2025. (CCF A,通讯)

6.H. Xue, Z. Zhang, M. Li, Z. Dai, F. Ma #, F. Yu, Z. Wu. VideoHumanMIB: Unlocking Appearance Decoupling for Video Human Motion In-betweening. IJCAI 2025. (CCF A,通讯)

7.Y. Xie, T. Feng, X. Zhang, X. Luo, Z. Guo, W. Yu, H. Chang, F. Ma #, F. Yu. PointTalk: Audio-Driven Dynamic Lip Point Cloud for 3D Gaussian-based Talking Head Synthesis. AAAI 2025. (CCF A,通讯)

8.X. Xiang, Z. Dai, H. Xue, D. Wang, M. Li, Y. Yue, F. Ma #, W. Yu, H. Chang, F. Yu. ReMask-Animate: Refined Character Image Animation Using Mask-Guided Adapters. AAAI 2025. (CCF A,通讯)

9.X. Luo, X. Zhang, Y. Xie, X. Tong, W. Yu, H. Chang, F. Ma #, F. Yu. CodeSwap: Symmetrically Face Swapping Based on Prior Codebook. ACM MM 2024. (CCF A,通讯)

10.C. Wang, H. Yu, X. Li, F. Ma #, X. Wang, T. Taleb, V. Leung. Dependency-Aware Microservice Deployment for Edge Computing: A Deep Reinforcement Learning Approach with Network Representation. IEEE Transactions on Mobile Computing, 2024. (中科院一区TopCCF A,影响因子:9.2)


申请专利:

受理或授权中国发明专利40余项,部分专利如下:

1.马飞,徐洪波,谢长岭,卓一瑶,罗奕明,李阳,纪奕泓。一种基于多模态大模型的跌倒检测方法、系统、终端及存储介质。202510512556.7

2.李国健,马飞,徐洪波,卓一瑶,谢长岭,朱海俊,赵豫鄂,胡赫。一种基于大模型的水利智慧语音交互方法、系统、终端及存储介质。202510512558.6

3.董君心,马飞,贺颖,董淳光,施斯,侯皓文。网络设备监控方法、装置、监控系统及程序产品。202510146796.X

4.马飞,徐洪波,卓一瑶,董淳光,施斯。一种基于多智能体的微短剧自动化生成方法、系统及终端。202411315872.7

5.马飞,卓一瑶,施斯,董淳光。一种个性化数字人预问诊平台。202411030663.8

6.马飞,卓一瑶,侯皓文,尹东富,李海鹏。一种智能陪护方法、智能陪护系统及计算机存储介质。202411159025.6

7.罗向阳,马飞,徐洪波,卓一瑶,刘洲,董君心。一种具有一致性故事插画生成的框架。202411242121.7

8.董君心,马飞,贺颖,董淳光,施斯,侯皓文。网站网页主题风格切换方法、装置、计算机设备及存储介质。202411989061.5

9.张鑫,马飞,卓一瑶,花霖。一种基于扩散模型生成语义掩码的多模态人脸编辑方法。202411056500.7

10.马飞,彭亮,李明磊,怀宝兴。数字人视频的生成方法、装置、设备及存储介质。202310429308.7


比赛获奖:

2024年第十三届中国创新创业大赛创新挑战赛(宁波)解决方案优胜奖(赛道第一名)

2024年全国昇腾AI原生创新算子挑战赛(S2赛季)优秀奖


社会兼职:

中国中⽂信息学会情感计算专委会委员

数字深圳联合创新中⼼专家委员会委员

深圳市光明社区科技委员