报告时间:2025年1月7日下午16:00
报告地点:浙江大学紫金港校区蒙民伟楼527会议室
报告题目:前馈式3D生成
报告人:蔡剑飞 教授
主持人:章国锋 教授
报告摘要:近年来,3D视觉领域见证了以神经辐射场(NeRF)和3D高斯点云(3DGS)为主要研究重点的显著转变。这些创新从根本上改变了我们通过深度学习技术和二维图像监督表示和学习三维空间的方式。现有的NeRF和3DGS研究大致可以分为逐场景方法和可泛化方法。逐场景方法专注于利用大量多视图图像优化三维表示,而可泛化方法旨在从包含多样化场景的数据集中学习,使得模型能够在无需重新训练的情况下,在稀疏视图条件下泛化到新的场景。本次报告将介绍我们研究团队在可泛化三维视图合成方面的一系列进展,包括MatchNeRF、MVSplat和MVSplat360,这些技术在多样化场景中显著提升了泛化能力。
报告人简介:蔡剑飞教授是蒙纳士大学(Monash University)信息技术学院的老师,曾担任该学院数据科学与人工智能(Data Science & AI)系的首任系主任。在此之前,他是南洋理工大学(Nanyang Technological University, NTU)视觉与交互计算系以及计算机通信系的系主任。他的主要研究方向包括计算机视觉、深度学习和多媒体。
蔡教授已成功培养了40多名博士生,其中3人荣获NTU SCSE杰出博士论文奖,1人荣获Monash FIT研究生卓越奖。他的许多博士生加入了Meta、Apple、Amazon、Adobe和TikTok等顶尖科技公司,或成为知名大学的教职人员。他曾共同获得ACCV、ICCM、IEEE ICIP和MMSP的优秀论文奖,并荣获蒙纳士大学信息技术学院院长年度研究奖。他担任或曾担任TPAMI、IJCV、IEEE T-IP、T-MM和T-CSVT的副编辑,并在CVPR、ICCV、ECCV等顶级会议担任领域主席。他曾在2016-2018年期间担任IEEE CAS VSPC-TC的主席,并是IEEE ICME 2012的主TPC主席、IEEE T-MM 2020和2019最佳论文奖委员会主席及联席主席,以及ACM Multimedia 2024的首席大会主席。他是IEEE会士(Fellow)。