报告时间:2024年11月9日(星期六)8:00—17:00
报告地点:翡翠科教楼A座二楼报告厅
举办单位:计算机与信息学院(人工智能学院)
学术报告信息(一)
报告题目:自动驾驶大模型的具身实现
报告时间:2024年11月9日(星期六)08:40-09:10
报 告 人:高炳钊 教授
工作单位:同济大学
报告简介:
随着大语言模型(Large Language Model)智能涌现能力的产生,智能基础模型(Foundation Model)技术被认为有望解决汽车自动驾驶安全长尾问题。基础模型的海量数据预训练基于自监督学习,其泛化能力优于需要标注的监督学习。本报告将从自动驾驶面临的挑战出发,讲述自动驾驶算法开发的技术演进过程,总结自监督学习的最新进展,最后给出基于自监督学习的AI大模型垂直应用于自动驾驶场景可能的技术路线。
报告人简介:
高炳钊,同济大学长聘特聘教授,获控制理论与控制工程专业以及机械工程专业双博士学位。2015年度国家优青、入选2022年度国家重大人才工程,自动化学会车辆控制与智能化专业委员会秘书长、IFAC T.C. Automotive Control委员。
研究方向为汽车控制与智能化,发表IEEE汇刊、ASME汇刊、VSD等控制和车辆权威期刊论文60余篇,出版中英文专著2部,授权发明专利30余件,含美国发明专利2件。曾获自动化学会技术发明一等奖2项、吉林省优秀博士学位论文和多项学会优秀论文奖。
学术报告信息(二)
报告题目:端云协同的视觉定位与三维重建
报告时间:2024年11月9日(星期六)09:10-09:40
报 告 人:章国锋 教授、杰青
工作单位:浙江大学
报告简介:
基于视觉的跟踪定位和三维重建是计算机视觉领域的经典问题,在AR/VR、机器人、自动驾驶等领域有着广泛的应用前景。由于真实环境的复杂性,跟踪定位和三维重建技术在实际应用中往往会面临一些关键性的挑战。例如,如何让移动设备在大尺度复杂场景下做到实时稳定的跟踪注册和精准可靠的重定位?如何基于三维高斯表达实现大尺度场景的高精度重建与渲染?本次报告主要汇报我们课题组近几年为了解决这些关键问题所做的研究工作以及研制的基于端云协同的视觉定位与三维重建系统,并展示其相应的应用。
报告人简介:
章国锋,浙江大学教授,博导,国家杰出青年科学基金获得者。主要从事SLAM、三维视觉与增强现实方面的研究,取得了一系列重要成果,开源开放了一系列相关系统和算法的源代码以及数据集,是OpenXRLab扩展现实开源平台的主要发起人。
曾获2010年CCF优秀博士学位论文奖、2011年全国优秀博士学位论文奖、2021年浙江省自然科学奖一等奖(排名第2)以及国际顶级会议ISMAR 2020唯一最佳论文奖。担任国际顶级期刊IJCV编委,以及《Virtual Reality & Intelligent Hardware》、《计算机辅助设计与图形学学报》和《中国图象图形学报》等期刊编委。
学术报告信息(三)
报告题目:多模态感知交互在智能座舱中的应用现状及科大讯飞相关案例介绍
报告时间:2024年11月9日(星期六)09:40-10:10
报 告 人:林垠 资深专家
工作单位:科大讯飞
报告简介:
本次报告以多模态感知交互在智能座舱中的应用现状及科大讯飞相关案例介绍为主题,将围绕多模感知交互在智能座舱中的问题提出、发展历程、研究现状和趋势、应用前景等多个方面展开,报告还将详细介绍讯飞自主研发的多模态语音识别、手势视线交互和情感健康监测等算法,旨在通过分享和讨论激发创新思维,促进思想交流,共同学习进步。
报告人简介:
林垠,中国科学技术大学博士。科大讯飞AI研究院高级核心技术研究员,长期从事计算机视觉领域相关工作,研究方向涵盖图像理解、人脸识别、目标检测、语义分割、行为识别在内的视觉感知交互算法,同时参与到讯飞多模态大模型的算法研究,主导讯飞多模感知和交互等多项能力在智能座舱场景下交互落地应用。
学术报告信息(四)
报告题目:智能驾驶场景理解与重建
报告时间:2024年11月9日(星期六)14:00-14:30
报 告 人:马超 教授、优青
工作单位:上海交通大学
报告简介:
多模态场景理解与生成是自动驾驶感知任务的核心与热点问题,本报告主要介绍多模态感知与生成任务的最新进展,汇报如何利用生成模型提升视觉场景感知能力,以及如何利用预训练模型进一步提升场景感知能力。
报告人简介:
马超,上海交通大学人工智能研究院教授,博士生导师。国家优青、上海市浦江人才、中国图象图形学学会优博。上海交通大学与加州大学默塞德分校联合培养博士。澳大利亚机器人视觉研究中心(阿德莱德大学)博士后研究员。
主要研究计算机视觉问题。谷歌学术引用1万2千余次,连续入选爱思唯尔中国高被引学者(2020-2023)。任中国图象图形学学会优博俱乐部主席、青年工作委员会副秘书长。担任CVPR 2024/2025、ICLR 2025领域主席,IEEE Trans. on Multimedia (TMM)、Journal of Artificial Intelligence Research (JAIR)、Image and Vision Computing (IVC)副编辑。获中国图象图形学学会青年科学家奖、MMM 2024唯一最佳论文奖、华为技术合作领域2021年度优秀技术成果奖。
学术报告信息(五)
报告题目:基于生成式物理智能的自动驾驶闭环仿真系统研究
报告时间:2024年11月9日(星期六)14:30-15:00
报 告 人:张力 研究员
工作单位:复旦大学
报告简介:
尽管神经辐射场(NeRF)在三维重建中取得了显著进展,但在处理更广泛和复杂的动态场景时,NeRF仍然面临着高昂的计算成本和重建质量的挑战。这些局限性使得NeRF难以应对需要高精度和实时性的自动驾驶闭环仿真场景。为了解决这些问题,本报告提出了基于生成式物理AI的自动驾驶闭环仿真系统。首先,针对静态场景,四面体网格技术相比NeRF,不仅具有更快的收敛速度和更高的渲染效率,还能够生成更精准的表面细节;其次,针对动态场景,四维高斯表征能够统一建模时间和空间,显著提高了收敛速度和渲染效率,从而大幅提升实时仿真的效率和视觉质量。这些技术的结合在高精度三维重建和场景生成中发挥了重要作用,尤其是在自动驾驶领域,通过生成连续的时空场景数据,这些方法能够准确捕捉和模拟对象的运动和环境变化,有效应对数据多样性不足和复杂光照条件的挑战,最终提升自动驾驶系统在广泛和多样化场景下重建的效率和准确性。
报告人简介:
张力,复旦大学大数据学院研究员,博士毕业于伦敦玛丽女王大学电子工程与计算机科学系,曾任职于牛津大学工程科学系博士后,剑桥三星人工智能中心研究科学家。
获得国家级高层次青年人才计划、 上海海外高层次人才计划、上海科技青年 35 人引领计划(35U35)、世界人工智能大会青年优秀论文奖; 发表 IEEE TPAMI、IJCV、NeurIPS 等人工智能国际期刊与会议论文 70 余篇,论文总被引 18000 余次。 担任人工智能国际会议 NeurIPS 2023、NeurIPS 2024、CVPR 2023、CVPR 2024 与 CVPR 2025 领域主席,国际期刊 Pattern Recognition 副编辑。
学术报告信息(六)
报告题目:可信赖的自动驾驶感知与决策
报告时间:2024年11月9日(星期六)15:00-15:30
报 告 人:马月昕 研究员
工作单位:上海科技大学
报告简介:
鲁棒性和安全性是自动驾驶走向落地、走向民用的关键因素,然而现有的研究工作缺乏对可信赖智驾的思考和评估标准。在大模型引爆的通用人工智能时代,如何增强智驾的通用智能、解决新域的泛化性?如何让智驾模型拥有法律、法规的常识和优秀的驾驶技巧,进而保证驾驶行为安全高效?本报告将围绕这两个问题,探讨可信赖的自动驾驶感知与决策。
报告人简介:
马月昕,上海科技大学研究员、博导。博士毕业于香港大学,曾到法国国家信息与自动化研究所、美国北卡罗莱纳大学教堂山分校、百度研究院进行访问学习。
主要研究方向为三维视觉、具身智能,尤其是三维场景理解、多模态感知、自动驾驶等。共发表相关领域顶会或顶刊论文60余篇,其中一作与通讯论文30余篇,包括Science Robotics、TPAMI、CVPR、ICCV、SIGGRAPH等,谷歌学术引用3600余次。曾获上海市海外高层次人才、上海市优秀教学成果(高等教育类)一等奖、国家自然科学基金青年基金项目等。
学术报告信息(七)
报告题目:面向智能驾驶的三维场景理解
报告时间:2024年11月9日(星期六)15:50-16:20
报 告 人:郭裕兰 教授
工作单位:中山大学
报告简介:
激光雷达和双目相机等传感器为车辆和机器人等自主系统准确感知其周围环境提供了丰富的三维空间信息,是实现空间智能的重要手段。如何更高效、更准确地理解三维场景及其动态变化,是实现智能汽车与其周围环境安全准确可靠交互的基础。在本报告中,将重点汇报团队在面向大规模场景的三维点云高效语义解析及基于世界模型的四维时序预测等方面的主要进展。
报告人简介:
郭裕兰,中山大学电子与通信工程学院教授,博士生导师。主要研究领域为三维视觉,包括三维重建、点云理解及机器人系统。在IEEE TPAMI和CVPR等期刊和会议发表学术论文200余篇,谷歌学术总被引1.7万余次,连续四年入选Elsevier中国高被引学者,获中国计算机学会自然科学一等奖、吴文俊人工智能优秀青年奖等奖励。
担任中国图象图形学学会三维视觉专委会秘书长,IEEE Transactions on Image Processing高级领域编辑(SAE),CVPR 2025/2023/2021、ICCV 2021、ECCV 2024、NeurIPS 2024、ACM Multimedia 2021等国际会议领域主席。
学术报告信息(八)
报告题目:多模态智驾大模型助力自动驾驶落地
报告时间:2024年11月9日(星期六)16:20-16:50
报 告 人:袁胜 创始人、CTO
工作单位:中科智驰
报告简介:
本报告将介绍中科智驰公司及自动驾驶技术路线的发展历程,介绍多模态大模型模型架构,以及中科智驰在模型构建、云边端融合训练、模型压缩等关键技术领域的探索及研究。
报告人简介:
袁胜,中科智驰联合创始人、董事、CTO,中科合肥创新院智能网联汽车技术应用中心副主任,合肥工业大学兼职教师、安徽农业大学研究生实践导师。硕士毕业于中国科学技术大学控制工程专业,曾就职于中科院合肥物质科学研究院智能车辆技术研究中心,参与国家基金委、省部级、中科院科研项目十余项,在智能网联汽车领域获得二十余项知识产权授权。
曾主导首台合肥首台自动驾驶公交项目研发,参与军方举办的“跨越险阻无人系统挑战赛”获得全国第一名成绩。目前主要从事智能驾驶车辆环境感知方面的技术开发、BEV智驾大模型的开发研究工作。