鹭岛论坛
数据智能系列讲座第7期
「面向高泛化能力的 视觉感知系统空间建模与微调学习」
6月25日(周三) 20:00 精彩开播
期待与您云相聚,共襄学术盛宴!
报告题目
面向高泛化能力的视觉感知系统空间建模与微调学习
报告简介
构建高效、物理一致且具备良好泛化能力的视觉感知系统,是视觉智能、边缘计算与具身机器人中的关键挑战。为提升系统的泛化与适应能力,一类方法致力于构建物理一致的世界模型,增强空间建模能力;另一类则关注参数高效的迁移学习,提升任务适配效率。然而,传统方法多依赖隐式生成模型或全参数微调,存在三维一致性差、训练不稳定、部署开销大等问题。
本报告介绍两个最新进展:DSG-World 提出基于双状态观测的三维高斯建模方法,通过双视角感知与一致性约束,实现对遮挡物体的精确建模,提升三维重建与仿真的泛化性能;Swin-BAPAT 框架基于 Swin Transformer,引入高效并行适配机制,仅微调少量参数即可实现对行为识别任务的精确适配,兼顾精度与部署效率。
报告嘉宾
李 玺
IAPR/IET/AAIA Fellow
浙江大学求是特聘教授
王高昂
浙江大学国际联合学院研究员
博士生导师
俞鑫波
浙江大学国际联合学院研究员
博士生导师
特邀主持
黄礼泊
中国科学院计算技术研究所
特别研究助理
讲座时间
2025年6月25日(周三)20:00-21:15
讲座环节及流程
◈讲座环节:
① 5 分钟主持人进行主题与嘉宾介绍
② 55分钟报告嘉宾讲座环节
③ 15分钟互动问答环节
◈讲座流程:
① 19:45 开芯会视频号上线,欢迎观众朋友提前进入直播间候场
② 20:00 主持人开场
③ 20:05 主讲嘉宾依次开始讲座,持续55min
注:【在讲座过程中欢迎观众朋友通过各直播平台进行提问,工作人员将收集和整理问题 】
③ 21:00 主持人根据工作团队整理的问题与嘉宾进行问答互动,持续15min
讲座形式
视频号、B站、电子发烧友、
蔻享学术等
多平台同步直播
