|
CSIG菁英青云论坛第30期时间:2023-08-30 主办单位:中国图象图形学学会、 CSIG女科技工作者委员会 承办单位:上海科技大学智能感知与人机协同教育部重点实验室 支持单位:CSDN中国开发者网络、蔻享学术、科创中国、科技工作者之家
导读: CSIG菁英青云论坛第30期将于2023年8月30日14:30-16:30线上举行。本期活动将由上海科技大学马月昕研究员主持,并邀请山东大学吕琳教授和上海科技大学杨思蓓研究员分享“面向增材制造的结构设计与过程优化”与“视觉语言多模态开放域识别、目标检测及视觉定位”两场主题报告,共有超过3000余人在线观看并参与探讨。 微信推文:https://mp.weixin.qq.com/s/OluFeo49N-moufulzbMrHQ 回放链接:https://live.csdn.net/v/324228
报告1:面向增材制造的结构设计与过程优化 报告摘要:增材制造技术的快速发展推动了复杂几何结构在航空航天、交通运输、辅助医疗等领域的广泛应用,同时也对制造的效果与效率不断提出更高的要求。报告将介绍近年来在微结构智能设计分析与制造过程优化的主要工作。 吕琳,山东大学计算机科学与技术学院教授,主要研究方向为计算机图形学、面向智能制造的几何计算。在ACM TOG、IEEE TVCG、CAD、AM等期刊发表论文六十余篇,出版专著一部,获授权国家发明专利40余项并已转化应用6项。获2017年度陆增镛CAD&CG高科技奖二等奖、国际实体与物理造型会议(SPM 2020)最佳论文一等奖、2020年度山东省自然科学一等奖、2021年度吴文俊人工智能自然科学奖二等奖、2022年山东省教学成果奖一等奖等。
报告2:视觉语言多模态开放域识别、目标检测及视觉定位 报告摘要:近期,视觉语言预训练模型如CLIP和多模态预训练基础大模型GPT4等在不同的视觉识别和视觉语言多模态任务下取得突破,但如何利用预训练模型实现细粒度的语义对齐和定位、如何提取基础模型的内在知识以提高下游任务,仍有待探索。本次报告介绍研究组近期发表在ICCV2023的4篇工作,利用预训练模型实现细粒度的语义对齐和定位以及知识提取。首先将介绍一种新的视觉提示,即将合成的文本图像设计为视觉提示,并通过提示学习适配CLIP在下游11个任务的base-to-novel generalization, few-shot classification, domain generalization设定下均取得当前最优的性能。其次介绍如何利用CLIP实现细粒度语义对齐来避免开放词汇目标检测对基础类的过拟合而无法识别新类的问题,显著增强开放词汇目标检测模型的性能,并支持zero-shot开放域泛化。随后,依托于开放词汇目标检测能力,设计了任务驱动的目标检测新框架,该框架通过思维链(CoT)提示从大规模语言模型如ChatGPT提取可供性知识,并以此为条件建立由类别驱动的目标检测到任务驱动的目标检测的桥梁,极大提高模型性能和泛化能力。最后,我们由开放词汇的目标检测过渡到语言驱动的视觉定位,并将其在时序维扩展。 杨思蓓博士现任上海科技大学信息科学与技术学院助理教授、研究员、博士生导师。杨思蓓博士的研究领域为计算机视觉、自然语言处理、机器学习及其交叉,侧重于多模态视觉语言理解、内容生成与编辑、基础大规模语言/视觉语言模型、具身智能等。她于2016年在浙江大学竺可桢学院获得学士学位,于2020年在香港大学获得博士学位,并于同年加入香港理工大学担任研究助理教授、博导。
主持人: 马月昕博士现任上海科技大学信息科学与技术学院任助理教授,成立4DV Lab。2019在香港大学计算机科学系获得博士学位,并于同年加入香港浸会大学担任研究助理教授。2016年访问法国国家信息与自动化研究所,2017年访问美国北卡罗来纳大学教堂山分校,2018年访问百度研究院机器人与自动驾驶实验室。研究领域包括计算机视觉、计算机图形学、人工智能、自动驾驶,现在的研究课题专注于三维大场景的理解、感知、重建、生成等。已在多个顶会和顶刊上发表几十篇文章,包括Science Robotics, TPAMI, CVPR, ECCV, IJCV, AAAI, IJCAI, SIGGRAPH等。目前承担国自然青年科学基金、上海市科委基金等多项基金课题。 |