专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
相关文章推荐
爱可可-爱生活  ·  【如何通过编写大约 400 行 Go ... ·  2 天前  
爱可可-爱生活  ·  【[27星]PERSONA-bench/PE ... ·  2 天前  
爱可可-爱生活  ·  【[31星]Chatterbox-TTS-S ... ·  2 天前  
51好读  ›  专栏  ›  机器之心

本周日不见不散!CVPR 2025北京论文分享会最后报名了

机器之心  · 公众号  · AI  · 2025-06-03 16:57

正文

请到「今天看啥」查看全文



分享人介绍: 高林,中国科学院计算技术研究所研究员、中国科学院大学岗位教授。研究方向为计算机图形学、三维计算机视觉。在 SIGGRAPH、TPAMI、TVCG 等期刊会议发表论文 100 余篇。现任或者曾任亚洲图形学学会秘书长,作为项目负责人承担国家重点研发计划、基金委优青等项目,曾获得亚洲图形学会青年学者奖等奖励。


分享摘要: 在本次报告中,我们将分析最近几何表征发展的特点,分析内在的规律,介绍几何表征的挑战和相关应用。介绍高斯泼溅的最新进展,包括如何对高斯泼溅进行大尺度变形、解耦和重光照,以及如何对基于高斯泼溅表征的数字人进行实时重光照。 同时,生成模型不仅在影响三维重建的方法,还给渲染带来了新的求解思路。其中,视频生成模型给生成式渲染带来了全新的思路。我们将介绍基于生成模型的视频编辑与合成方法,将介绍基于线稿交互的视频编辑方法,和基于点云几何先验的大视角视频编辑与合成方法。


【下午 Keynote】黄雷  从表征和学习视角议多模态大模型的统一之路



分享人介绍: 黄雷,北京航空航天大学人工智能学院副教授。本科和博士均毕业于北京航空航天大学,曾在美国密歇根大学访学和阿联酋 IIAI 工作。研究主要集中在深度神经网络架构、训练技术及理论分析,出版首部关于 DNNs 中 Normalization 技术的英文专著,主导训练发布 TinyLLaVA 系列模型及 TinyLLaVA Factory 开源项目,曾以一作兼通讯作者身份获 CVPR 2020 最佳论文提名奖。


分享摘要: 大语言模型以离散化词汇表示和上下文建模学习统一了各类自然语言理解和生成任务。过去几年,这类统一建模思想也蔓延至视觉、语音以及其它非结构化类数据,促进了「统一」的多模态大模型发展。本报告首先从表征和学习视角,以抽象的形式 探讨了条件概率模型在建模任意问题的可行性,然后以统一建模为指导思想,概述了近年来语言和多模态建模的主要发展路线,最后介绍了报告人课题组在针对该议题研究中一些基础问题的研究进展和相关展望。


圆桌讨论嘉宾

这场分享会中,我们特别设置了一场「迈向理解与生成统一的多模态大模型」主题圆桌,邀请了三位专家学者现场探讨。






请到「今天看啥」查看全文