Talk预告 |瑞士洛桑联邦理工学院李舞阳:面向稳定世界模型 - 基于误差循环的无限长视频生成
发布时间:2026-04-01 09:29:45 浏览量:1
本期为
TechBeat人工智能社区
第
756
期
线上Talk。
北京时间4
月2
日
(周四) 20:00,
瑞士洛桑联邦理工学院研究科学家
李舞阳的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是:面向稳定世界模型 - 基于误差循环的无限长视频生成。介时他将聚焦于面向具身智能世界模型的超长视频生成问题,介绍 Stable Video Infinity 如何通过误差回收机制实现非循环、可控且长期一致的高质量视频生成。
Talk·信息
▼
主题:面向稳定世界模型 - 基于误差循环的无限长视频生成
嘉宾:瑞士洛桑联邦理工学院·研究科学家 - 李舞阳
时间:北京时间
4
月2日(周四) 20:00
地点:TechBeat人工智能社区
Talk·介绍
▼
世界模型是智能体内部的可演化环境表征,用于刻画状态随时间变化的规律,并在不确定性与控制条件下推演未来,是提升具身智能闭环控制能力的核心支撑。近年来,视频生成模型为构建此类世界模型提供了可行路径,但现有方法大多局限于数秒级短视频:一旦生成时长增加,误差会逐步累积并引发画面漂移、细节丢失与整体失真,难以维持长期的一致性、可控性与多样性。为此,我们提出 Stable Video Infinity(SVI),该模型能够生成非循环、超长时的高质量视频,并支持基于分段提示故事叙述与多模态信号(如音频、骨架、文本)的控制。
Talk大纲
1. 概述:世界模型的研究背景
1.1 世界模型的分类框架
1.2 主要挑战与研究难点
2. 相关工作:Stable Video Infinity
2.1 模型设计
2.2 性能评估
Talk·预习资料
▼
Stable Video Infinity: Infinite-Length Video Generation with Error Recycling
论文链接:https://arxiv.org/abs/2510.09212
项目主页:https://stable-video-infinity.github.io/homepage/
Talk·提问交流
▼
在Talk界面下的
【交流区】
参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
Talk·嘉宾介绍
▼
李舞阳
瑞士洛桑联邦理工学院·研究科学家
李舞阳现任瑞士洛桑联邦理工学院(EPFL)实验室研究科学家。他于香港城市大学获得电机工程博士学位,随后在香港中文大学从事博士后研究。其研究聚焦于构建稳定、通用且可扩展的智能系统,围绕“世界感知”与“世界生成”两条主线展开:在世界感知方面,研究开放词汇/开放集/跨域目标检测与 3D 占据预测等;在世界生成方面,探索长视频生成建模等方向。同时,他也将方法应用于医疗影像、纳米光学等交叉领域,以系统化提升模型在复杂开放环境中的鲁棒性、泛化能力与适应性。他以第一作者在 CVPR、ICCV、ECCV、NeurIPS、ICLR 等会议发表的文章中共有 7 篇入选 Oral 或 Spotlight,并曾入围 CVPR 2022 最佳论文奖决赛。
个人主页: https://www.techbeat.net/grzytrkj?id=37163
一键预约TALK!
-The End-
如果你也想成为讲者
▼
自荐 / 推荐
单人Talk | 团队专场 | 录播or直播 | 闭门交流
多种方式任你选择!
推荐讲者成功也有奖励哦~
关于TechBeat人工智能社区
▼
TechBeat
(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>
