首页 > 新车图片 > 新车图片 > AI首次实时生成视频!尤洋团队新作,网友:这是新纪元

AI首次实时生成视频!尤洋团队新作,网友:这是新纪元

发布时间:2024-06-29 16:41:19

这是团队在Open-Sora上,使用5个4s(192帧)480p分辨率视频进行的测试。

新方法名为Pyramid Attention Broadcast(PAB),由新加坡国立大学尤洋以及3位学生推出。

 

具体来说,PAB通过减少冗余注意力计算,可实现高达21.6FPS10.6倍加速,并且不会牺牲基于DiT的流行视频生成模型(包括Open-Sora、Open-Sora-Plan和Latte)的质量。

作为一种免训练方法,PAB可为将来任何基于DiT的视频生成模型提供实时功能。

看完效果对比,网友们纷纷惊叹:

这将是新纪元。

 

也引来了众多专业人士的转发和点评,如MIT博士Yilun Du表示:

是一个展示了如何将视频生成加速到实时速度的酷炫工作!可能会为视频策略和模拟的现实世界用例开辟新的领域。

 

那么,新方法具体如何破解实时生成视频这个难题的呢?

减少冗余注意力计算

一开始,团队比较了当前扩散步骤与前一步骤的注意力输出差异

这些差异通过均方误差(MSE)进行量化,并对每个扩散步骤的所有层进行平均。

团队捕捉到两个关键信息

  • 随着时间推移,注意力差异遵循U形模式,中间70%差异较小
  • 注意力差异的排序为:空间>时间>交叉

 

具体而言,不同时间步骤的注意力差异呈现出U形模式,在第一步和最后一步的15%步骤中发生显著变化,而中间70%的步骤非常稳定,差异很小。

其次,在稳定的中间部分,不同类型的注意力表现出差异:空间注意力变化最大,涉及高频元素,如边缘和纹理;时间注意力显示出与视频中的运动和动态相关的中频变化;跨模态注意力最为稳定,它将文本与视频内容联系起来,类似于反映文本语义的低频信号。

对此,团队正式提出用PAB来减少不必要的注意力计算

 

PAB通过根据每种注意力的差异将注意力输出到不同的后续步骤,从而节省计算量。

举个例子,就像广播电台把一个信号发送给多个听众一样,如果某个步骤的注意力结果在接下来的几个步骤中仍然适用,就不需要重新计算,而是直接使用之前的结果。

团队发现,即使没有后期训练,这种简单策略也能实现高达35%的加速,并且质量损失可以忽略不计。

为了进一步增强PAB,团队基于动态序列并行(DSP)改进了序列并行。

 

序列并行通过在多个GPU上分割视频以降低延迟,但DSP带来的时间注意力需两次全对全通信,导致高通信开销。

而PAB由于时间注意力不再需要被计算,使这些通信开销减少了50%以上,从而优化了实时视频生成的分布式推理效率。

借助并行功能,PAB可实现高达21.6FPS10.6倍加速,并且不会牺牲基于DiT的流行视频生成模型(包括Open-Sora、Open-Sora-Plan和Latte)的质量。

新车图片更多>>

内存之后闪存也大涨,三星电子一季度NAND价格上调100% 雷军:新一代小米SU7争取春节前部分样车进店 realme为什么没能成为第二个红米? 特斯拉人形机器人要去工厂上班了 奥特曼被吓坏!Codex全家桶上线倒计时,恐将撕开全网漏洞 代码死了,死在Cursor生成3000000行浏览器的那个晚上 沃尔沃EX60电子门把手:能手动打开、有两套冗余,够安全 腾讯QQ Windows 9.9.26版本发布:聊天记录管理支持设置漫游,新增支持表情与链接筛选 宝马集团2025年全球销量达246.37万辆 同比微增0.5% 淘宝闪购:坚决维护行业公平有序竞争,积极配合此次调查评估工作 日经:比亚迪2025年电动车销量将首超特斯拉 成全球第一 为何2026年是OpenAI的“生死之年”? 史上最先进的制程!台积电1.4nm明年试产:1nm时代快来了 壁仞科技今日上市,每股定价19.60港元 苹果手机将对延续十余年的iPhone年度发布周期进行重大调整 已获批准!文远知行联合Grab启动新加坡自动驾驶首测 采用对开门设计 捷尼赛思GV90谍照曝光 思瑞浦TPT1043AQ:以高适配、强抗扰与全国产化,打造车载CAN收发器标杆产品 一汽奥迪用 “油电双强” 勾勒出新图景 享界双旗舰:豪华车市场的新可能 2025广州车展丨长安启源Q05,激光雷达杀入10万级! 北京现代的战略与野心,未来五年,我们将上新20款新能源产品,实现全面领先 固态电池是今年新能源领域最火热的细分赛道 在新能源汽车渗透率逼近50%门槛之际,多项关乎其未来发展速度的关键政策落地 华研慧声荣获2025“金辑奖”最佳技术实践应用奖,持续赋能汽车座舱声学升级 鞍钢长春钢加:一体车身拼焊技术破解行业痛点,以量产实力领跑车身轻量化 重大发现:全球80%海域发现“吃塑料”细菌,已进化出降解能力 软银与OpenAI宣布成立合资公司,明年推出企业级AI解决方案 小鹏新一代人形机器人IRON亮相:首推女性形态,目标2026年规模量产 中国科学家破解140年难题:动辄百万起抗癌药成本有望断崖下降!