【新智元导读】何恺明团队又一力作!这次他们带来的是「生成模型界的降维打击」——MeanFlow:无需预训练、无需蒸馏、不搞课程学习,仅一步函数评估(1-NFE),就能碾压以往的扩散与流模型!
全新的生成模型MeanFlow,最大亮点在于它彻底跳脱了传统训练范式——无须预训练、蒸馏或课程学习,仅通过一次函数评估(1-NFE)即可完成生成。
在ImageNet 256×256数据集上,MeanFlow在一次函数评估(1-NFE)下达到了3.43的FID分数,性能相比此前同类最佳方法有50%到70%的相对提升(见图1左)。
其中iCT、Shortcut和MF都是一次函数评估(1-NFE),而IMM则使用了两次函数评估(2-NFE)的引导策略。
表2:ImageNet-256×256上的类别条件生成实验,不同模型的参数、FID得分等统计数据
值得一提的是,作者共有5位,其中4位是华人,均来自CMU和MIT两所顶校。
其中一作耿正阳,是CMU的博士生,在MIT访问时完成了这次研究的部分工作。
平均速度是指「位移/时间间隔」的比值,本质上是对瞬时速度在时间轴上的积分。
仅基于这一定义,研究者推导出了平均速度与瞬时速度之间清晰且内在的数学关系,这为神经网络训练提供了理论依据。
为此,研究者设计了新的损失函数,引导网络去满足平均速度与瞬时速度之间的内在关系,无需引入额外的启发式方法。
由于存在明确定义的目标速度场,理论上最优解与网络的具体结构无关,这种属性有助于训练过程更加稳健和稳定。
此外,新方法还能自然地将「无分类器引导」(Classifier-Free Guidance,CFG)融入目标速度场,在采样阶段使用引导时不会带来额外的计算开销。
在图1和表2(左侧)中,研究者将MeanFlow与现有的一步扩散/流模型进行了比较。
如果仅比较1-NFE(一次函数评估)的生成结果,MeanFlow相比此前的最优方法Shortcut(FID 10.60),相对提升接近70%。
这表明,MeanFlow在很大程度上缩小了一步与多步扩散/流模型之间的性能差距。
在2-NFE(两次函数评估)设定下,新方法取得了2.20的FID分数(见表2左下角)。
它们都采用了XL/2级别的骨干网络,且NFE达到250×2(见表2右侧)。
在CIFAR-10数据集(32×32)上,研究人员进行了无条件生成实验,结果列在表3中。
需要注意的是,其他所有对比方法均使用了EDM风格的预处理器(pre-conditioner),而新方法没有使用任何预处理器。
形式上,给定数据x∼pdata(x)和先验噪声ϵ∼pprior(ϵ),可以构造一条流动路径,
这个速度被称为条件速度(conditional velocity)。参见图2左侧部分。
Flow Matching本质上是在对所有可能情况的期望进行建模,这种平均后的速度称为边缘速度(marginal velocity)(见图2右侧):
图2:Flow Matching中的速度场示意图。左图:条件流(ConditionalFlows)。同一个z_t可能由不同的(x,ϵ)组合生成,因此会对应不同的条件速度v_t。右图:边缘流(Marginal Flows)。通过对所有可能的条件速度进行边缘化(求平均)得到边缘速度场。这个边缘速度场被作为训练神经网络时的「真实目标速度场」
图例说明:灰点表示从先验分布中采样得到的样本,红点表示来自真实数据分布的样本。
接着,学习由参数θ表示的神经网络v_θ,来拟合这个边缘速度场,其损失函数为:
但由于式(1)中的边缘化过程难以直接计算,因此Flow Matching提出使用条件Flow Matching损失来代替:
一旦得到了边缘速度场v(z_t,t),就可以通过求解下面的常微分方程(ODE)来生成样本:
值得注意的是,即便条件流被设计为「直线流动」(即所谓「校正流」),最终得到的边缘速度场(公式(1))往往仍会诱导出弯曲的轨迹(见图2的示意)。
这种轨迹的弯曲不仅仅是因为神经网络的近似误差,更是源于真实的边缘速度场本身。
当对这些弯曲轨迹使用粗粒度的时间离散化时,数值ODE解法往往会产生较大的误差,从而导致生成结果不准确。
平均流(Mean Flows)的核心思想是:引入一个表示平均速度的新场(velocity field),而传统Flow Matching所建模的是瞬时速度。
平均速度被定义为两个时间点t和r之间的位移(通过对瞬时速度积分获得),再除以时间间隔。
平均速度场u(z_t,r,t)同时依赖于起始时间r和终止时间t,如图3所示。
从概念上讲,就像在Flow Matching中,瞬时速度v是训练的「真实目标场」,在MeanFlow中,平均速度u则扮演着类似的角色,是学习所依据的「真实速度场」。
这样做的优势显著:一旦平均速度被准确建模,就可以仅通过一次前向计算来近似整个流动路径。
换句话说,这种方法非常适合一步或少步数的生成任务,因为它在推理阶段不需要显式计算时间积分——这是传统建模瞬时速度方法所必须的步骤。
不过,在实践中,直接使用公式(3)定义的平均速度作为训练网络的「真值」行不通,因为这要求在训练时就对瞬时速度执行积分,计算成本高且不可行。
研究人员的关键见解是:可以对平均速度的定义公式进行数学变形,从而构造一个更易于训练的优化目标,即使在只能访问瞬时速度的前提下依然可行。
接着,对这个等式的两边关于t求导(把r当作常数),然后运用函数积的求导法则和微积分基本定理,得到:
需要说明的是,公式(6)与之前的积分公式(4)是等价的(详见原文附录B.3)。
在MeanFlow恒等式中,公式右侧给出了可以作为训练目标的形式,可以利用它构建损失函数,来训练神经网络预测u(z_t,r,t)。
要计算公式(6)右侧第二项全导数(total derivative),它可以用偏导数展开如下:
到目前为止,上述公式还没有涉及任何网络参数。现在引入可学习的模型u_θ,并希望它满足MeanFlow恒等式(公式(6))。
训练信号来自于瞬时速度v,不需要积分操作,因此相比平均速度定义式(3)更容易实现。
虽然公式中出现了对u的偏导数,但实际训练中使用的是网络输出uθ的梯度(自动微分实现)。
使用了stop-gradient操作(记为sg):这是为了避免「二阶反向传播」,从而减小优化的计算负担。
需要说明的是,即使在优化中进行了这些近似,只要u_θ最终能够使损失为零,它就一定满足MeanFlow恒等式,从而也满足最初的平均速度定义。
在公式(10)中的v(z_t,t)是Flow Matching中的边缘速度(见图2右),但它难以直接计算。
因此,借鉴Flow Matching已有的做法,使用条件速度(见图2左)来替代:
使用MeanFlow模型进行采样非常简单:只需将时间积分项替换为平均速度即可,伪代码详见算法2。
与传统做法在采样阶段直接应用CFG不同,研究者将CFG视为底层「真实速度场」的一部分属性。
其中,类别条件速度(即对给定类别c条件下的边缘速度)、无条件边缘速度,定义如下:
我们再次强调,vcfg和ucfg都是理论上的真实速度场,与神经网络参数无关。
stop-gradient操作用于阻断目标对网络参数的反向传播,避免二阶梯度计算。
因此,在采样阶段,无需再进行线性组合计算,只需直接网络调用即可完成一步采样(见算法2)。
最终,新在保留CFG效果的同时,依然维持了理想的单步采样性能(1-NFE),兼顾了效率与质量。
他热衷于研究动态系统,致力于识别、理解并开发能够自组织形成复杂系统的动态机制。
05月15日,北京力争到2027年新型储能产业营收超千亿元,天博网址是多少,AG旗舰厅首页,必发88手机客户端,德州牛仔必输
05月15日,青海油田增产保供为中国西部三省(区)过冬添“底气”,打鱼现金平台,188体育足球版,纬来体育网址,欧洲足球平台
05月15日,(巴黎奥运)场地自行车女子团体争先赛决赛:中国队第六,体育综合平台官方下载,龙王捕鱼下载,UedBet赫塔菲官网,天博体育App2.2.6
05月15日车厘子价格“大跳水” 年节前夕成进口水果批发市场上“销冠”im电竞官网地址澳门手机网络威尼斯集团vip6661j9九游会国际站
05月15日科学“把脉”精准“诊疗” 沈阳全面铺开城市体检威尼斯人菠菜新濠天地娱乐平台官网华体会体育APP银河官方
05月15日足协公布首批完成债务清欠俱乐部名单 中超三队未上榜常德友阿国际广场真人版鬼屋爱游戏电竞平台官网九五至尊体育yabo在线开户……
05月15日,青海省供销合作社联合社原党组书记、理事会主任张晓军被查,万博官网下载地址,2019欧洲杯葡萄牙队队员名单,刀锋电竞官方,买球的APP哪个好
05月15日,(两会声音)代表委员话“一山一河生态事”,宝博游戏官网app,韦德体育快速开户,PNG电子占卜师,千亿网站登录
05月15日浙江义乌红糖生产忙 外国游客慕名前来购买千赢国际官方网站app18新利全新app安卓版开赢棋牌亚星网投平台
05月15日,时政微周刊丨总书记的一周(1月8日—1月14日),edf138备用网址,BBIN体育新闻下载,葡京真人娱乐,银河游戏厅app
05月15日,以科技创新塑造发展新优势 杭州怎么做?,贝博app体育网页版,酷游ku游最新网站,乐鱼手机官网入口,全民捕鱼大战下载
05月15日,“冰与火的回响”音乐会在京上演 北京国际友好城市交响乐团联盟再扩容,ag平台官方网站,365体育手机版app下载,M6网投平台,明發体育
05月15日跟着总书记探寻中华文明|汉风汉韵 源远流长英皇娱乐世界杯买球万博外围官网天赢棋牌官网永利会
05月15日拉萨车站“五一”假期发送旅客7.6万人次新东方在线网站澳门皇冠手机网址免费所有棋牌游戏官网云顶2322备用网址
05月15日泰国总理赛塔向中国游客发出热情邀请欧宝娱乐怎么了电竞押注平台哪个好18新利luck官网f66永乐国际勇往直前
孙颖莎回应王楚钦看自己脸色,男子砸漫展签名墙警方介入浙江杭州:托起残疾人的“共富梦”火博体育APP下载杏鑫平台登录天上人间国际真人博彩威尼斯人网站登入
少年白马醉春风,KPL梦之队沙特杯夺冠中国国家铁路集团有限公司总经理调整体育综合平台有哪些金六福论坛好友同玩斗牛国际真人人体摄影
愿来世为他人,中国女游客在泰国遭假摩的司机性侵云南镇雄山体滑坡:全力搜救失联人员雷速体育在线安装旺角菜报银河app网站lv官网中文版
一架缅军飞机坠落于印度机场,肖战藏海传扶人下马车路透我国国家公园建设取得积极成效 生物多样性稳定增加凯时网址是多少ayx爱游戏在线登录网址凯时ag旗舰厅官网新加坡金沙真人娱乐国际平台
《异形:夺命舰》内地票房破4亿,陆毅胡彦斌现场为全红婵陈芋汐加油让群众暖心安心有信心(现场评论)伟德体育app下载万博网址多少啊大富豪国际彩票bt游戏平台下载
良医 第七季,CK大庆市:全新政策打造东北振兴人才集聚回流先行地乐鱼登录入口下载博鱼竞彩官网黄冠现金网站港彩连连中
孙杨复出首秀,宋佳ELLE12月刊封面李强在河北调研时强调 坚持创新驱动发展 加快全面绿色转型 在推进京津冀协同发展中展现新作为18luck游戏完美体育365注册bbin体育测评欧宝电竞APP下载
主管QQ
站内信联系电子邮箱
站内信联系