文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。 近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点 然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。 为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。 具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标: DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强 更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式
在落地窗前插了进去会得白血病吗相对于历史最高价格,近期金价已经有所回调,记者对几位在深圳水贝黄金珠宝市场经营黄金饰品生意的工作人员采访时发现,多位受访者均表示目前下游出货量未见显著增长,黄金价格还是处于高位,市场的新款产品也不多,从业者还是比较谨慎。重获自由的这7年多来,李金留在了元谋县老家打零工,在工地帮忙搬运彩钢瓦、切彩钢材料,工地包活的老板知道他的境遇后,对他不错,给他安排了吃住,有活的时候,每天给他一百多元的工钱,每当存够两三千块钱,李金就会请假坐车去昆明找律师。在落地窗前插了进去会得白血病吗女性私密紧致情趣玩具2019-2024 年间欧洲机器人装机复合年增长率达 3%。IFR 还宣布将于 2025 年 6 月 25 日在慕尼黑自动化技术博览会期间举行高管圆桌会议,届时将发布最新初步数据。对于开发者,谷歌还将发布 Gemini Robotics SDK,可用于轻松评估 Gemini Robotics On-Device 在其任务和环境中的表现。另外,开发者还可使用该 SDK 在 DeepMind 的 MuJoCo 物理模拟器中测试该模型,并快速将其适应到新领域 —— 只需 50 到 100 个演示即可。
20250812 🖤 在落地窗前插了进去会得白血病吗“在尤文我发生了变化。我有幸在这里见到了很多伟大的队长。在尤文,你肩负着不同的责任。我看着基耶利尼、博努奇和达尼洛是怎么做的,以前他们承担的那些责任,现在该我来担了。我知道自己每天都要以身作则。我要把从他们那里学到的东西传给年轻球员。”麻花星空天美mv免费观看电视剧原本她的顾客群体只有粉丝里喜欢棉花娃娃的那一部分人,Labubu走红后,有老顾客来问她能不能把某些款式做成适合Labubu玩偶的尺寸,她很快就意识到,这能把自己的业务范围大幅度扩张,于是立刻转向了这个新领域。
📸 张敏记者 王金合 摄
20250812 👄 在落地窗前插了进去会得白血病吗除智能驾驶外,小米YU7 在电子电器架构上也进行了核心升级。采用了「四合一域控制模块」,将辅助驾驶域控制器、座舱域控制器、整车域控制器、T-Box通讯模块集成在一起。架构上的优化,可以带来元器件数量减少、车内空间优化、整车优化、能耗优化等多方面的好处。十大免费网站推广入口国米前锋塔雷米目前滞留在伊朗国内,没有随队前往美国参加世俱杯。最新消息是塔雷米已经离开了德黑兰,他驱车近一千公里南下,前往位于波斯湾西南海岸的家乡布什尔,与已在那里的家人团聚。
📸 张三弓记者 徐天聪 摄
🔞 “边界刚性”强调四条硬线:时间、空间、金钱与身体——会谈只能在预先约定的时段与场所进行;收费结构需公开透明,不得私下借贷或收礼;更严禁任何暧昧或性接触。真人刺激战场40分钟电视剧视频