録实録译稿议社区 24h

词术语频次

历封存归档

diffusion

▄▇▂█ · 172 次 · 收录于 46 篇

扩散模型 · 文生图 / 视频主流架构

Nemotron-Labs 扩散语言模型实现光速级文本生成产品 · HF Blog · 05-23
增强无训练无限帧生成以实现一致长视频研究 · HF Papers · 05-21
Midjourney 创始人自曝因用TPU弃N卡导致产品迭代落后一年工程 · X · 05-21
字节跳动发布开源全模态模型Lance，3B参数支持图文视频理解与生成产品 · X · 05-20
LongLive-2.0：面向长视频生成的NVFP4并行基础设施研究 · HF Papers · 05-19
阿里千问发布Qwen3.7-Max-Preview，数学能力升至总榜第七字节跳动开源3B全模态模型Lance，统一处理文本、图像与视频评测 · X · 05-19
字节跳动开源3B全模态模型Lance，训练仅用128张A100显卡评测 · X · 05-19
使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频工程 · HF Blog · 05-19
VeRL-Omni 发布：扩散与全模态模型的简易、快速、稳定 RL 训练工程 · vLLM · 05-18
LLM架构最新进展：KV共享、mHC与压缩注意力研究 · Sebastian Raschka · 05-17
Causal Forcing++：面向实时交互视频生成的可扩展少步自回归扩散蒸馏研究 · HF Papers · 05-16
AnyFlow: 基于同策略流图蒸馏的任意步视频扩散模型研究 · HF Papers · 05-14
如何实现真正的无服务器GPU 工程 · Modal · 05-12
Import AI 456：RSI与经济增长；AI监管的激进可选性；神经计算机研究 · Import AI · 05-12
均值模式尖叫：面向千层扩散Transformer的均值-方差分裂残差研究 · HF Papers · 05-12
Flow-OPD：流匹配模型的在策略蒸馏研究 · HF Papers · 05-12
MACE-Dance：用于音乐驱动舞蹈视频生成的运动-外观级联专家研究 · HF Papers · 05-11
nidhinjs/prompt-master 工程 · GitHub · 05-08
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
wanshuiyin/睡眠中自动 Claude Code 研究工程 · GitHub · 05-08
SciCore-Mol 研究 · OpenBMB · 05-07
The Anthropic Institute 的重点领域研究 · Anthropic Research · 05-07
唤醒统一多模态理解与生成中的空间智能研究 · HF Papers · 05-07
D-OPSD：用于持续调优步蒸馏扩散模型的 On-Policy 自蒸馏研究 · HF Papers · 05-07
Stream-R1：面向流式视频生成的可靠性-困惑度感知奖励蒸馏研究 · HF Papers · 05-07
Stream-T1：用于流式视频生成的 Test-Time Scaling 研究 · HF Papers · 05-07
PhysForge：为交互式虚拟世界生成基于物理的 3D 资产研究 · HF Papers · 05-07
使用迭代去噪的归一化流研究 · Apple ML · 05-07
ComboStoc：用于 Diffusion 生成模型的组合随机性 HF Papers · 05-05
Diffusion Models 何时学会生成多个对象？ HF Papers · 05-05
Talker-T2AV：基于自回归扩散建模的联合说话音视频生成 HF Papers · 05-04
从树到流再回到树：统一 Decision Trees 与 Diffusion Models HF Papers · 05-04
UniVidX：基于 Diffusion Priors 的通用视频生成统一多模态框架 HF Papers · 05-04
World Models 中面向更长时域的基于梯度规划 BAIR · 05-03
基于视频先验与异步去噪的统一 4D 世界动作建模 HF Papers · 05-03
LaDiR：Latent Diffusion 增强 LLMs 的文本推理能力 Apple ML · 05-03
Conditional Diffusion 中组合泛化的局部机制 Apple ML · 05-03
STARFlow-V：基于 Normalizing Flows 的端到端视频生成建模 Apple ML · 05-03
从噪声偏好中学习：一种面向 Direct Preference Optimization 的半监督学习方法 HF Papers · 05-02
ViPO：大规模视觉偏好优化 HF Papers · 05-02
PhyCo：学习用于生成式运动的可控物理先验 HF Papers · 05-01
81,000 人告诉我们的 AI 经济学 Anthropic Research · 04-30
Anthropic Economic Index 调查公布 Anthropic Research · 04-30
探究图像编辑模型的视觉规划 HF Papers · 04-30
Diffusion Templates：用于可控 Diffusion 的统一插件框架 HF Papers · 04-30
扭转 TIDE：Diffusion 大语言模型的跨架构蒸馏 HF Papers · 04-30