实録译稿 社区 24h

术语频次

封存归档

diffusion

▄▇▂█ · 172 次 · 收录于 46 篇

扩散模型 · 文生图 / 视频主流架构

  1. Nemotron-Labs 扩散语言模型实现光速级文本生成 产品 · HF Blog · 05-23
  2. 增强无训练无限帧生成以实现一致长视频 研究 · HF Papers · 05-21
  3. Midjourney 创始人自曝因用TPU弃N卡导致产品迭代落后一年 工程 · X · 05-21
  4. 字节跳动发布开源全模态模型Lance,3B参数支持图文视频理解与生成 产品 · X · 05-20
  5. LongLive-2.0:面向长视频生成的NVFP4并行基础设施 研究 · HF Papers · 05-19
  6. 阿里千问发布Qwen3.7-Max-Preview,数学能力升至总榜第七 字节跳动开源3B全模态模型Lance,统一处理文本、图像与视频 评测 · X · 05-19
  7. 字节跳动开源3B全模态模型Lance,训练仅用128张A100显卡 评测 · X · 05-19
  8. 使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频 工程 · HF Blog · 05-19
  9. VeRL-Omni 发布:扩散与全模态模型的简易、快速、稳定 RL 训练 工程 · vLLM · 05-18
  10. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  11. Causal Forcing++:面向实时交互视频生成的可扩展少步自回归扩散蒸馏 研究 · HF Papers · 05-16
  12. AnyFlow: 基于同策略流图蒸馏的任意步视频扩散模型 研究 · HF Papers · 05-14
  13. 如何实现真正的无服务器GPU 工程 · Modal · 05-12
  14. Import AI 456:RSI与经济增长;AI监管的激进可选性;神经计算机 研究 · Import AI · 05-12
  15. 均值模式尖叫:面向千层扩散Transformer的均值-方差分裂残差 研究 · HF Papers · 05-12
  16. Flow-OPD:流匹配模型的在策略蒸馏 研究 · HF Papers · 05-12
  17. MACE-Dance:用于音乐驱动舞蹈视频生成的运动-外观级联专家 研究 · HF Papers · 05-11
  18. nidhinjs/prompt-master 工程 · GitHub · 05-08
  19. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  20. wanshuiyin/睡眠中自动 Claude Code 研究 工程 · GitHub · 05-08
  21. SciCore-Mol 研究 · OpenBMB · 05-07
  22. The Anthropic Institute 的重点领域 研究 · Anthropic Research · 05-07
  23. 唤醒统一多模态理解与生成中的空间智能 研究 · HF Papers · 05-07
  24. D-OPSD:用于持续调优步蒸馏扩散模型的 On-Policy 自蒸馏 研究 · HF Papers · 05-07
  25. Stream-R1:面向流式视频生成的可靠性-困惑度感知奖励蒸馏 研究 · HF Papers · 05-07
  26. Stream-T1:用于流式视频生成的 Test-Time Scaling 研究 · HF Papers · 05-07
  27. PhysForge:为交互式虚拟世界生成基于物理的 3D 资产 研究 · HF Papers · 05-07
  28. 使用迭代去噪的归一化流 研究 · Apple ML · 05-07
  29. ComboStoc:用于 Diffusion 生成模型的组合随机性 HF Papers · 05-05
  30. Diffusion Models 何时学会生成多个对象? HF Papers · 05-05
  31. Talker-T2AV:基于自回归扩散建模的联合说话音视频生成 HF Papers · 05-04
  32. 从树到流再回到树:统一 Decision Trees 与 Diffusion Models HF Papers · 05-04
  33. UniVidX:基于 Diffusion Priors 的通用视频生成统一多模态框架 HF Papers · 05-04
  34. World Models 中面向更长时域的基于梯度规划 BAIR · 05-03
  35. 基于视频先验与异步去噪的统一 4D 世界动作建模 HF Papers · 05-03
  36. LaDiR:Latent Diffusion 增强 LLMs 的文本推理能力 Apple ML · 05-03
  37. Conditional Diffusion 中组合泛化的局部机制 Apple ML · 05-03
  38. STARFlow-V:基于 Normalizing Flows 的端到端视频生成建模 Apple ML · 05-03
  39. 从噪声偏好中学习:一种面向 Direct Preference Optimization 的半监督学习方法 HF Papers · 05-02
  40. ViPO:大规模视觉偏好优化 HF Papers · 05-02
  41. PhyCo:学习用于生成式运动的可控物理先验 HF Papers · 05-01
  42. 81,000 人告诉我们的 AI 经济学 Anthropic Research · 04-30
  43. Anthropic Economic Index 调查公布 Anthropic Research · 04-30
  44. 探究图像编辑模型的视觉规划 HF Papers · 04-30
  45. Diffusion Templates:用于可控 Diffusion 的统一插件框架 HF Papers · 04-30
  46. 扭转 TIDE:Diffusion 大语言模型的跨架构蒸馏 HF Papers · 04-30