实録译稿 社区 24h

术语频次

封存归档

fine-tuning

▅▄▅█ · 312 次 · 收录于 73 篇

微调 · 在已有模型上做特定任务训练

  1. BitCPM-CANN-0.5B-unquantized 工程 · OpenBMB · 05-24
  2. BitCPM-CANN-1B-未量化 工程 · OpenBMB · 05-24
  3. BitCPM-CANN-3B-unquantized 工程 · OpenBMB · 05-24
  4. BitCPM-CANN-8B-未量化 工程 · OpenBMB · 05-24
  5. 专业化胜过规模化:多数AI采购决策忽视的战略变量 研究 · HF Blog · 05-22
  6. Modal C轮融资:以46.5亿美元估值募资3.55亿美元 产品 · Modal · 05-22
  7. 在应用计算中扩展强化学习 工程 · Modal · 05-21
  8. OlmoEarth v1.1:更高效的模型系列 产品 · HF Blog · 05-20
  9. OlmoEarth v1.1:更高效的模型系列 | Ai2 产品 · Allen AI · 05-20
  10. 推出 Ettin Reranker 系列 产品 · HF Blog · 05-19
  11. 用 Amazon Nova 2 提示词做内容审核 工程 · AWS ML · 05-19
  12. 使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频 工程 · HF Blog · 05-19
  13. VeRL-Omni 发布:扩散与全模态模型的简易、快速、稳定 RL 训练 工程 · vLLM · 05-18
  14. BitCPM4-CANN-0.5B-未量化 产品 · OpenBMB · 05-18
  15. BitCPM4-CANN-1B-未量化 产品 · OpenBMB · 05-18
  16. BitCPM4-CANN-3B-未量化 工程 · OpenBMB · 05-18
  17. BitCPM4-CANN-8B-未量化 工程 · OpenBMB · 05-18
  18. 前沿AI问答评估开发早期洞察 研究 · UK AISI · 05-17
  19. 评估前沿AI系统的早期经验 评测 · UK AISI · 05-16
  20. 我们如何弥合AI能力与防护之间的差距 研究 · UK AISI · 05-16
  21. 管理日益强大的开放权重AI系统的风险 研究 · UK AISI · 05-15
  22. Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量 产品 · HF Blog · 05-15
  23. 审计游戏以检测沙袋行为 研究 · UK AISI · 05-15
  24. UKAISI 亮相 NeurIPS 2025 研究 · UK AISI · 05-15
  25. Qwen3-TTS:低成本、高性能文本转语音 工程 · Baseten · 05-15
  26. GridSFM:一种新型小型电网基础模型 研究 · MS Research · 05-14
  27. δ-mem:大语言模型的高效在线记忆 研究 · HF Papers · 05-13
  28. 如何消除AI模型服务中的管道摩擦 工程 · NVIDIA Developer · 05-13
  29. sglang v0.5.11 工程 · GitHub Release · 05-12
  30. Import AI 455:AI系统即将开始自我构建 研究 · Import AI · 05-12
  31. Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4 研究 · Import AI · 05-12
  32. AWS 上基础模型训练与推理的构建模块 工程 · HF Blog · 05-12
  33. MiniCPM-V-4.6-gguf 工程 · OpenBMB · 05-12
  34. Flow-OPD:流匹配模型的在策略蒸馏 研究 · HF Papers · 05-12
  35. MiniCPM-V-4.6-Thinking-gguf 产品 · OpenBMB · 05-11
  36. MiniCPM-V-4.6-Thinking 产品 · OpenBMB · 05-11
  37. MiniCPM-V-4.6-AWQ 产品 · OpenBMB · 05-11
  38. MiniCPM-V-4.6-BNB 产品 · OpenBMB · 05-11
  39. MiniCPM-V-4.6-GPTQ 产品 · OpenBMB · 05-11
  40. MiniCPM-V-4.6-Thinking-AWQ 产品 · OpenBMB · 05-11
  41. MiniCPM-V-4.6-Thinking-GPTQ 产品 · OpenBMB · 05-11
  42. MiniCPM-V-4.6-Thinking-BNB 产品 · OpenBMB · 05-11
  43. MACE-Dance:用于音乐驱动舞蹈视频生成的运动-外观级联专家 研究 · HF Papers · 05-11
  44. OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架 研究 · HF Blog · 05-10
  45. 在 Modal 上构建 RL 定理证明工作流 工程 · Modal · 05-09
  46. 教 Claude 理解为什么 研究 · Anthropic Research · 05-09
  47. EMO:为涌现模块化预训练 Mixture of Experts | Ai2 研究 · Allen AI · 05-09
  48. EMO:为涌现模块化预训练混合专家 研究 · HF Blog · 05-09
  49. MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
  50. MedQA:在 AMD ROCm 上微调临床 AI,无需 CUDA 工程 · HF Blog · 05-08
  51. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  52. 克服奖励信号挑战:在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习 工程 · AWS ML · 05-08
  53. SciCore-Mol 研究 · OpenBMB · 05-07
  54. Tinker API 开启 Beta waitlist,面向 LoRA fine-tuning 产品 · X · 05-07
  55. 提出用 LLM 编译研究资料为 Obsidian 知识库 工程 · X · 05-07
  56. Farzapedia 展示基于本地文件的 AI 个性化方案 工程 · X · 05-07
  57. SONIC:42M Transformer实现人形机器人全身控制并开源 产品 · X · 05-07
  58. D-OPSD:用于持续调优步蒸馏扩散模型的 On-Policy 自蒸馏 研究 · HF Papers · 05-07
  59. 面向表格基础模型的先验对齐数据清洗 HF Papers · 05-06
  60. BlenderRAG:通过检索增强代码合成实现高保真 3D 对象生成 HF Papers · 05-06
  61. MolmoAct 2:面向现实世界机器人工作的开放基础 | Ai2 Allen AI · 05-06
  62. Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
  63. 用分布感知 speculative decoding 将 RL rollouts 加速最高 50% Together AI · 05-03
  64. Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni 产品 · Together AI · 05-03
  65. 从 732 字节到无处可去:在生产环境中关闭 Copy Fail 工程 · Together AI · 05-03
  66. 无冲突的容量:面向 AI-native 团队的多租户 GPU 集群设计指南 Together AI · 05-03
  67. AutoAdapt:大语言模型的自动化领域适应 MS Research · 05-03
  68. 介绍 talkie:来自 1930 年的 13B 复古语言模型 Simon Willison · 05-03
  69. 微调后的安全漂移:来自高风险领域的证据 HF Papers · 05-02
  70. 阿拉伯语及其方言的指令引导诗歌生成 HF Papers · 05-02
  71. 使用 RoundPipe 在多个消费级 GPUs 上高效训练 HF Papers · 05-01
  72. 自动化对齐研究者:使用 LLM 扩展可扩展监督 Anthropic Research · 04-30
  73. 探究图像编辑模型的视觉规划 HF Papers · 04-30