词
历fine-tuning
微调 · 在已有模型上做特定任务训练
- BitCPM-CANN-0.5B-unquantized
- BitCPM-CANN-1B-未量化
- BitCPM-CANN-3B-unquantized
- BitCPM-CANN-8B-未量化
- 专业化胜过规模化:多数AI采购决策忽视的战略变量
- Modal C轮融资:以46.5亿美元估值募资3.55亿美元
- 在应用计算中扩展强化学习
- OlmoEarth v1.1:更高效的模型系列
- OlmoEarth v1.1:更高效的模型系列 | Ai2
- 推出 Ettin Reranker 系列
- 用 Amazon Nova 2 提示词做内容审核
- 使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频
- VeRL-Omni 发布:扩散与全模态模型的简易、快速、稳定 RL 训练
- BitCPM4-CANN-0.5B-未量化
- BitCPM4-CANN-1B-未量化
- BitCPM4-CANN-3B-未量化
- BitCPM4-CANN-8B-未量化
- 前沿AI问答评估开发早期洞察
- 评估前沿AI系统的早期经验
- 我们如何弥合AI能力与防护之间的差距
- 管理日益强大的开放权重AI系统的风险
- Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量
- 审计游戏以检测沙袋行为
- UKAISI 亮相 NeurIPS 2025
- Qwen3-TTS:低成本、高性能文本转语音
- GridSFM:一种新型小型电网基础模型
- δ-mem:大语言模型的高效在线记忆
- 如何消除AI模型服务中的管道摩擦
- sglang v0.5.11
- Import AI 455:AI系统即将开始自我构建
- Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4
- AWS 上基础模型训练与推理的构建模块
- MiniCPM-V-4.6-gguf
- Flow-OPD:流匹配模型的在策略蒸馏
- MiniCPM-V-4.6-Thinking-gguf
- MiniCPM-V-4.6-Thinking
- MiniCPM-V-4.6-AWQ
- MiniCPM-V-4.6-BNB
- MiniCPM-V-4.6-GPTQ
- MiniCPM-V-4.6-Thinking-AWQ
- MiniCPM-V-4.6-Thinking-GPTQ
- MiniCPM-V-4.6-Thinking-BNB
- MACE-Dance:用于音乐驱动舞蹈视频生成的运动-外观级联专家
- OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架
- 在 Modal 上构建 RL 定理证明工作流
- 教 Claude 理解为什么
- EMO:为涌现模块化预训练 Mixture of Experts | Ai2
- EMO:为涌现模块化预训练混合专家
- MiniCPM-V-4_5-GPTQ
- MedQA:在 AMD ROCm 上微调临床 AI,无需 CUDA
- rohitg00/从零开始的 AI 工程
- 克服奖励信号挑战:在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习
- SciCore-Mol
- Tinker API 开启 Beta waitlist,面向 LoRA fine-tuning
- 提出用 LLM 编译研究资料为 Obsidian 知识库
- Farzapedia 展示基于本地文件的 AI 个性化方案
- SONIC:42M Transformer实现人形机器人全身控制并开源
- D-OPSD:用于持续调优步蒸馏扩散模型的 On-Policy 自蒸馏
- 面向表格基础模型的先验对齐数据清洗
- BlenderRAG:通过检索增强代码合成实现高保真 3D 对象生成
- MolmoAct 2:面向现实世界机器人工作的开放基础 | Ai2
- Together AI 与 Adaption 建立合作伙伴关系
- 用分布感知 speculative decoding 将 RL rollouts 加速最高 50%
- Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni
- 从 732 字节到无处可去:在生产环境中关闭 Copy Fail
- 无冲突的容量:面向 AI-native 团队的多租户 GPU 集群设计指南
- AutoAdapt:大语言模型的自动化领域适应
- 介绍 talkie:来自 1930 年的 13B 复古语言模型
- 微调后的安全漂移:来自高风险领域的证据
- 阿拉伯语及其方言的指令引导诗歌生成
- 使用 RoundPipe 在多个消费级 GPUs 上高效训练
- 自动化对齐研究者:使用 LLM 扩展可扩展监督
- 探究图像编辑模型的视觉规划