録实録译稿议社区 24h

词术语频次

历封存归档

fine-tuning

▅▄▅█ · 312 次 · 收录于 73 篇

微调 · 在已有模型上做特定任务训练

BitCPM-CANN-0.5B-unquantized 工程 · OpenBMB · 05-24
BitCPM-CANN-1B-未量化工程 · OpenBMB · 05-24
BitCPM-CANN-3B-unquantized 工程 · OpenBMB · 05-24
BitCPM-CANN-8B-未量化工程 · OpenBMB · 05-24
专业化胜过规模化：多数AI采购决策忽视的战略变量研究 · HF Blog · 05-22
Modal C轮融资：以46.5亿美元估值募资3.55亿美元产品 · Modal · 05-22
在应用计算中扩展强化学习工程 · Modal · 05-21
OlmoEarth v1.1：更高效的模型系列产品 · HF Blog · 05-20
OlmoEarth v1.1：更高效的模型系列 | Ai2 产品 · Allen AI · 05-20
推出 Ettin Reranker 系列产品 · HF Blog · 05-19
用 Amazon Nova 2 提示词做内容审核工程 · AWS ML · 05-19
使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频工程 · HF Blog · 05-19
VeRL-Omni 发布：扩散与全模态模型的简易、快速、稳定 RL 训练工程 · vLLM · 05-18
BitCPM4-CANN-0.5B-未量化产品 · OpenBMB · 05-18
BitCPM4-CANN-1B-未量化产品 · OpenBMB · 05-18
BitCPM4-CANN-3B-未量化工程 · OpenBMB · 05-18
BitCPM4-CANN-8B-未量化工程 · OpenBMB · 05-18
前沿AI问答评估开发早期洞察研究 · UK AISI · 05-17
评估前沿AI系统的早期经验评测 · UK AISI · 05-16
我们如何弥合AI能力与防护之间的差距研究 · UK AISI · 05-16
管理日益强大的开放权重AI系统的风险研究 · UK AISI · 05-15
Granite Embedding Multilingual R2：Apache 2.0 开源多语言嵌入，32K 上下文 — 最佳 Sub-100M 检索质量产品 · HF Blog · 05-15
审计游戏以检测沙袋行为研究 · UK AISI · 05-15
UKAISI 亮相 NeurIPS 2025 研究 · UK AISI · 05-15
Qwen3-TTS：低成本、高性能文本转语音工程 · Baseten · 05-15
GridSFM：一种新型小型电网基础模型研究 · MS Research · 05-14
δ-mem：大语言模型的高效在线记忆研究 · HF Papers · 05-13
如何消除AI模型服务中的管道摩擦工程 · NVIDIA Developer · 05-13
sglang v0.5.11 工程 · GitHub Release · 05-12
Import AI 455：AI系统即将开始自我构建研究 · Import AI · 05-12
Import AI 454：自动化对齐研究；中国模型安全评估；HiFloat4 研究 · Import AI · 05-12
AWS 上基础模型训练与推理的构建模块工程 · HF Blog · 05-12
MiniCPM-V-4.6-gguf 工程 · OpenBMB · 05-12
Flow-OPD：流匹配模型的在策略蒸馏研究 · HF Papers · 05-12
MiniCPM-V-4.6-Thinking-gguf 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-BNB 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-BNB 产品 · OpenBMB · 05-11
MACE-Dance：用于音乐驱动舞蹈视频生成的运动-外观级联专家研究 · HF Papers · 05-11
OncoAgent：用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架研究 · HF Blog · 05-10
在 Modal 上构建 RL 定理证明工作流工程 · Modal · 05-09
教 Claude 理解为什么研究 · Anthropic Research · 05-09
EMO：为涌现模块化预训练 Mixture of Experts | Ai2 研究 · Allen AI · 05-09
EMO：为涌现模块化预训练混合专家研究 · HF Blog · 05-09
MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
MedQA：在 AMD ROCm 上微调临床 AI，无需 CUDA 工程 · HF Blog · 05-08
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
克服奖励信号挑战：在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习工程 · AWS ML · 05-08
SciCore-Mol 研究 · OpenBMB · 05-07
Tinker API 开启 Beta waitlist，面向 LoRA fine-tuning 产品 · X · 05-07
提出用 LLM 编译研究资料为 Obsidian 知识库工程 · X · 05-07
Farzapedia 展示基于本地文件的 AI 个性化方案工程 · X · 05-07
SONIC：42M Transformer实现人形机器人全身控制并开源产品 · X · 05-07
D-OPSD：用于持续调优步蒸馏扩散模型的 On-Policy 自蒸馏研究 · HF Papers · 05-07
面向表格基础模型的先验对齐数据清洗 HF Papers · 05-06
BlenderRAG：通过检索增强代码合成实现高保真 3D 对象生成 HF Papers · 05-06
MolmoAct 2：面向现实世界机器人工作的开放基础 | Ai2 Allen AI · 05-06
Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
用分布感知 speculative decoding 将 RL rollouts 加速最高 50% Together AI · 05-03
Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni 产品 · Together AI · 05-03
从 732 字节到无处可去：在生产环境中关闭 Copy Fail 工程 · Together AI · 05-03
无冲突的容量：面向 AI-native 团队的多租户 GPU 集群设计指南 Together AI · 05-03
AutoAdapt：大语言模型的自动化领域适应 MS Research · 05-03
介绍 talkie：来自 1930 年的 13B 复古语言模型 Simon Willison · 05-03
微调后的安全漂移：来自高风险领域的证据 HF Papers · 05-02
阿拉伯语及其方言的指令引导诗歌生成 HF Papers · 05-02
使用 RoundPipe 在多个消费级 GPUs 上高效训练 HF Papers · 05-01
自动化对齐研究者：使用 LLM 扩展可扩展监督 Anthropic Research · 04-30
探究图像编辑模型的视觉规划 HF Papers · 04-30