録实録译稿议社区 24h

词术语频次

历封存归档

LoRA

▂▇▄█ · 165 次 · 收录于 34 篇

Low-Rank Adaptation · 低秩适配 · 高效微调方法

专业化胜过规模化：多数AI采购决策忽视的战略变量研究 · HF Blog · 05-22
推出 Ettin Reranker 系列产品 · HF Blog · 05-19
LongLive-2.0：面向长视频生成的NVFP4并行基础设施研究 · HF Papers · 05-19
使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频工程 · HF Blog · 05-19
VeRL-Omni 发布：扩散与全模态模型的简易、快速、稳定 RL 训练工程 · vLLM · 05-18
MinT：训练与服务百万级LLM的托管基础设施研究 · HF Papers · 05-14
参数高尔夫教给我们的AI辅助研究经验产品 · OpenAI · 05-13
sglang v0.5.11 工程 · GitHub Release · 05-12
vllm v0.19.1 工程 · GitHub Release · 05-12
transformers v5.8.0 工程 · GitHub Release · 05-12
MiniCPM-V-4.6-gguf 工程 · OpenBMB · 05-12
MiniCPM-V-4.6-Thinking-gguf 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-BNB 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-BNB 产品 · OpenBMB · 05-11
OncoAgent：用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架研究 · HF Blog · 05-10
CyberSecQwen-4B：为什么防御性网络安全需要小型、专用、可本地运行的模型产品 · HF Blog · 05-09
MedQA：在 AMD ROCm 上微调临床 AI，无需 CUDA 工程 · HF Blog · 05-08
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
克服奖励信号挑战：在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习工程 · AWS ML · 05-08
Tinker API 开启 Beta waitlist，面向 LoRA fine-tuning 产品 · X · 05-07
重新思考推理密集型检索：评估并改进 Agentic 搜索系统中的检索器研究 · HF Papers · 05-07
TTS-STT 飞轮：实体密集型合成音频弥合商业和开源系统失效处的 Indic ASR 差距研究 · HF Papers · 05-06
UniVidX：基于 Diffusion Priors 的通用视频生成统一多模态框架 HF Papers · 05-04
Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
vLLM 中的 DeepSeek V4：高效长上下文 Attention vLLM · 05-03
AutoAdapt：大语言模型的自动化领域适应 MS Research · 05-03
使用 RoundPipe 在多个消费级 GPUs 上高效训练 HF Papers · 05-01
Praxy Voice：零商业训练数据成本下，从冻结的非 Indic 基础模型通过 Voice-Prompt Recovery + BUPS 实现商用级 Indic TTS HF Papers · 05-01
Diffusion Templates：用于可控 Diffusion 的统一插件框架 HF Papers · 04-30