词
历LoRA
Low-Rank Adaptation · 低秩适配 · 高效微调方法
- 专业化胜过规模化:多数AI采购决策忽视的战略变量
- 推出 Ettin Reranker 系列
- LongLive-2.0:面向长视频生成的NVFP4并行基础设施
- 使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频
- VeRL-Omni 发布:扩散与全模态模型的简易、快速、稳定 RL 训练
- MinT:训练与服务百万级LLM的托管基础设施
- 参数高尔夫教给我们的AI辅助研究经验
- sglang v0.5.11
- vllm v0.19.1
- transformers v5.8.0
- MiniCPM-V-4.6-gguf
- MiniCPM-V-4.6-Thinking-gguf
- MiniCPM-V-4.6-Thinking
- MiniCPM-V-4.6-AWQ
- MiniCPM-V-4.6-BNB
- MiniCPM-V-4.6-GPTQ
- MiniCPM-V-4.6-Thinking-AWQ
- MiniCPM-V-4.6-Thinking-GPTQ
- MiniCPM-V-4.6-Thinking-BNB
- OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架
- CyberSecQwen-4B:为什么防御性网络安全需要小型、专用、可本地运行的模型
- MedQA:在 AMD ROCm 上微调临床 AI,无需 CUDA
- rohitg00/从零开始的 AI 工程
- 克服奖励信号挑战:在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习
- Tinker API 开启 Beta waitlist,面向 LoRA fine-tuning
- 重新思考推理密集型检索:评估并改进 Agentic 搜索系统中的检索器
- TTS-STT 飞轮:实体密集型合成音频弥合商业和开源系统失效处的 Indic ASR 差距
- UniVidX:基于 Diffusion Priors 的通用视频生成统一多模态框架
- Together AI 与 Adaption 建立合作伙伴关系
- vLLM 中的 DeepSeek V4:高效长上下文 Attention
- AutoAdapt:大语言模型的自动化领域适应
- 使用 RoundPipe 在多个消费级 GPUs 上高效训练
- Praxy Voice:零商业训练数据成本下,从冻结的非 Indic 基础模型通过 Voice-Prompt Recovery + BUPS 实现商用级 Indic TTS
- Diffusion Templates:用于可控 Diffusion 的统一插件框架