词
历Hugging Face
AI 模型与数据集开源社区平台
- 专业化胜过规模化:多数AI采购决策忽视的战略变量
- 推出 Ettin Reranker 系列
- 使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频
- PaddleOCR 3.5:使用 Transformers 后端运行 OCR 与文档解析任务
- LLM架构最新进展:KV共享、mHC与压缩注意力
- Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量
- GridSFM:一种新型小型电网基础模型
- AIMIP 发布:AI 天气与气候模型比对项目 | Ai2
- OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct
- AWS 上基础模型训练与推理的构建模块
- MiniCPM-V-4.6-gguf
- MiniCPM-V-4.6-Thinking-gguf
- MiniCPM-V-4.6-Thinking
- MiniCPM-V-4.6-AWQ
- MiniCPM-V-4.6-BNB
- MiniCPM-V-4.6-GPTQ
- MiniCPM-V-4.6-Thinking-AWQ
- MiniCPM-V-4.6-Thinking-GPTQ
- MiniCPM-V-4.6-Thinking-BNB
- MachinaCheck:基于 AMD MI300X 构建 Multi-Agent CNC 可制造性系统
- OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架
- 部署并推理 HuggingFace 上的任意模型
- 在 Modal 上构建 RL 定理证明工作流
- 大规模构建真实输电网数据集:基于开放数据集的流程
- CyberSecQwen-4B:为什么防御性网络安全需要小型、专用、可本地运行的模型
- Vibe 中的远程 agent,由 Mistral Medium 3.5 驱动
- Qwen3.6-27B-FP8
- Together AI 与 Adaption 建立合作伙伴关系
- Qwen3.6-27B
- moonshotai/Kimi-K2.6
- NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能
- DeepInfra 登陆 Hugging Face 推理服务提供商 🔥
- deepseek-ai/DeepSeek-V4-Pro
- deepseek-ai/DeepSeek-V4-Flash
- 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI
- NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用
- 我理解 LLM 架构的工作流
- 如何使用 OpenAI 的 Privacy Filter 构建可扩展 Web 应用