architectures
█▃▇▄
·
85 次
·
收录于 46 篇
-
AI系统监管会变得更难吗?
研究 · UK AISI · 05-22
-
vLLM 中的弹性专家并行
工程 · vLLM · 05-20
-
OlmoEarth v1.1:更高效的模型系列
产品 · HF Blog · 05-20
-
OlmoEarth v1.1:更高效的模型系列 | Ai2
产品 · Allen AI · 05-20
-
推出 Ettin Reranker 系列
产品 · HF Blog · 05-19
-
LongLive-2.0:面向长视频生成的NVFP4并行基础设施
研究 · HF Papers · 05-19
-
使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频
工程 · HF Blog · 05-19
-
VeRL-Omni 发布:扩散与全模态模型的简易、快速、稳定 RL 训练
工程 · vLLM · 05-18
-
LLM架构最新进展:KV共享、mHC与压缩注意力
研究 · Sebastian Raschka · 05-17
-
新型评估与Agent脚手架赏金计划
研究 · UK AISI · 05-16
-
vllm v0.21.0
工程 · GitHub Release · 05-15
-
Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量
产品 · HF Blog · 05-15
-
Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理
工程 · AWS ML · 05-15
-
vLLM x Mooncake 规模化服务 Agent 工作负载
工程 · vLLM · 05-15
-
TurboQuant 首次全面研究:精度与性能
评测 · vLLM · 05-15
-
vLLM 登顶 Artificial Analysis 排行榜
工程 · vLLM · 05-15
-
AnyFlow: 基于同策略流图蒸馏的任意步视频扩散模型
研究 · HF Papers · 05-14
-
MinT:训练与服务百万级LLM的托管基础设施
研究 · HF Papers · 05-14
-
MulTaBench:基于文本与图像的多模态表格学习基准测试
研究 · HF Papers · 05-14
-
从头实现LLM架构的Python/PyTorch教程及开放权重模型对比方法
工程 · X · 05-14
-
AIMIP 发布:AI 天气与气候模型比对项目 | Ai2
评测 · Allen AI · 05-14
-
SenseNova-U1:基于NEO-unify架构统一多模态理解与生成
研究 · HF Papers · 05-13
-
Sub-32B 开放权重
产品 · Artificial Analysis · 05-12
-
近期开源权重模型发布
产品 · Artificial Analysis · 05-12
-
Import AI 456:RSI与经济增长;AI监管的激进可选性;神经计算机
研究 · Import AI · 05-12
-
AWS 上基础模型训练与推理的构建模块
工程 · HF Blog · 05-12
-
vLLM 登顶 Artificial Analysis 排行榜
工程 · vLLM · 05-12
-
TurboQuant 首次全面研究:精度与性能
研究 · vLLM · 05-12
-
OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架
研究 · HF Blog · 05-10
-
world modeling被称为robotics新预训练范式
研究 · X · 05-09
-
自动扩缩 Autoresearch:在 Modal 上为你的 agents 提供弹性 GPU
工程 · Modal · 05-09
-
服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题
工程 · Together AI · 05-09
-
rohitg00/从零开始的 AI 工程
工程 · GitHub · 05-08
-
APEX:面向 AI 生成音乐的大规模多任务美学感知流行度预测
研究 · HF Papers · 05-07
-
用 vLLM x Mooncake 大规模服务 Agentic 工作负载
工程 · vLLM · 05-07
-
支撑大规模高效推理的基础研究
Together AI · 05-05
-
现代 LLM 中 Attention 变体的可视化指南
Sebastian Raschka · 05-03
-
vLLM 中的 DeepSeek V4:高效长上下文 Attention
vLLM · 05-03
-
揭秘 AI agents 的 evals
Anthropic Engineering · 05-03
-
vLLM 中 FP8 KV-Cache 与 Attention 量化的现状
工程 · vLLM · 05-03
-
vLLM 中混合 SSM 模型的分离式 Serving
vLLM · 05-03
-
NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用
AWS ML · 05-03
-
用 Amazon Nova 2 Sonic 将文本 agent 迁移为语音助手
AWS ML · 05-03
-
我理解 LLM 架构的工作流
Sebastian Raschka · 05-03
-
我们如何构建多-agent研究系统
Anthropic Engineering · 05-01
-
面向 AI agents 的有效 context engineering
Anthropic Engineering · 05-01