録实録译稿议社区 24h

词术语频次

历封存归档

architectures

█▃▇▄ · 85 次 · 收录于 46 篇

AI系统监管会变得更难吗？研究 · UK AISI · 05-22
vLLM 中的弹性专家并行工程 · vLLM · 05-20
OlmoEarth v1.1：更高效的模型系列产品 · HF Blog · 05-20
OlmoEarth v1.1：更高效的模型系列 | Ai2 产品 · Allen AI · 05-20
推出 Ettin Reranker 系列产品 · HF Blog · 05-19
LongLive-2.0：面向长视频生成的NVFP4并行基础设施研究 · HF Papers · 05-19
使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频工程 · HF Blog · 05-19
VeRL-Omni 发布：扩散与全模态模型的简易、快速、稳定 RL 训练工程 · vLLM · 05-18
LLM架构最新进展：KV共享、mHC与压缩注意力研究 · Sebastian Raschka · 05-17
新型评估与Agent脚手架赏金计划研究 · UK AISI · 05-16
vllm v0.21.0 工程 · GitHub Release · 05-15
Granite Embedding Multilingual R2：Apache 2.0 开源多语言嵌入，32K 上下文 — 最佳 Sub-100M 检索质量产品 · HF Blog · 05-15
Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理工程 · AWS ML · 05-15
vLLM x Mooncake 规模化服务 Agent 工作负载工程 · vLLM · 05-15
TurboQuant 首次全面研究：精度与性能评测 · vLLM · 05-15
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-15
AnyFlow: 基于同策略流图蒸馏的任意步视频扩散模型研究 · HF Papers · 05-14
MinT：训练与服务百万级LLM的托管基础设施研究 · HF Papers · 05-14
MulTaBench：基于文本与图像的多模态表格学习基准测试研究 · HF Papers · 05-14
从头实现LLM架构的Python/PyTorch教程及开放权重模型对比方法工程 · X · 05-14
AIMIP 发布：AI 天气与气候模型比对项目 | Ai2 评测 · Allen AI · 05-14
SenseNova-U1：基于NEO-unify架构统一多模态理解与生成研究 · HF Papers · 05-13
Sub-32B 开放权重产品 · Artificial Analysis · 05-12
近期开源权重模型发布产品 · Artificial Analysis · 05-12
Import AI 456：RSI与经济增长；AI监管的激进可选性；神经计算机研究 · Import AI · 05-12
AWS 上基础模型训练与推理的构建模块工程 · HF Blog · 05-12
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-12
TurboQuant 首次全面研究：精度与性能研究 · vLLM · 05-12
OncoAgent：用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架研究 · HF Blog · 05-10
world modeling被称为robotics新预训练范式研究 · X · 05-09
自动扩缩 Autoresearch：在 Modal 上为你的 agents 提供弹性 GPU 工程 · Modal · 05-09
服务 DeepSeek-V4：为什么百万 token 上下文是推理系统问题工程 · Together AI · 05-09
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
APEX：面向 AI 生成音乐的大规模多任务美学感知流行度预测研究 · HF Papers · 05-07
用 vLLM x Mooncake 大规模服务 Agentic 工作负载工程 · vLLM · 05-07
支撑大规模高效推理的基础研究 Together AI · 05-05
现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
vLLM 中的 DeepSeek V4：高效长上下文 Attention vLLM · 05-03
揭秘 AI agents 的 evals Anthropic Engineering · 05-03
vLLM 中 FP8 KV-Cache 与 Attention 量化的现状工程 · vLLM · 05-03
vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用 AWS ML · 05-03
用 Amazon Nova 2 Sonic 将文本 agent 迁移为语音助手 AWS ML · 05-03
我理解 LLM 架构的工作流 Sebastian Raschka · 05-03
我们如何构建多-agent研究系统 Anthropic Engineering · 05-01
面向 AI agents 的有效 context engineering Anthropic Engineering · 05-01