二〇二六年五月三日

收録 145 篇

研究 102 · 产品 25 · 工程 18

Qwen3.6-27B-FP8产品 · qwen-hf · 04-21
Together AI 与 Adaption 建立合作伙伴关系研究 · together-ai · 04-30
microsoft/VibeVoice产品 · simon-willison · 04-27
现代 LLM 中 Attention 变体的可视化指南研究 · sebastian-raschka · 03-22
Qwen/SAE-Res-Qwen3.5-9B-Base-W64K-L0_50产品 · qwen-hf · 04-27
Qwen/SAE-Res-Qwen3.5-9B-Base-W64K-L0_100研究 · qwen-hf · 04-27
Qwen3.6-27B产品 · qwen-hf · 04-21
Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W32K-L0_50产品 · qwen-hf · 04-27
Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W128K-L0_100研究 · qwen-hf · 04-27
Qwen/SAE-Res-Qwen3-30B-A3B-Base-W128K-L0_100研究 · qwen-hf · 04-27
SAE-Res-Qwen3.5-2B-Base-W32K-L0_50工程 · qwen-hf · 04-27
SAE-Res-Qwen3-1.7B-Base-W32K-L0_50产品 · qwen-hf · 04-27
SAE-Res-Qwen3-1.7B-Base-W32K-L0_100产品 · qwen-hf · 04-27
SAE-Res-Qwen3.5-2B-Base-W32K-L0_100研究 · qwen-hf · 04-27
Qwen/SAE-Res-Qwen3.5-27B-W80K-L0_50研究 · qwen-hf · 04-27
Qwen/SAE-Res-Qwen3.5-27B-W80K-L0_100研究 · qwen-hf · 04-27
SAE-Res-Qwen3-8B-Base-W64K-L0_50研究 · qwen-hf · 04-27
SAE-Res-Qwen3-8B-Base-W64K-L0_100工程 · qwen-hf · 04-27
Qwen/SAE-Res-Qwen3-30B-A3B-Base-W32K-L0_50研究 · qwen-hf · 04-27
用于编排的开源规范：Symphony工程 · OpenAI · 04-27
Codex 在工作中的 10 大用途工程 · OpenAI · 04-23
将 Codex 扩展至全球企业工程 · OpenAI · 04-21
OpenAI 现可用于 FedRAMP Moderate产品 · OpenAI · 04-27
Claude Code 最佳实践 - Claude Code 文档工程 · Anthropic Engineering · 05-01
关于我们选举保障措施的更新产品 · Anthropic · 04-30
Claude Opus 4.7 介绍产品 · Anthropic · 04-16
工作区代理产品 · OpenAI · 04-22
使用 Codex工程 · OpenAI · 04-23
Codex 是什么？工程 · OpenAI · 04-23
Microsoft 与 OpenAI 合作关系的下一阶段工程 · OpenAI · 04-27
vLLM 中的 DeepSeek V4：高效长上下文 Attention研究 · vllm-blog · 04-24
Claude 是一个思考空间 | Anthropic产品 · Anthropic · 04-30
揭秘 AI agents 的 evals工程 · Anthropic Engineering · 01-09
介绍 GPT-5.5产品 · OpenAI · 04-23
vLLM 中 FP8 KV-Cache 与 Attention 量化的现状工程 · vllm-blog · 04-22
OpenAI 助力 Hyatt 在员工中推进 AI产品 · OpenAI · 04-20
GPT-5.5 系统卡产品 · OpenAI · 04-23
Codex 设置工程 · OpenAI · 04-23
插件和技能工程 · OpenAI · 04-23
如何开始使用 Codex工程 · OpenAI · 04-23
适用于（几乎）一切的 Codex工程 · OpenAI · 04-16
自动化工程 · OpenAI · 04-23
Choco 用 AI agent 自动化食品分销工程 · OpenAI · 04-27
moonshotai/Kimi-K2.6产品 · moonshot-hf · 04-14
NVIDIA Nemotron 3 Nano Omni：面向文档、音频和视频 agent 的长上下文多模态智能研究 · huggingface-blog · 04-28
deepseek-ai/DeepSeek-V4-Flash-Base产品 · deepseek-hf · 04-22
World Models 中面向更长时域的基于梯度规划研究 · berkeley-bair · 04-20
DeepInfra 登陆 Hugging Face 推理服务提供商 🔥产品 · huggingface-blog · 04-29
通过系统集成式 Speculative Decoding 加速 RL 后训练 Rollouts研究 · HF Papers · 04-30
基于视频先验与异步去噪的统一 4D 世界动作建模研究 · HF Papers · 04-30
FASH-iCNN：通过多模态 CNN 探测让编辑时尚身份可检视研究 · HF Papers · 04-30
基于 LLM 的对话式用户模拟综述研究 · HF Papers · 04-30
Anthropic 悉尼办公室产品 · Anthropic · 04-30
Anthropic 的 Long-Term Benefit Trust 任命 Vas Narasimhan 加入董事会产品 · Anthropic · 04-30
deepseek-ai/DeepSeek-V4-Pro产品 · deepseek-hf · 04-22
Anthropic扩大与Google和Broadcom在数吉瓦级下一代算力上的合作产品 · Anthropic · 04-30
vLLM 中混合 SSM 模型的分离式 Serving研究 · vllm-blog · 04-21
deepseek-ai/DeepSeek-V4-Pro-Base产品 · deepseek-hf · 04-22
deepseek-ai/DeepSeek-V4-Flash产品 · deepseek-hf · 04-22
用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI研究 · vllm-blog · 04-28
Popsa 如何使用 Amazon Nova 通过个性化标题建议启发客户研究 · aws-ml · 04-27
NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用研究 · aws-ml · 04-28
用 Amazon Nova 2 Sonic 将文本 agent 迁移为语音助手研究 · aws-ml · 04-28
用分布感知 speculative decoding 将 RL rollouts 加速最高 50%研究 · together-ai · 04-24
Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni产品 · together-ai · 04-28
DeepSeek-V4 Pro 现已在 Together AI 上可用研究 · together-ai · 04-29
AstaBench 更新：新结果及行业采用情况研究 · allenai-blog · 04-30
数据科学家的复仇研究 · hamel-husain · 03-26
面向 LLM 的大规模交互识别研究 · berkeley-bair · 03-13
从 732 字节到无处可去：在生产环境中关闭 Copy Fail工程 · together-ai · 04-30
用 Generative AI 辅助编码赢得 Kaggle 竞赛研究 · nvidia-developer · 04-23
使用 NVIDIA FLARE 实现无重构开销的联邦学习研究 · nvidia-developer · 04-24
使用 NVIDIA Blackwell 和 GPU 加速端点基于 DeepSeek V4 构建研究 · nvidia-developer · 04-24
缓解 Agentic 环境中的间接 AGENTS.md 注入攻击研究 · nvidia-developer · 04-20
24/7 仿真循环：Agentic AI 如何让地下工程持续推进研究 · nvidia-developer · 04-28
使用端到端 FP8 精度运行高吞吐量强化学习训练研究 · nvidia-developer · 04-20
借助 NVIDIA Megatron 推进新兴优化器以加速 LLM 训练研究 · nvidia-developer · 04-22
NVIDIA Nemotron 3 Nano Omni 以单一高效开放模型支持多模态 agent 推理研究 · nvidia-developer · 04-28
如何在 ComfyUI 中构建、运行和扩展高质量创作者工作流研究 · nvidia-developer · 04-30
介绍 WildDet3D：从单张图像进行开放世界 3D 检测研究 · allenai-blog · 04-07
用 NVIDIA TensorRT for RTX Runtime 加速 Unreal Engine NNE 推理研究 · nvidia-developer · 04-30
无冲突的容量：面向 AI-native 团队的多租户 GPU 集群设计指南研究 · together-ai · 04-21
评估用于科学发现的 agent研究 · allenai-blog · 04-13
Alta Daily 如何利用 Meta 的 Segment Anything 重塑数字衣橱研究 · meta-ai · 04-06
分别训练，合并到一起：基于 mixture-of-experts 的模块化 post-training研究 · allenai-blog · 04-20
规模化构建和测试我们最先进 AI 的方式研究 · meta-ai · 04-08
OlmPool：小的架构选择如何叠加削弱长上下文扩展研究 · allenai-blog · 04-23
介绍 Muse Spark：迈向个人超级智能研究 · meta-ai · 04-08
介绍 OlmoEarth embeddings：从 OlmoEarth Studio 导出自定义 embedding 用于下游分析研究 · allenai-blog · 04-23
Coding Agent 的组成部分研究 · sebastian-raschka · 04-04
用于高效运动学生成的长期运动嵌入学习研究 · apple-ml-research · 04-24
LaDiR：Latent Diffusion 增强 LLMs 的文本推理能力研究 · apple-ml-research · 04-28
StereoFoley：基于视频的物体感知立体声音频生成研究 · apple-ml-research · 04-28
我理解 LLM 架构的工作流研究 · sebastian-raschka · 04-18
我们能靠 AI 走向更可持续的世界吗研究 · microsoft-research · 04-20
Conditional Diffusion 中组合泛化的局部机制研究 · apple-ml-research · 04-28
如何使用 OpenAI 的 Privacy Filter 构建可扩展 Web 应用研究 · huggingface-blog · 04-27
DSO：用于偏见缓解的直接引导优化研究 · apple-ml-research · 04-29
自适应思考：LLM 知道何时在潜在空间中思考研究 · apple-ml-research · 04-29
利用手语模型自举手语标注研究 · apple-ml-research · 04-30
Devin 新增自助服务套餐研究 · cognition · 04-14
国际声学、语音与信号处理会议（ICASSP）2026研究 · apple-ml-research · 04-30
SWE-Check：Bug 检测快 10 倍研究 · cognition · 04-14
STARFlow-V：基于 Normalizing Flows 的端到端视频生成建模研究 · apple-ml-research · 04-30
强化 Agent：面向工具调用 Agent 的推理时反馈研究 · apple-ml-research · 05-01
Devin for Terminal：本地启动，交给云端研究 · cognition · 04-27
快车道上的工程：Mercedes-Benz 与 Cognition 合作研究 · cognition · 04-27
Devin 东进：Cognition 开设新加坡 APAC 总部研究 · cognition · 04-30
Windsurf 中的 Devin研究 · cognition · 04-15
Bugbot 学习规则与 MCP 支持研究 · cursor-changelog · 04-08
Multi-Agent：哪些真正有效研究 · cognition · 04-22
我们在构建 Cloud Agents 中学到的事研究 · cognition · 04-23
Agents 窗口中的平铺布局和升级的语音输入研究 · cursor-changelog · 04-13
CLI 调试模式和 /btw 支持研究 · cursor-changelog · 04-14
画布研究 · cursor-changelog · 04-15
团队 Marketplace 更新研究 · cursor-changelog · 05-01
多任务、Worktrees 和多根工作区研究 · cursor-changelog · 04-24
与行业领导者合作，加速 AI 转型研究 · deepmind · 04-21
解耦式 DiLoCo：韧性分布式 AI 训练的新前沿研究 · deepmind · 04-22
用 Cursor SDK 构建程序化 agent研究 · cursor-changelog · 04-29
AutoAdapt：大语言模型的自动化领域适应研究 · microsoft-research · 04-22
宣布我们与大韩民国的合作伙伴关系研究 · deepmind · 04-27
以 AI co-clinician 实现医疗新模式研究 · deepmind · 04-30
Cursor 安全评审研究 · cursor-changelog · 04-30
Google Meet 的语音翻译现已开始在移动设备上线研究 · simon-willison · 04-27
引用 Matthew Yglesias研究 · simon-willison · 04-28
对agent网络进行红队测试：理解AI agent大规模交互时会出什么问题研究 · microsoft-research · 04-30
追溯已失效的 OpenAI-Microsoft AGI 条款历史研究 · simon-willison · 04-27
引用 OpenAI Codex base_instructions研究 · simon-willison · 04-28
LLM 0.32a0 是一次重大的向后兼容重构研究 · simon-willison · 04-29
介绍 talkie：来自 1930 年的 13B 复古语言模型研究 · simon-willison · 04-28
Zig 项目坚持反 AI 贡献政策的理由研究 · simon-willison · 04-30
AI 与网络安全的未来：为什么开放性很重要研究 · huggingface-blog · 04-21
QIMMA قِمّة ⛰：质量优先的阿拉伯语 LLM 排行榜研究 · huggingface-blog · 04-21
Granite 4.1 LLMs：它们是如何构建的研究 · huggingface-blog · 04-29
如何在 Chrome Extension 中使用 Transformers.js研究 · huggingface-blog · 04-23
AI evals 正成为新的计算瓶颈研究 · huggingface-blog · 04-29
pip 26.1 有哪些新变化：lockfiles 和依赖冷却期！研究 · simon-willison · 04-28
DeepSeek-V4：agent 真能用的百万 token 上下文研究 · huggingface-blog · 04-24
我们需要 RSS 来分享大量 vibe-coded 应用研究 · simon-willison · 04-30
引用 Andrew Kelley研究 · simon-willison · 04-30
我们对 OpenAI GPT-5.5 网络安全能力的评估研究 · simon-willison · 04-30
Codex CLI 0.128.0 新增 /goal研究 · simon-willison · 04-30
iNaturalist 目击记录研究 · simon-willison · 05-01
目击记录研究 · simon-willison · 05-02