二〇二六年五月三日
收録 145 篇
研究 102 · 产品 25 · 工程 18
- Qwen3.6-27B-FP8
- Together AI 与 Adaption 建立合作伙伴关系
- microsoft/VibeVoice
- 现代 LLM 中 Attention 变体的可视化指南
- Qwen/SAE-Res-Qwen3.5-9B-Base-W64K-L0_50
- Qwen/SAE-Res-Qwen3.5-9B-Base-W64K-L0_100
- Qwen3.6-27B
- Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W32K-L0_50
- Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W128K-L0_100
- Qwen/SAE-Res-Qwen3-30B-A3B-Base-W128K-L0_100
- SAE-Res-Qwen3.5-2B-Base-W32K-L0_50
- SAE-Res-Qwen3-1.7B-Base-W32K-L0_50
- SAE-Res-Qwen3-1.7B-Base-W32K-L0_100
- SAE-Res-Qwen3.5-2B-Base-W32K-L0_100
- Qwen/SAE-Res-Qwen3.5-27B-W80K-L0_50
- Qwen/SAE-Res-Qwen3.5-27B-W80K-L0_100
- SAE-Res-Qwen3-8B-Base-W64K-L0_50
- SAE-Res-Qwen3-8B-Base-W64K-L0_100
- Qwen/SAE-Res-Qwen3-30B-A3B-Base-W32K-L0_50
- 用于编排的开源规范:Symphony
- Codex 在工作中的 10 大用途
- 将 Codex 扩展至全球企业
- OpenAI 现可用于 FedRAMP Moderate
- Claude Code 最佳实践 - Claude Code 文档
- 关于我们选举保障措施的更新
- Claude Opus 4.7 介绍
- 工作区代理
- 使用 Codex
- Codex 是什么?
- Microsoft 与 OpenAI 合作关系的下一阶段
- vLLM 中的 DeepSeek V4:高效长上下文 Attention
- Claude 是一个思考空间 | Anthropic
- 揭秘 AI agents 的 evals
- 介绍 GPT-5.5
- vLLM 中 FP8 KV-Cache 与 Attention 量化的现状
- OpenAI 助力 Hyatt 在员工中推进 AI
- GPT-5.5 系统卡
- Codex 设置
- 插件和技能
- 如何开始使用 Codex
- 适用于(几乎)一切的 Codex
- 自动化
- Choco 用 AI agent 自动化食品分销
- moonshotai/Kimi-K2.6
- NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能
- deepseek-ai/DeepSeek-V4-Flash-Base
- World Models 中面向更长时域的基于梯度规划
- DeepInfra 登陆 Hugging Face 推理服务提供商 🔥
- 通过系统集成式 Speculative Decoding 加速 RL 后训练 Rollouts
- 基于视频先验与异步去噪的统一 4D 世界动作建模
- FASH-iCNN:通过多模态 CNN 探测让编辑时尚身份可检视
- 基于 LLM 的对话式用户模拟综述
- Anthropic 悉尼办公室
- Anthropic 的 Long-Term Benefit Trust 任命 Vas Narasimhan 加入董事会
- deepseek-ai/DeepSeek-V4-Pro
- Anthropic扩大与Google和Broadcom在数吉瓦级下一代算力上的合作
- vLLM 中混合 SSM 模型的分离式 Serving
- deepseek-ai/DeepSeek-V4-Pro-Base
- deepseek-ai/DeepSeek-V4-Flash
- 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI
- Popsa 如何使用 Amazon Nova 通过个性化标题建议启发客户
- NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用
- 用 Amazon Nova 2 Sonic 将文本 agent 迁移为语音助手
- 用分布感知 speculative decoding 将 RL rollouts 加速最高 50%
- Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni
- DeepSeek-V4 Pro 现已在 Together AI 上可用
- AstaBench 更新:新结果及行业采用情况
- 数据科学家的复仇
- 面向 LLM 的大规模交互识别
- 从 732 字节到无处可去:在生产环境中关闭 Copy Fail
- 用 Generative AI 辅助编码赢得 Kaggle 竞赛
- 使用 NVIDIA FLARE 实现无重构开销的联邦学习
- 使用 NVIDIA Blackwell 和 GPU 加速端点基于 DeepSeek V4 构建
- 缓解 Agentic 环境中的间接 AGENTS.md 注入攻击
- 24/7 仿真循环:Agentic AI 如何让地下工程持续推进
- 使用端到端 FP8 精度运行高吞吐量强化学习训练
- 借助 NVIDIA Megatron 推进新兴优化器以加速 LLM 训练
- NVIDIA Nemotron 3 Nano Omni 以单一高效开放模型支持多模态 agent 推理
- 如何在 ComfyUI 中构建、运行和扩展高质量创作者工作流
- 介绍 WildDet3D:从单张图像进行开放世界 3D 检测
- 用 NVIDIA TensorRT for RTX Runtime 加速 Unreal Engine NNE 推理
- 无冲突的容量:面向 AI-native 团队的多租户 GPU 集群设计指南
- 评估用于科学发现的 agent
- Alta Daily 如何利用 Meta 的 Segment Anything 重塑数字衣橱
- 分别训练,合并到一起:基于 mixture-of-experts 的模块化 post-training
- 规模化构建和测试我们最先进 AI 的方式
- OlmPool:小的架构选择如何叠加削弱长上下文扩展
- 介绍 Muse Spark:迈向个人超级智能
- 介绍 OlmoEarth embeddings:从 OlmoEarth Studio 导出自定义 embedding 用于下游分析
- Coding Agent 的组成部分
- 用于高效运动学生成的长期运动嵌入学习
- LaDiR:Latent Diffusion 增强 LLMs 的文本推理能力
- StereoFoley:基于视频的物体感知立体声音频生成
- 我理解 LLM 架构的工作流
- 我们能靠 AI 走向更可持续的世界吗
- Conditional Diffusion 中组合泛化的局部机制
- 如何使用 OpenAI 的 Privacy Filter 构建可扩展 Web 应用
- DSO:用于偏见缓解的直接引导优化
- 自适应思考:LLM 知道何时在潜在空间中思考
- 利用手语模型自举手语标注
- Devin 新增自助服务套餐
- 国际声学、语音与信号处理会议(ICASSP)2026
- SWE-Check:Bug 检测快 10 倍
- STARFlow-V:基于 Normalizing Flows 的端到端视频生成建模
- 强化 Agent:面向工具调用 Agent 的推理时反馈
- Devin for Terminal:本地启动,交给云端
- 快车道上的工程:Mercedes-Benz 与 Cognition 合作
- Devin 东进:Cognition 开设新加坡 APAC 总部
- Windsurf 中的 Devin
- Bugbot 学习规则与 MCP 支持
- Multi-Agent:哪些真正有效
- 我们在构建 Cloud Agents 中学到的事
- Agents 窗口中的平铺布局和升级的语音输入
- CLI 调试模式和 /btw 支持
- 画布
- 团队 Marketplace 更新
- 多任务、Worktrees 和多根工作区
- 与行业领导者合作,加速 AI 转型
- 解耦式 DiLoCo:韧性分布式 AI 训练的新前沿
- 用 Cursor SDK 构建程序化 agent
- AutoAdapt:大语言模型的自动化领域适应
- 宣布我们与大韩民国的合作伙伴关系
- 以 AI co-clinician 实现医疗新模式
- Cursor 安全评审
- Google Meet 的语音翻译现已开始在移动设备上线
- 引用 Matthew Yglesias
- 对agent网络进行红队测试:理解AI agent大规模交互时会出什么问题
- 追溯已失效的 OpenAI-Microsoft AGI 条款历史
- 引用 OpenAI Codex base_instructions
- LLM 0.32a0 是一次重大的向后兼容重构
- 介绍 talkie:来自 1930 年的 13B 复古语言模型
- Zig 项目坚持反 AI 贡献政策的理由
- AI 与网络安全的未来:为什么开放性很重要
- QIMMA قِمّة ⛰:质量优先的阿拉伯语 LLM 排行榜
- Granite 4.1 LLMs:它们是如何构建的
- 如何在 Chrome Extension 中使用 Transformers.js
- AI evals 正成为新的计算瓶颈
- pip 26.1 有哪些新变化:lockfiles 和依赖冷却期!
- DeepSeek-V4:agent 真能用的百万 token 上下文
- 我们需要 RSS 来分享大量 vibe-coded 应用
- 引用 Andrew Kelley
- 我们对 OpenAI GPT-5.5 网络安全能力的评估
- Codex CLI 0.128.0 新增 /goal
- iNaturalist 目击记录
- 目击记录