二〇二六年五月十三日

收録 29 篇

研究 12 · 产品 7 · 工程 6 · 评测 4

δ-mem：大语言模型的高效在线记忆研究 · HF Papers · 05-13
我们在安全、科学传播与利益冲突方面的规范研究 · apollo-research · 11-26
Apollo Research 将转型为公益公司产品 · apollo-research · 01-20
我们对Claude Mythos Preview网络能力的评估评测 · uk-aisi · 05-12
利用前沿AI进行网络防御工程 · uk-aisi · 05-13
沙盒AI智能体能从评估环境中学到什么？研究 · uk-aisi · 05-12
与微软合作加强前沿AI安全产品 · uk-aisi · 05-12
我们对OpenAI GPT-5.5网络能力的评估评测 · uk-aisi · 05-12
环境因素如何影响AI行为？研究 · uk-aisi · 05-12
问而不告：减少大语言模型中的谄媚行为研究 · uk-aisi · 05-13
评估AI模型是否会破坏AI安全研究评测 · uk-aisi · 05-13
红队测试Anthropic内部Agent监控系统研究 · metr-blog · 03-26
Anthropic 风险报告（2026年2月）中“自动化研发风险”章节评述评测 · metr-blog · 05-08
SenseNova-U1：基于NEO-unify架构统一多模态理解与生成研究 · HF Papers · 05-13
MemPrivacy：面向边缘-云智能体的隐私保护个性化记忆管理研究 · HF Papers · 05-13
CSP 允许列表实验工程 · simon-willison · 05-13
引用Mo Bitar产品 · simon-willison · 05-12
datasette 1.0a29工程 · simon-willison · 05-12
引用 Mitchell Hashimoto研究 · simon-willison · 05-12
llm 0.32a2产品 · simon-willison · 05-12
开源 Qwen3.5 小型 LLM 实现，Gated DeltaNet 不增加 KV cache 大小研究 · twitter@rasbt · 03-03
分享通过 OpenRouter 和 Ollama 从开放权重模型生成蒸馏数据的实用工具工程 · twitter@rasbt · 02-27
印度发布 Sarvam 30B 和 105B 开源推理模型，105B 采用 DeepSeek 风格 MLA 注意力研究 · twitter@rasbt · 03-07
参数高尔夫教给我们的AI辅助研究经验产品 · OpenAI · 05-12
如何消除AI模型服务中的管道摩擦工程 · nvidia-developer · 05-12
推出语音查找器——从600多种声音中快速为你的应用找到合适声音的新工具产品 · together-ai · 05-12
开放模型生态如何持续放大优势研究 · nathan-lambert-interconnects · 05-12
Gemini Interactions API 发布思考与签名指南，支持有状态与无状态模式产品 · twitter@_philschmid · 05-12
Codex 通过分层 prompt 结构最大化缓存命中率以降低长上下文编码 agent 成本工程 · twitter@cwolferesearch · 05-12