二〇二六年五月十三日
收録 29 篇
研究 12 · 产品 7 · 工程 6 · 评测 4
- δ-mem:大语言模型的高效在线记忆
- 我们在安全、科学传播与利益冲突方面的规范
- Apollo Research 将转型为公益公司
- 我们对Claude Mythos Preview网络能力的评估
- 利用前沿AI进行网络防御
- 沙盒AI智能体能从评估环境中学到什么?
- 与微软合作加强前沿AI安全
- 我们对OpenAI GPT-5.5网络能力的评估
- 环境因素如何影响AI行为?
- 问而不告:减少大语言模型中的谄媚行为
- 评估AI模型是否会破坏AI安全研究
- 红队测试Anthropic内部Agent监控系统
- Anthropic 风险报告(2026年2月)中“自动化研发风险”章节评述
- SenseNova-U1:基于NEO-unify架构统一多模态理解与生成
- MemPrivacy:面向边缘-云智能体的隐私保护个性化记忆管理
- CSP 允许列表实验
- 引用Mo Bitar
- datasette 1.0a29
- 引用 Mitchell Hashimoto
- llm 0.32a2
- 开源 Qwen3.5 小型 LLM 实现,Gated DeltaNet 不增加 KV cache 大小
- 分享通过 OpenRouter 和 Ollama 从开放权重模型生成蒸馏数据的实用工具
- 印度发布 Sarvam 30B 和 105B 开源推理模型,105B 采用 DeepSeek 风格 MLA 注意力
- 参数高尔夫教给我们的AI辅助研究经验
- 如何消除AI模型服务中的管道摩擦
- 推出语音查找器——从600多种声音中快速为你的应用找到合适声音的新工具
- 开放模型生态如何持续放大优势
- Gemini Interactions API 发布思考与签名指南,支持有状态与无状态模式
- Codex 通过分层 prompt 结构最大化缓存命中率以降低长上下文编码 agent 成本