二〇二六年五月二十二日
收録 35 篇 · 6 条主线
AI Agent 沙箱与基础设施 3
AI 编码工具与成本 3
多智能体系统设计 2
小模型专业化与性能 3
RLVR 信用分配 2
AI 系统监管与信任 2
未归线 20
- π-Bench:长周期工作流中主动式个人助理Agent的评估
- 感知还是偏见:MLLMs能否超越对人格的第一印象?
- BitCPM4-CANN-8B-gguf
- BitCPM4-CANN-3B-gguf
- BitCPM4-CANN-1B-gguf
- BitCPM4-CANN-0.5B-gguf
- TransitLM:无地图公交路线生成的大规模数据集与基准
- 为1000万文档设计零幻觉RAG管道的10个关键步骤
- FTC要求Cox Media Group等三家公司支付近100万美元,以和解其关于“主动监听”AI营销服务欺骗客户的指控
- 智谱发布GLM-5.1-highspeed,实测输出速度达300 TPS,较标准版提升约10倍
- Amazon Nova Act 现已符合 HIPAA 标准
- 谷歌DeepMind加速器项目落地亚太,应对环境风险
- datasette-agent 0.1a2
- datasette-agent-charts 0.1a1
- datasette-agent 0.1a3
- Datasette Agent
- 在Claude设置中粘贴提示词,强制其诚实表达不确定性并禁止编造来源
- 在电信AI工厂上构建Token计量的AI服务
- 在NVIDIA GB200 NVL72上通过Slurm拓扑感知作业调度解锁百亿亿次性能
- Vega:AI时代数字身份的零知识证明
经由机器分线 · 不构成评价