二〇二六年五月六日
收録 38 篇
研究 31 · 产品 3 · 工程 4
- Vibe coding 和 agentic engineering 比我希望的更接近了
- Skills-Coach:通过免训练 GRPO 实现的自进化技能优化器
- TTS-STT 飞轮:实体密集型合成音频弥合商业和开源系统失效处的 Indic ASR 差距
- ESARBench:用于 Agentic UAV 具身搜索与救援的 Benchmark
- 使用预测式潜变量进行视频生成
- X2SAM:图像和视频中的任意分割
- ARIS:通过对抗式多 agent 协作实现自主研究
- 用 MRC(Multipath Reliable Connection)解锁大规模 AI 训练网络
- 为 Open ASR Leaderboard 添加 Benchmaxxer Repellant
- 证据链:用于迭代式 RAG 的像素级视觉归因
- StateSMix:基于 Mamba 状态空间模型与稀疏 N-gram 上下文混合的在线无损压缩
- 面向医疗 agent 的 Healthcare AI GYM
- SplAttN:用 Gaussian Soft Splatting 和 Attention 连接 2D 与 3D 以实现点云补全
- TCDA:用于对话情感四元组分析的线程约束话语感知建模
- OpenSeeker-v2:用信息量高且高难度的轨迹推动搜索 agent 的极限
- SVGS:用空间可变颜色基元增强 Gaussian Splatting
- 具备统一动作生成框架的交互式世界模型 benchmark
- 基于编排轨迹的 LLM multi-agent 系统强化学习
- SymptomAI:迈向用于日常症状评估的对话式 AI Agent
- Workspace-Bench 1.0:在具有大规模文件依赖的 Workspace 任务上 benchmark AI agents
- PatRe:面向专利审查的全阶段审查意见通知书与答复生成 benchmark
- HeavySkill:将 Heavy Thinking 作为 Agentic Harness 的内在技能
- 超越 SFT-to-RL:通过 Black-Box On-Policy Distillation 进行多模态 RL 的预对齐
- datasette-referrer-policy 0.1
- Microsoft 在 NSDI 2026:大规模网络系统进展
- 随机 KV 路由:实现自适应深度维度缓存共享
- 🔬做 Vibe 物理 — Alex Lupsasca,OpenAI
- 我们的 AI 在斯德哥尔摩开了一家咖啡馆
- llm-echo 0.5a0
- datasette-llm 0.1a7
- 面向表格基础模型的先验对齐数据清洗
- BlenderRAG:通过检索增强代码合成实现高保真 3D 对象生成
- 如何用 NVIDIA 构建车载 AI agent:从云端到汽车
- 用 Extreme Co-Design 应对 Agentic 系统日益增长的复杂性
- GPT-5.5 Instant:更智能、更清晰、更个性化
- 购买 ChatGPT 广告的新方式
- GPT-5.5 Instant 系统卡
- MolmoAct 2:面向现实世界机器人工作的开放基础 | Ai2