録实録译稿

二〇二六年六月六日 · 最近 24 小时收录 10 篇 · 6 条主线

Cursor 设计模式

设计模式改进 Cursor · 06-05刊
在 Cursor 浏览器的设计模式（Design Mode）中，用户可通过点击、绘制或语音描述来引导 agent 更新 UI。多选元素功能允许同时选中两个或更多元素，Cursor 会分析其代码、布局及视觉关系，支持匹配样式、删除重复或批量调整组件。语音输入通过覆盖层（overlay）实现，agent 运行时麦克风持续可用，用户可语音排队下一个更改，无需等待当前操作完成。
读全文 →
Canvas 设计模式与上下文使用报告 Cursor · 06-04刊
Cursor 在画布（canvas）中引入设计模式（Design Mode），用户可直接选中并标注 UI 元素引导编辑，无需文字描述。新增上下文使用报告，以交互式报告展示 token 在系统提示、工具定义、规则、技能等维度的分布，支持追问与自定义报告，并可通过“Debug with Agent”按钮识别优化机会。此外，共享画布支持浏览器全屏打开，agent 可嵌入按钮运行特定 prompt，修复类型错误能力提升，组件样式与图表自定义功能增强。
读全文 →

unicity-astrid/astrid GitHub · 06-05录
Astrid是一个面向AI agent的用户态微内核操作系统，当前版本v0.5.0，由Unicity Labs开发。它将AI agent视为进程，提供带写时复制覆盖层的虚拟文件系统、ed25519能力令牌、IPC事件总线、WASM进程隔离和加密审计追踪。内核固定，其他组件均为可替换的capsule（隔离WASM进程），通过Capsule.toml清单声明依赖，支持离线运行、自定义agent架构、透明缓存和混合provider。安全模型包含策略、令牌、预算、批准和审计五层门控。
读全文 →
千Token木：在3B模型上运行多智能体经济 HF Blog · 06-05刊
在 Build Small Hackathon 中，作者构建了 Thousand Token Wood，一个基于 Qwen2.5-3B 的五个 agent 微型经济体，通过 vLLM 和 Gradio 运行。3B 模型在 100% 调用中输出有效 JSON，但经济判断薄弱，需通过精准 prompt 和容错解析修复。系统通过饮食多样性、腐败和冬季燃料危机设计稀缺性，驱动交易。15 回合运行中，蜂蜜价格从 10 跌至 3，木柴价格从 4 涨至 7，基尼系数从 0.14 升至 0.38。agent 轨迹数据已开放。
读全文 →

OpenAI 帮助：锁定模式 Simon Willison · 06-05刊
OpenAI 已上线锁定模式（Lockdown Mode），面向 Free、Go、Plus、Pro 及自助式 ChatGPT Business 账户推出。该模式通过限制出站网络请求，阻断提示注入攻击（prompt injection attack）导致的数据外泄，但不阻止提示注入影响内容处理。锁定模式针对“致命三要素”（Lethal Trifecta）中数据外泄途径，采用确定性机制而非 AI 评估。默认 ChatGPT 设置对此类攻击保护有限。
读全文 →
引用 Andreas Kling Simon Willison · 06-05刊
Ladybird 浏览器项目创始人 Andreas Kling 宣布停止接受公开 pull request，原因是基于“实质性投入代表善意”的假设已不再成立。项目强调，代码来源（如是否由手工输入）并非关键，核心在于引入变更者必须为代码负责，并愿意承担后果。此举旨在应对生成式 AI 和 LLM 带来的开源协作伦理挑战，确保项目面向真实用户时的责任归属清晰。
读全文 →

企业AI成熟度模型 | Cohere Cohere · 06-06录
Cohere 提出企业 AI 成熟度五阶段模型：实验、工具采用、内部平台、战略集成、AI 原生转型。多数公司卡在阶段 2（工具采用）与阶段 3（内部平台）之间，面临数据访问受限、LLM 信任差距、模型过时恐惧等“生产之墙”障碍。文章建议构建统一数据架构、可观测性框架与模型可选性平台，以推动从试点走向生产级部署。
读全文 →
Coplot：通过可视化支持研究过程 Cohere · 06-03刊
Cohere Labs 的研究可视化叙事者 Thomas Euyang 介绍了 co/plot，一个用于支持研究过程的可视化工具。该工具旨在解决研究人员在使用 Matplotlib 时迭代困难、以及 Figma 无法可靠导入数据导致精度风险的问题。co/plot 支持快速原型化、内置可定制样式，并保持对底层数据的精确性。该工具在构建 Tiny Aya 模型（覆盖 70+ 种语言）的过程中得到测试，Cohere 已将其作为开放科学项目公开发布。
读全文 →

vLLM Semantic Router v0.3 Themis：从信号到有状态生产路由 vLLM · 06-05刊
vLLM Semantic Router v0.3（代号 Themis）发布，标志着语义路由进入有状态、可观测的生产阶段。该版本在 v0.2 基础上新增超过 350 次提交，核心变化包括：规范化的 v0.3 配置契约、会话感知智能体路由（SAAR）、投影层将信号证据转化为策略区间、协议兼容性扩展至 Anthropic /v1/messages、仪表盘升级为运维控制台、长上下文路由优化、硬件后端拓宽至 Intel OpenVINO 及 AMD ROCm。在 RouterArena 排行榜上，vLLM-SR 以 75.4 加权 Arena Score 重返第一。
读全文 →

让Claude成为化学家 Anthropic Research · 06-05刊
Anthropic 发布白皮书，评估 Claude 模型在化学 NMR 谱图分析中的表现。研究选取 20 种化合物，对比 Opus 4.7、Opus 4.6、Sonnet 4.6 与 ChemDraw、MestReNova 在正向预测（谱图模拟）和反向解析（从谱图推导结构）上的性能。Opus 4.7 在氢谱预测中平均误差为 ±0.079 ppm，碳谱与 MestReNova 持平（±1.37 vs ±1.48 ppm），并在峰形匹配和子峰间距预测上优于专用软件。在反向任务中，Opus 4.7 成功恢复全部 8 个简单结构和 4 个复杂结构（共 7 个）。该研究由 Anthropic 化学家 David Kamber 主导，旨在推动 AI 辅助化学日常分析工作。
读全文 →

经由机器分线 · 不构成评价