録
议 词 历二〇二六年六月六日 · 最近 24 小时收录 10 篇 · 6 条主线
Cursor 设计模式
-
设计模式改进
在 Cursor 浏览器的设计模式(Design Mode)中,用户可通过点击、绘制或语音描述来引导 agent 更新 UI。多选元素功能允许同时选中两个或更多元素,Cursor 会分析其代码、布局及视觉关系,支持匹配样式、删除重复或批量调整组件。语音输入通过覆盖层(overlay)实现,agent 运行时麦克风持续可用,用户可语音排队下一个更改,无需等待当前操作完成。
读全文 → -
Canvas 设计模式与上下文使用报告
Cursor 在画布(canvas)中引入设计模式(Design Mode),用户可直接选中并标注 UI 元素引导编辑,无需文字描述。新增上下文使用报告,以交互式报告展示 token 在系统提示、工具定义、规则、技能等维度的分布,支持追问与自定义报告,并可通过“Debug with Agent”按钮识别优化机会。此外,共享画布支持浏览器全屏打开,agent 可嵌入按钮运行特定 prompt,修复类型错误能力提升,组件样式与图表自定义功能增强。
读全文 →
AI agent 操作系统
-
unicity-astrid/astrid
Astrid是一个面向AI agent的用户态微内核操作系统,当前版本v0.5.0,由Unicity Labs开发。它将AI agent视为进程,提供带写时复制覆盖层的虚拟文件系统、ed25519能力令牌、IPC事件总线、WASM进程隔离和加密审计追踪。内核固定,其他组件均为可替换的capsule(隔离WASM进程),通过Capsule.toml清单声明依赖,支持离线运行、自定义agent架构、透明缓存和混合provider。安全模型包含策略、令牌、预算、批准和审计五层门控。
读全文 → -
千Token木:在3B模型上运行多智能体经济
在 Build Small Hackathon 中,作者构建了 Thousand Token Wood,一个基于 Qwen2.5-3B 的五个 agent 微型经济体,通过 vLLM 和 Gradio 运行。3B 模型在 100% 调用中输出有效 JSON,但经济判断薄弱,需通过精准 prompt 和容错解析修复。系统通过饮食多样性、腐败和冬季燃料危机设计稀缺性,驱动交易。15 回合运行中,蜂蜜价格从 10 跌至 3,木柴价格从 4 涨至 7,基尼系数从 0.14 升至 0.38。agent 轨迹数据已开放。
读全文 →
OpenAI 锁定模式
-
OpenAI 帮助:锁定模式
OpenAI 已上线锁定模式(Lockdown Mode),面向 Free、Go、Plus、Pro 及自助式 ChatGPT Business 账户推出。该模式通过限制出站网络请求,阻断提示注入攻击(prompt injection attack)导致的数据外泄,但不阻止提示注入影响内容处理。锁定模式针对“致命三要素”(Lethal Trifecta)中数据外泄途径,采用确定性机制而非 AI 评估。默认 ChatGPT 设置对此类攻击保护有限。
读全文 → -
引用 Andreas Kling
Ladybird 浏览器项目创始人 Andreas Kling 宣布停止接受公开 pull request,原因是基于“实质性投入代表善意”的假设已不再成立。项目强调,代码来源(如是否由手工输入)并非关键,核心在于引入变更者必须为代码负责,并愿意承担后果。此举旨在应对生成式 AI 和 LLM 带来的开源协作伦理挑战,确保项目面向真实用户时的责任归属清晰。
读全文 →
Cohere 企业 AI
-
企业AI成熟度模型 | Cohere
Cohere 提出企业 AI 成熟度五阶段模型:实验、工具采用、内部平台、战略集成、AI 原生转型。多数公司卡在阶段 2(工具采用)与阶段 3(内部平台)之间,面临数据访问受限、LLM 信任差距、模型过时恐惧等“生产之墙”障碍。文章建议构建统一数据架构、可观测性框架与模型可选性平台,以推动从试点走向生产级部署。
读全文 → -
Coplot:通过可视化支持研究过程
Cohere Labs 的研究可视化叙事者 Thomas Euyang 介绍了 co/plot,一个用于支持研究过程的可视化工具。该工具旨在解决研究人员在使用 Matplotlib 时迭代困难、以及 Figma 无法可靠导入数据导致精度风险的问题。co/plot 支持快速原型化、内置可定制样式,并保持对底层数据的精确性。该工具在构建 Tiny Aya 模型(覆盖 70+ 种语言)的过程中得到测试,Cohere 已将其作为开放科学项目公开发布。
读全文 →
vLLM 语义路由
-
vLLM Semantic Router v0.3 Themis:从信号到有状态生产路由
vLLM Semantic Router v0.3(代号 Themis)发布,标志着语义路由进入有状态、可观测的生产阶段。该版本在 v0.2 基础上新增超过 350 次提交,核心变化包括:规范化的 v0.3 配置契约、会话感知智能体路由(SAAR)、投影层将信号证据转化为策略区间、协议兼容性扩展至 Anthropic /v1/messages、仪表盘升级为运维控制台、长上下文路由优化、硬件后端拓宽至 Intel OpenVINO 及 AMD ROCm。在 RouterArena 排行榜上,vLLM-SR 以 75.4 加权 Arena Score 重返第一。
读全文 →
Claude 化学分析
-
让Claude成为化学家
Anthropic 发布白皮书,评估 Claude 模型在化学 NMR 谱图分析中的表现。研究选取 20 种化合物,对比 Opus 4.7、Opus 4.6、Sonnet 4.6 与 ChemDraw、MestReNova 在正向预测(谱图模拟)和反向解析(从谱图推导结构)上的性能。Opus 4.7 在氢谱预测中平均误差为 ±0.079 ppm,碳谱与 MestReNova 持平(±1.37 vs ±1.48 ppm),并在峰形匹配和子峰间距预测上优于专用软件。在反向任务中,Opus 4.7 成功恢复全部 8 个简单结构和 4 个复杂结构(共 7 个)。该研究由 Anthropic 化学家 David Kamber 主导,旨在推动 AI 辅助化学日常分析工作。
读全文 →
经由机器分线 · 不构成评价