词
历Agent Skills
用于封装代理可复用能力
- walkinglabs/learn-harness-engineering
- Project Glasswing:初步更新
- 谷歌DeepMind加速器项目落地亚太,应对环境风险
- 用一条 curl 命令调用 Gemini API 构建 GitHub Issue 分类 Agent
- Anthropic 发布 claude-code-setup 插件,将 Claude Code 升级为完整 AI 开发环境
- NVIDIA 验证的 Agent 技能为 AI Agent 提供能力治理
- Google 推出 Antigravity Agent 与 Gemini Managed Agents,并发布 Gemini 3.5 迁移指南
- 发现可对抗肝纤维化的老药新用
- 让内容创建与编辑过程更易理解
- 开辟衰老研究新路径
- 整合生物工具包,探索ALS新疗法
- 发现新型传染病背后的分子开关
- 加速发现肝病机制
- 用 Project Genie 和街景模拟真实世界地点
- Gemini for Science:新发现时代的AI实验与工具
- 快速追踪遗传线索逆转细胞衰老
- 推出 Ettin Reranker 系列
- SkillsVote:从收集、推荐到演进的Agent技能全生命周期治理
- AgriciDaniel/claude-obsidian
- MMSkills:面向通用视觉智能体的多模态技能
- Anthropic 发布 claude-code-setup 插件,将 Claude Code 升级为完整 AI 开发环境
- Imbad0202/学术研究技能
- AISI 高级 AI 评估:五月更新
- neilsonnn/image-blaster
- 评估前沿AI系统的早期经验
- 新型评估与Agent脚手架赏金计划
- OpenAI o1 模型部署前评估
- Anthropic 升级版 Claude 3.5 Sonnet 的部署前评估
- 增强AI韧性
- 构建通用无障碍代理——过程中的经验教训
- 结构化引出实验协议
- esengine/DeepSeek-Reasonix
- op7418/guizang-ppt-skill
- Frontier AI趋势报告首期5项关键发现
- 自主AI网络能力进步有多快?
- vLLM x Mooncake 规模化服务 Agent 工作负载
- AI与工作的未来:衡量AI驱动的工作任务生产力提升
- 前沿AI智能体在多步网络攻击场景中表现如何?
- 用AI Agent与技能将视频转化为即时可搜索、可行动的情报
- 我们对Claude Mythos Preview网络能力的评估
- 我们对OpenAI GPT-5.5网络能力的评估
- 如何与AI协作并实现复利
- 开发者用22,000小时在Claude Code上构建个人AI操作系统并开源
- 中国AI实验室内部笔记
- 蒸馏恐慌
- Import AI 455:AI系统即将开始自我构建
- world modeling被称为robotics新预训练范式
- 提出两种 MCP servers 使用模式以避免 context 膨胀
- 部署并推理 HuggingFace 上的任意模型
- Harness 是一切:如何优化你的 Harness
- 自动扩缩 Autoresearch:在 Modal 上为你的 agents 提供弹性 GPU
- 用 Modal 和 OpenAI Agents SDK 构建
- Butter 加入 Modal
- 如何在 AI Agents 中正确使用 MCP servers
- Narcooo/inkos
- 推进 EMEA 青少年安全与福祉
- MiniCPM-V-4_5-GPTQ
- nidhinjs/prompt-master
- rohitg00/从零开始的 AI 工程
- wanshuiyin/睡眠中自动 Claude Code 研究
- PR 审查、并行制定计划和拆分 PR
- Gemini API 更新 Interactions steps 与 File Search 多模态检索
- The Anthropic Institute 的重点领域
- Sequoia对谈梳理LLM新边界、锯齿能力与agent-native经济
- vibe agents 被指让整个文件系统成为攻击面
- Gemini 3 Flash 编排 subagents 生成 16 个视频变体
- MedSkillAudit:面向医学研究 agent 技能的领域特定审计框架
- ConardLi/garden-skills
- EKKOLearnAI/hermes-web-ui
- HKUDS/Vibe-Trading
- nesquena/hermes-webui
- 上下文使用明细
- 用 vLLM x Mooncake 大规模服务 Agentic 工作负载
- Skills-Coach:通过免训练 GRPO 实现的自进化技能优化器
- ARIS:通过对抗式多 agent 协作实现自主研究
- HeavySkill:将 Heavy Thinking 作为 Agentic Harness 的内在技能
- MolmoAct 2:面向现实世界机器人工作的开放基础 | Ai2
- 从上下文到技能:语言模型能否熟练地从上下文中学习
- 使用 NVIDIA cuOpt Agent Skills 优化供应链决策系统
- 从技能文本到技能结构:面向 agent 技能的调度-结构-逻辑表示
- 用于编排的开源规范:Symphony
- Claude Code 最佳实践 - Claude Code 文档
- 介绍 GPT-5.5
- 插件和技能
- NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能
- 数据科学家的复仇
- 团队 Marketplace 更新
- Claw-Eval-Live:面向演进中真实世界工作流的实时 Agent Benchmark
- 用 Agent Skills 让 agent 适应真实世界
- 使用 MCP 执行代码:构建更高效的 AI agents
- 长时间运行的应用开发的 harness 设计
- 在 ChatGPT 中引入工作区 agents
- Anthropic 经济指数报告:学习曲线
- 自动化对齐研究者:使用 LLM 扩展可扩展监督