wanshuiyin/睡眠中自动 Claude Code 研究
wanshuiyin/Auto-claude-code-research-in-sleep
Auto-claude-code-research-in-sleep (ARIS) 是一个用于自主机器学习研究工作流的开源工具集,通过Claude Code与外部LLM(如GPT-5.4)的跨模型协作实现。系统包含67个可组合技能,支持从文献调研、想法发现、实验部署、论文写作到反驳回复的完整流水线。v0.4.4版本修复了设置用户体验与审稿人路由问题,支持第三方Anthropic兼容代理、计划模式、研究Wiki持久化知识库及自我进化功能。项目已用于多篇会议投稿,社区贡献了13个领域特定技能和12个外部集成项目。
Auto-claude-code-research-in-sleep (ARIS ⚔️🌙)
💡 在 Claude Code / Cursor / Trae 中以技能工作流的方式使用 ARIS,或通过独立 CLI 获得完整体验——随心所欲!
🤖 AI agents(AI 代理): 请阅读 AGENT_GUIDE.md——专为 LLM 消费而非人类浏览而结构化。
🔥 ARIS-Code CLI — 独立安装版 · English | ⬇️ 下载
📰 ARIS-Code v0.4.4 (2026-04-20) — Setup UX + reviewer routing fixes(设置用户体验 + 审稿人路由修复) (解决 #158, #162) |
/setup不再强制要求 Anthropic + 自定义 URL 使用 Bearer(修复 ModelScope /code.newcli.com等) | 提供 Provider 感知的代理 URL 提示 | 切换 Provider 时不再泄漏过期状态 | LlmReview 智能回退v0.4.3 (2026-04-17) — 第三方 Anthropic 兼容代理支持 (Bedrock 等) | 跳过代理拒绝的 beta 标志 | 为
anthropicprovider 传播自定义 base URL | 致谢 @screw-44v0.4.2 (2026-04-17) — 自动压缩损坏修复 | 在 OpenAI 兼容执行器上保留压缩摘要 | Shell 提供的 API 密钥在启动时不再被擦除
v0.4.1 (2026-04-15) — 计划模式 (
/plan) | 协作式 Ctrl+C 中断 | 自动重试 (429/5xx/network) | 研究 Wiki 📚 (持久化知识库) | 自我进化 🧬 (/meta-optimize) | 本地模型 (LM Studio/Ollama) | 同步 62 个技能v0.3.11 (2026-04-13) — 审稿人 Anthropic 兼容模式 (通过代理使用 Claude)
v0.3.9 (2026-04-11) — 代理/自定义 base URL (CCSwitch) | 本地模型 (LM Studio/Ollama) | Windows (实验性)
v0.3.5 (2026-04-08) — 研究 Wiki (持久化论文/想法/实验/声明 + 关系图) | Meta-Optimize 自我进化 (分析日志 → 提出 SKILL.md 补丁)
v0.3.0 (2026-04-03) — 多文件记忆索引 | 丰富的任务系统 (TodoWrite) |
/plan| 安全加固v0.2.2 (2026-04-03) —
/plan逐步规划 |/tasks持久化追踪v0.2.1 (2026-04-03) — 持久化记忆 | Kimi K2.5 多轮修复 | CJK 光标修复
v0.2.0 (2026-04-02) — 开源 | 支持 Kimi + MiniMax + GLM | 智能 LlmReview 路由 | CI/CD
v0.1.0 (2026-04-02) — 初始发布 | 多执行器与审稿人 | 42 个内置技能
ARIS Logo
Hero
中文版 README | English
Score Progression
🌙 让 Claude Code 在你睡觉时做研究。 醒来时,你的论文已被评分、弱点已被识别、实验已运行、叙事已被重写——全自动完成。
🪶 极致轻量——零依赖、零锁定。 整个系统就是纯 Markdown 文件。无需学习框架、无需维护数据库、无需配置 Docker、无需守护进程。每个技能都是一个
SKILL.md,任何 LLM 都能读取——将 Claude Code 替换为 Codex CLI、OpenClaw、Cursor、Trae、Antigravity、Windsurf 或你自己的 agent,工作流依然有效。Fork 它、重写它、适配到你的技术栈。💡 ARIS 是一种方法论,而非一个平台。重要的是研究工作流——无论你走到哪里,都能带着它。🌱
用于自主 ML 研究工作流的自定义 Claude Code 技能。这些技能编排了跨模型协作——Claude Code 驱动研究,而外部 LLM(通过 Codex MCP)充当关键审稿人。🔀 也支持替代模型组合(Kimi、LongCat、DeepSeek 等)——无需 Claude 或 OpenAI API。 例如,MiniMax-M2.7 + GLM-5 或 GLM-5 + MiniMax-M2.7。🤖 Codex CLI 原生——完整技能集也适用于 OpenAI Codex。🖱️ Cursor——同样适用于 Cursor。🖥️ Trae——字节跳动 AI IDE。🚀 Antigravity——Google 的 agent-first IDE。🆓 通过 ModelScope 免费使用——零成本、零锁定。
💭 为什么不用单一模型自对弈? 使用 Claude Code 子 agent 或 agent 团队同时负责执行和评审在技术上是可行的,但容易陷入局部最优——同一模型评审自己的模式会产生盲点。
可以将其类比为对抗性老虎机与随机老虎机:单一模型自我评审是随机情况(可预测的奖励噪声),而跨模型评审是对抗性的(审稿人主动探测执行者未预料到的弱点)——对抗性老虎机从根本上更难被利用。
💭 为什么是两个模型,而不是更多? 两个是打破自对弈盲点所需的最小数量,而 2 人博弈收敛到 Nash 均衡的效率远高于 n 人博弈。增加更多审稿人会增加 API 成本和协调开销,且收益递减——最大的收益来自 1→2,而非 2→4。
Claude Code 的优势在于快速流畅的执行;Codex (GPT-5.4 xhigh) 较慢,但在批判上更审慎、更严谨。这些互补的风格——速度 × 严谨——比任一模型自言自语产生更好的结果。
🧿 想要最强的审稿人? 在任何技能中添加
— reviewer: oracle-pro,即可通过 Oracle MCP 将评审路由到 GPT-5.4 Pro。用于证明验证、实验审计和最终压力测试的 Pro 级推理。支持 API 密钥或免费浏览器模式。设置 →
🎯 不仅仅是提示词
这些是完整的流水线——你也可以独立使用每个工作流。已有想法?跳到工作流 1.5。已有结果?跳到工作流 3。已有评审意见?跳到工作流 4。想要持久化记忆?启用研究 Wiki。所有命令请参见快速开始,完整分解请参见工作流。
基础模式——给 ARIS 一个研究方向,它处理一切:
/research-pipeline "factorized gap in discrete diffusion LMs"
🔥 定向模式——有一篇想改进的论文?给 ARIS 论文 + 代码:
/research-pipeline "improve method X" — ref paper: https://arxiv.org/abs/2406.04329, base repo: https://github.com/org/project
ARIS 阅读论文 → 发现其弱点 → 克隆代码库 → 生成专门修复那些弱点与那个代码的想法 → 运行实验 → 撰写你的论文。就像告诉研究助理:"阅读这篇论文,使用这个仓库,找出缺失之处,然后修复它。"
混合搭配:仅
ref paper= "哪些地方可以改进?",仅base repo= "我能用这段代码构建什么?",两者都提供 = "使用这个代码改进这篇论文。"
🔥 反驳模式——评审意见刚出来?别慌。ARIS 阅读每一条关切,构建策略,并起草一份有依据、结构清晰且不超过字符限制的反驳:
/rebuttal "paper/ + reviews" — venue: ICML, character limit: 5000
| 参数 | 默认值 | 作用 |
|---|---|---|
venue |
ICML |
目标会议 (ICML/NeurIPS/ICLR/CVPR/ACL/AAAI/ACM) |
character limit |
— | 必填。 反驳文本的硬字符限制 |
quick mode |
false |
在解析 + 策略阶段后停止(阶段 0-3)。在起草前查看审稿人想要什么 |
auto experiment |
false |
当审稿人要求新证据时,通过 /experiment-bridge 自动运行补充实验 |
max stress test rounds |
1 |
GPT-5.4 xhigh 对草稿进行压力测试的次数 |
max followup rounds |
3 |
每位审稿人的后续轮次限制 |
三道安全门——如果任何一道未通过,反驳将不会定稿:
- 🔒 无捏造——每项声明都映射到论文/评审/用户确认的结果
- 🔒 无过度承诺——每个承诺都经用户批准
- 🔒 全覆盖——每位审稿人的关切都被追踪
两个输出:PASTE_READY.txt(精确字符数,可直接粘贴到会议系统)+ REBUTTAL_DRAFT_rich.md(扩展版本,供手动编辑)。
录用后——论文已接收,现在准备演示:
/paper-slides "paper/" # → Beamer PDF + PPTX + 演讲者备注 + Q&A 准备
/paper-poster "paper/" # → A0/A1 海报 PDF + 可编辑 PPTX + SVG
💡 从想法到论文再到讲台——一个工具链。🌱
🏆 使用 ARIS 构建的社区投稿
| 论文 | AI 评审信号 | 状态 | 作者 | 技术栈 |
|---|---|---|---|---|
| CS 论文投稿 | CSPaper 模拟评审:8/10;AI 审稿人推荐:"clear accept" | 已投稿至某 CS 会议;等待官方反馈 | @DefanXue & @Monglitay | Claude Code + GPT-5.4 |
| AAAI 2026 论文投稿 | Stanford Agentic Reviewer AAAI 风格评审:7/10;AI 审稿人推荐:"good paper, accept" | 已投稿至 AAAI 2026 Main Technical;等待官方决定 | @xinbo820-web | 纯 Codex CLI |
| UAV-CC | 审稿中 | 已投稿至 IEEE TGRS | @wxx827 | Claude Opus 4.6 + Codex 5.4 xhigh + Cursor |
使用 ARIS 构建——从想法到投稿。AI 评审分数是社区报告的来自模拟/第三方评审工具的信号,并非官方同行评审或录用结果。由于 ARIS 明确针对 AI 审稿人进行迭代,较高的 AI 评审分数是预期的,应视为压力测试反馈;人类审稿人可能带来更新的视角、会议偏好以及这些系统未捕捉到的关切。完整详情 + 评审截图 →
📢 最新动态
- 2026-05-06 —
🎤
/paper-talk工作流 +/slides-polish技能——端到端会议演讲流水线。/paper-talk编排论文 → 幻灯片大纲 → Beamer + PPTX → 逐页润色 → 保证审计 → 最终报告(与/paper-writing、/paper-poster配套);组合/paper-slides、/slides-polish,以及当assurance: conference-ready时的/paper-claim-audit+/citation-audit。/slides-polish是生成后的视觉处理:逐页 Codex 对照参考 PDF 进行评审,并附带修复模式目录(PPTX 字体缩放 1.5-1.8× 以达到投影仪可读大小、字体增大后调整文本框大小、banner-as-tcolorbox、斜体样式泄漏防护、em-dash 间距、通过 PingFang SC 的中文 EA 字体提示、匿名占位符纪律)。保证阶梯draft / polished (default) / conference-ready独立于工作量轴;effort: lite, assurance: conference-ready是合法的,意为"快速流水线,每次审计必须在最终定稿前发出裁决"。阶段 4 暂存适配器将幻灯片文本 + 演讲者备注 + 演讲脚本物化为合成论文目录 (.aris/paper-talk/audit-input/sections/*.tex+ 符号链接的.bib/results//figures/),使现有审计以其论文形状的契约运行,并根据shared-references/assurance-contract.md发出 6 状态 JSON 裁决。 - 2026-05-05 —
🔁
/resubmit-pipeline— 工作流 5:跨会议纯文本重新投稿 (#208)。在硬约束下(无新实验、无 bib 编辑、无框架更改、绝不覆盖先前投稿)将一篇已润色的论文从一个会议移植到另一个会议。5 个阶段:物理隔离 → 5 层匿名检查 → 审计 (proof / claim / citation--soft-only) → 通过/auto-paper-improvement-loop --edit-whitelist进行微编辑(每轮 diff 门控)→ 通过/kill-argument进行对抗门控 → 最终编译 + 通过/overleaf-sync推送到 Overleaf。同一 PR 中附带两个先决条件 SKILL 升级:/auto-paper-improvement-loop --edit-whitelist <path>(YAML schema,包含允许/禁止路径 +forbidden_operations如new_cite/new_theorem_env/numerical_claim、forbidden_deletions、requires_user_approval_for、max_edits_per_round)和/citation-audit --soft-only(当 bib 被冻结时,将 KEEP/FIX/REPLACE/REMOVE 裁决转换为文本重写提案;幻觉引用获得drop_cite_in_body_only动作)。主RESUBMIT_REPORT.json账本遵循shared-references/assurance-contract.md;7 种裁决失败模式表,包括USER_DECISION运行时状态。 - 2026-05-05 —
🗡
/kill-argument— 理论论文的对抗性攻击-裁决评审 (#206)。两个全新的 codex 5.5 + xhigh 线程:线程 1 撰写一位资深领域主席可能提出的最强 200 字拒稿备忘录;线程 2(独立裁决者,非辩护者)阅读当前论文并将每个拒稿点分类为answered_by_current_text/partially_answered/still_unresolved,附上 file:line 证据。输出:KILL_ARGUMENT.{md,json},仅检测。作为/paper-writing的阶段 5.6(在 claim-audit 和 citation-audit 之间)集成,并作为/auto-paper-improvement-loop步骤 5.5 调用的规范实现——替换两处的内联 prompt。对于理论密集型/范围密集型论文,在assurance: submission时强制运行;对于无范围声明的实证论文,发出NOT_APPLICABLE。审计 JSON 与verify_paper_audits.sh兼容(完整 schema 遵循shared-references/assurance-contract.md,6 状态裁决)。捕获基于分数的评审遗漏的失败模式:当每个局部组件都正确(数字匹配、引用可解析、定理可证明)但论文仍然过度推销其实际建立的内容时。 - 2026-05-04 —
🪲
/research-wiki和 8 个调用技能现在通过回退链解析 helper (#204)。Bug:运行bash tools/install_aris.sh后,helper 位于.aris/tools/research_wiki.py(符号链接),但技能硬编码了tools/research_wiki.py并在调用时静默失败——在完整的 W1 运行中research-wiki/保持为空。修复:3 层链 (.aris/tools/→tools/→$ARIS_REPO/tools/) 在shared-references/wiki-helper-resolution.md中规范化。在<project>/tools/research_wiki.py的手动复制变通方法是第 2 层,因此通过cp安装 helper 作为临时修复的用户继续工作。⚠️ 现有用户:重新运行bash tools/install_aris.sh一次——还会在 helper 中获取一个单独的 Python 3.9ImportError修复。 - 2026-05-03 —
🎨 写作端技能的可选
— style-ref: <source>(#202)。/paper-{plan,write,writing,illustration,poster,slides}、/grant-proposal和/auto-paper-improvement-loop接受一个可选的— style-ref: <source>参数,该参数模仿参考论文的结构风格(章节排序、定理/图表密度、句子节奏、引用风格)而不复制其散文、声明或术语。来源:本地.tex目录/文件、本地 PDF、arXiv id (2501.12345或arxiv:2501.12345)、HTTP/HTTPS URL。Overleaf URL/ID 被拒绝——首先通过/overleaf-sync setup <id>克隆。默认关闭;当标志不存在时,现有行为不变。审稿人/审计员子技能(/proof-checker、/paper-claim-audit、/citation-audit、改进循环审稿人)永远不会看到 style ref——保持跨模型评审独立性。⚠️ 现有 ARIS 用户:helper 随tools/extract_paper_style.py一起提供,通过.aris/tools符号链接分发(install_aris.sh阶段 0,在 #192 中添加)。重新运行bash tools/install_aris.sh一次以刷新符号链接并获取 helper。手动回退:cp <ARIS-repo>/tools/extract_paper_style.py <your-project>/tools/。如果两者都不存在,写作技能将以清晰的错误信息中止,指向此处。 - 2026-05-02 —
🪨 社区亮点:rosetta 由 @SyntaxSmith 贡献。从 Node 通过 Chrome CDP Fetch 拦截 + WebSocket 第二段流式传输,以编程方式访问 ChatGPT Pro /
gpt-5.5-pro/ DeepResearch;附带一个用于 Claude Code / Codex / Cline 的 MCP 服务器。对于调用— reviewer: oracle-pro的 ARIS 用户,这是 Oracle MCP 的替代实现路径——相同目标能力(Pro 级审稿人),不同机制。收录于 Awesome Community Skills & Extensions。🌟 如果你正在使用它! - 2026-05-02 —
💎🧿 模型和 MCP 路由更新。(a)
/gemini-search默认升级到gemini-3-pro-preview(最强 Gemini,开箱即用)。⚠️ 需要操作:需要gemini-cliv0.40+(运行gemini --version;如果版本较旧,使用npm i -g @google/gemini-cli升级)。旧版覆盖:/gemini-search "topic" — model: gemini-2.5-pro。其他覆盖:gemini-3-flash-preview(更快)、auto-gemini-3(负载路由)。(b)/idea-discovery阶段 1 现在默认在其文献调查中包含 Gemini (#199)——除非用户传递了显式的— sources:,否则自动注入— sources: all, gemini到/research-lit;如果未安装gemini-cli,则优雅跳过。(c) Oracle MCP 上游 PR 队列 (steipete/oracle/pulls) 是调用— reviewer: oracle-pro(尤其是o3-deep-research/gpt-5.5-pro)时的第一个分流点——ARIS 不提供 Oracle MCP;如果行为出乎意料,请先检查上游 (reviewer-routing.md) - 2026-05-02 —
🛠️🔗 工具基础设施迁移已开始。(a)
install_aris.sh创建可选的.aris/tools符号链接 (#192,关闭 #174)——4 步工具稳定性计划 (#174 → #176 → #177 → #178) 的阶段 0;幂等,重新运行前零影响。(b)/experiment-queue编排路径已修复 (#193)——符号链接的第一个真实用户;通过 3 轮 Codex MCPgpt-5.5xhigh 审计修复了 7 个级联 bug。纯散文 + docstring;queue_manager.py逻辑未触及。Windowsinstall_aris.ps1并行更新作为后续任务跟踪 - 2026-05-02 —
🔬 通过快速路径委托 agent 工作流的三个新的可选审计标志 (#187, #188, #189)。
/citation-audit --uncited显示没有\cite{}引用的 bib 条目(仅检测)。/proof-checker --deep-fix在阶段 1 审稿人 prompt 中添加修复级计划(修正后的陈述 / 补丁计划 / 闭合测试 + Schur/二次型代数健全性检查)。/proof-checker --restatement-check添加阶段 3.6 跨位置定理漂移检测(6 种漂移特征)。标志未设置时行为零变化。加上文档 PR #190 (thread-policy) + #191 (auto-loop xref)。委托 agent + 维护者修复模式;Codex MCPgpt-5.5xhigh 评审捕获了 6+ 个阻塞点 - 2026-05-01 —
🔍
/research-lit的 Gemini + OpenAlex 文献来源 (#175,社区贡献 by @stdAri)。两个可选来源:/gemini-search(通过jamubc/gemini-mcp-toolMCP 进行 AI 驱动发现)和/openalex(2.5 亿+ 作品开放引用图,无需 API 密钥)。通过— sources: gemini或— sources: openalex触发;默认all时行为零变化(两者均排除)。维护者修复:更正了@google/gemini-clinpm 名称;添加了try/except ImportError+ bash preflight 以在requests缺失时优雅跳过 OpenAlex - 2026-04-30 —
📝
/rebuttal每审稿人线程模式 + 可迁移模式 (SKILL.md)。为 OpenReview 风格会议添加VENUE_MODE(single_document|per_reviewer_thread)、reviewer_priority: pivotal路由、structural_distinction响应模式、5 个审稿人防御性启发式、2 个阶段 5 lint 检查以及严重性缩放的压力轮次。默认VENUE_MODE = single_document保持 ICML 风格行为——现有用户零变化。合并前后经过三轮跨模型评审 - 2026-04-30 —
🪞 Codex 技能镜像重建 + 专用安装/更新链 (#179,社区贡献 by @No-518)。
skills/skills-codex/现在镜像所有 67 个主线技能;将mcp__codex__codex审稿人路径替换为 Codex 原生spawn_agent+send_input。新的tools/install_aris_codex.sh+tools/smart_update_codex.sh处理项目本地符号链接与清单追踪。防漂移:tests/test_codex_skill_mirror.py+tests/test_codex_install_update.py(26 个失败路径)。开放讨论见 #184 - 2026-04-24 —
🎨
/paper-illustration-image2——Codex 原生图像生成作为阶段 2b 插图后端 (#166,社区贡献 by @kbr19-thu 清华)。通过本地 Codex app-server MCP bridge 使用 ChatGPT Plus/Pro 配额——无需GEMINI_API_KEY。通过/paper-writing — illustration: codex-image2触发;默认保持figurespec(行为零变化)。仅异步 API,沙盒写入figures/ai_generated/,符合 integration-contract 的 helper。标记为实验性(Codex debug app-server 上游不稳定) - 2026-04-21 —
📚 研究 Wiki 摄取现在真正工作了 (
research_wiki.py,/research-wiki)。修复用户报告的 bug,其中/research-wiki init使papers/永远为空(ingest子命令没有实现;论文阅读技能没有 wiki 钩子)。新的规范python3 tools/research_wiki.py ingest_paperhelper 负责 slugging / 元数据获取 / 去重 / 页面渲染;所有 6 个论文阅读技能都已连接。通过sync --arxiv-ids或sync --from-file进行手动回填。附带integration-contract.md,正式规定了每个跨技能集成必须遵循的六组件模式 - 2026-04-21 —
🛡️ 保证门控:
— effort: beast | max现在真正运行强制审计 (assurance-contract.md,tools/verify_paper_audits.sh)。修复了在高 effort 下静默跳过/proof-checker//paper-claim-audit//citation-audit的问题。新的assurance轴 (draft|submission) 独立于effort:lite/balanced→draft(行为零变化),max/beast→submission。在 submission 时,3 个审计发出一个带有 6 状态裁决的 JSON 工件;paper-writing阶段 6 运行外部验证器作为真相来源(非零退出阻止最终报告)。SHA256 输入哈希捕获过期的审计。逃生口:— effort: beast, assurance: draft
2026-04-20 — 🩹 项目安装:扁平布局 + 清单追踪——修复了一个真实 bug,其中先前的嵌套安装 (
.claude/skills/aris/) 将技能隐藏在 Claude Code 的斜杠命令发现之外(CC 仅扫描一个目录级别)。在此日期之前运行install_aris.sh的任何人都被静默影响。新的install_aris.sh为每个技能在.claude/skills/<name>创建一个符号链接,将版本化清单写入.aris/installed-skills.txt,并且可重新运行以协调新的/已删除的上游技能。纵深防御:13 条安全规则(无符号链接父目录、精确目标重新验证、slug 正则表达式、原子同目录清单重命名、不覆盖真实文件、基于 mkdir 的可移植锁、用于崩溃恢复的 ADOPT……)。细粒度--adopt-existing/--replace-link标志替换了全有或全无的--force。迁移路径:--from-old用于旧版嵌套符号链接,--migrate-copy keep-user|prefer-upstream用于旧版嵌套复制。smart_update.sh --target-subdir .claude/skills/aris现已弃用,并重定向到install_aris.sh。cp -r覆盖中的过期文件 bug 也已修复(现在安全更新路径使用rm -rf && cp -r)2026-04-19 — 🔗
/overleaf-sync——本地 ARIS 论文目录与 Overleaf 项目之间的双向桥接,通过官方 Overleaf Git bridge (Premium)。让协作者可以继续在 Overleaf Web UI 中编辑,同时 ARIS 审计/编辑流水线(/paper-claim-audit、/citation-audit、/auto-paper-improvement-loop)继续在本地运行。子命令:setup(一次性,由用户驱动,因此 agent 永远不会看到 token)/pull(带 diff 协议——标记半句话、拼写错误、应重新触发审计的声明/引用更改)/push(带确认门控,然后写入共享的 Overleaf 状态)/status(3 路分歧检查)。Token 永远不会接触 agent 或任何文件——通过用户的终端一次性注入 macOS Keychain,然后所有后续 agent 操作无需认证2026-04-19 — 📚
/citation-audit——证据和声明保证栈的第四层也是最后一层(experiment-audit→result-to-claim→paper-claim-audit→citation-audit)。全新的跨族审稿人(通过 Codex MCP 的 gpt-5.4)通过 web/DBLP/arXiv 查找验证每个\cite{...}的三个独立轴:存在性(论文在声明的 arXiv ID/DOI/会议处可解析)、元数据正确性(作者/年份/会议/标题与规范来源匹配)和上下文适当性(被引论文确实建立了其支持的声明——最具诊断性的检查)。每个条目的裁决:KEEP / FIX / REPLACE / REMOVE。自动集成到工作流 3 阶段 5.8 作为提交前的参考文献门控。实证动机:在一次真实投稿运行中,几篇真实论文在它们实际上并不支持的上下文中被引用,并且至少有一个条目带有author = "Anonymous"——这些都没有被仅元数据检查捕获2026-04-17 — 🔀
/experiment-queue集成到工作流 1.5 + research-pipeline——experiment-bridge阶段 4 部署现在根据里程碑作业数量自动路由:≤5 个作业 →/run-experiment,≥10 个作业或阶段依赖 →/experiment-queue(带 OOM 重试、过期屏幕清理、波次转换门控、崩溃安全状态)。新的--- batch: queue覆盖用于全局强制队列模式。来自EXPERIMENT_PLAN.md的大型多种子扫描(例如,36 单元的N × seed × n_train网格)现在无需手动调用队列即可获得适当的编排2026-04-17 — 🔗 项目本地符号链接安装 (解决 #118)——新的推荐默认安装。
bash tools/install_aris.sh自动检测平台 (Claude Code / Codex CLI),创建指向 ARIS 仓库的.claude/skills/aris或.agents/skills/aris符号链接,向CLAUDE.md/AGENTS.md添加一个受管理的<!-- ARIS:BEGIN -->块,告诉 agent 仅使用项目本地技能,并在.aris/skill-source.txt中记录安装元数据。解决了当 ARIS 与 Superpowers / OpenHands / 其他社区包混合在同一个全局技能目录中时的技能冲突问题。PowerShell 版本 (install_aris.ps1) 附带 Windows 的 junction 支持。为.agents/skills/aris(Codex) 项目复制安装添加了smart_update.sh --target-subdir标志;符号链接安装现在正确拒绝smart_update并指导用户执行git pull。全局安装仍受支持,供高级用户使用2026-04-16 — 🎨
/figure-spec——确定性 JSON→SVG 渲染器,打包为一等技能。论文中架构/工作流/流水线/审计级联图的首选默认值。形状感知边缘裁剪 (rect/circle/ellipse/diamond)、自环、曲线边缘、带 CJK 宽度估计的多行标签。可编辑矢量输出,可重现(相同 spec → 相同 SVG),无外部 API。工作流 3 中的阶段 2b 已恢复:illustration: figurespec(新默认值)/gemini/mermaid/false——4 路插图选择器,具有互补优势2026-04-16 — ⚙️
/experiment-queue——用于多种子/多配置 ML 实验的 SSH 作业队列。从真实的 36 单元 NeurIPS 扫描痛点设计:带退避的 OOM 感知重试、过期屏幕清理、波次转换竞态预防、教师→学生阶段依赖、从 JSON 状态恢复的崩溃安全调度器。声明式网格规范自动展开(例如,N × seed × n_train → 36 个作业)。可配置的conda_hook+gpu_free_threshold_mib用于非标准环境。用于 ≥10 个作业;/run-experiment保留用于临时使用2026-04-15 — 🛡️ 论文写作流水线加固——来自真实 NeurIPS 运行的 10 个经验驱动的补丁。
REVIEWER_BIAS_GUARD=true:每轮评审使用全新线程(codex-reply 从 3 膨胀到 8/10)。审稿人独立性协议:不给审稿人提供修复摘要。步骤 4.5 重述回归测试:捕获跨修复轮次的定理漂移。步骤 5.5 杀死论点练习:最终轮理论论文的对抗性攻击/防御。位置感知的 overfull 阻塞。/paper-write中的理论论文一致性检查。通过 DBLP/CrossRef 验证强制参考文献卫生。阶段 5.5 强制最终声明审计作为提交门控。评审追踪协议:完整的 prompt/response 对保存到.aris/traces/,用于审稿人独立性审计 (review-tracing.md,save_trace.sh)。受 @李傲龍 的社区贡献启发2026-04-15 — 🎨 FigureSpec Renderer v2——用于学术论文的确定性 JSON→SVG 图形生成。形状感知边缘裁剪 (rect/circle/ellipse/diamond)、自环、曲线边缘、带 CJK 宽度估计的多行标签、全面验证(类型检查、结构、调色板)。经过 5 轮 Codex 评审 (3/10→7/10)。ARIS 技术报告中的所有架构和工作流图都是使用此流水线生成的。
/paper-illustration技能的新--- mode: vector2026-04-14 — 📋
/paper-claim-audit——零上下文论文到证据验证。没有先前上下文的全新审稿人将论文中的每个数字与原始结果文件进行比较。捕获四舍五入膨胀、最佳种子 cherry-pick、配置不匹配、delta 错误、范围过度声明。自动集成到工作流 3(阶段 4.7)。完成 3 层审计链:/experiment-audit(代码) →/result-to-claim(科学) →/paper-claim-audit(报告)。👁️ 视觉 PDF 评审也已添加到改进循环——审稿人现在看到编译后的 PDF,而不仅仅是 LaTeX 源代码。受 Hermes Agent 启发2026-04-13 — 🧿 通过 Oracle 的 GPT-5.4 Pro——在任何技能上使用
— reviewer: oracle-pro以获得最强可用的审稿人。API 模式(快速)或浏览器模式(免费)。支持:/research-review、/auto-review-loop、/experiment-audit、/proof-checker、/rebuttal、/idea-creator、/research-lit。默认保持 Codex xhigh。未安装 = 零影响。设置 →2026-04-13 — 🔬
/proof-checker——通过跨模型评审进行严格的数学证明验证。20 类别问题分类法、双轴严重性、边条件检查表 (DCT/MCT/Fubini/IFT/...)、反例红队、证明义务账本。自动集成到工作流 3:检测\begin{theorem}并在改进循环之前运行。补充/proof-writer2026-04-10 — ⚡ 工作量级别——
— effort: lite | balanced | max | beast。控制所有技能的工作强度:找到的论文、生成的想法、评审轮次、写作深度。Codex 推理始终保持xhigh。beast= 所有旋钮调到最大,用于顶级会议冲刺。默认balanced= 现有用户零变化。详情 →2026-04-10 — 🔎 DeepXiv 集成——通过 DeepXiv CLI 进行渐进式论文检索。可选:
— sources: deepxiv或— sources: all, deepxiv。分阶段阅读:搜索 → 简介 → 头部 → 章节。pip install deepxiv-sdk以启用。社区贡献 by @DreamEnding2026-04-10 — 🛡️
/experiment-audit——跨模型实验完整性验证。GPT-5.4 直接读取你的评估脚本和结果,检查虚假 ground truth、自归一化分数、幻影结果和范围膨胀 (#131, #57)。咨询性——大声警告,从不阻塞。/result-to-claim如果存在则自动读取审计。新的 experiment-integrity.md 共享参考。执行者绝不能评判自己的完整性。2026-04-10 — 🧠
tools/smart_update.sh——智能技能更新器。比较本地与上游,检测个人自定义(服务器路径、API 密钥),仅更新安全的技能。bash tools/smart_update.sh --apply2026-04-10 — 🏆 社区论文:UAV-CC——第一份带有完整 PDF 存档的社区论文。UAV 变化字幕基准,用于 IEEE TGRS,作者 @wxx827。技术栈:Claude Opus 4.6 + Codex 5.4 xhigh + Cursor。论文现在存档在
community_papers/2026-04-08 — 📚
/research-wiki——受 Karpathy's LLM Wiki 启发的持久化研究知识库。在整个研究生命周期中积累论文、想法、实验和声明,并带有类型化关系。/research-lit(摄取论文)、/idea-creator(读取 wiki + 写回想法)和/result-to-claim(更新声明状态 + 触发重新构思)中的 Wiki 感知钩子。失败的想法成为反重复记忆。ARIS 现在从错误中学习。2026-04-05 — 🧬
/meta-optimize——ARIS 的外循环 harness 优化。通过 Claude Code hooks 被动记录技能调用、工具调用、失败和参数覆盖。运行/meta-optimize以分析累积的使用数据并提出 SKILL.md 改进——审稿人门控、用户批准。受 Meta-Harness (Lee et al., 2026) 启发。ARIS 现在优化自身。2026-04-04 — 🔧 Codex Plugin 深度集成——当实验失败(工作流 1.5)或 LaTeX 无法编译(工作流 3)时,
/codex:rescue现在自动调用。GPT 在 Claude 重试之前独立诊断 bug——两个 AI 调试器胜过一个。可选:codex exec驱动噩梦评审,/codex:rescue驱动自动调试。设置 →2026-04-03 — ☁️ Modal serverless GPU——没有 GPU?在 CLAUDE.md 中设置
gpu: modal,一个命令 (modal run launcher.py),无需 SSH、无需 Docker、自动缩放到零。每月 $30 免费额度——足以在没有任何硬件的情况下尝试 ARIS 实验。pip install modal && modal setup即可开始。社区贡献 by @zeyuzhangzyz2026-04-03 — 🎮 审稿人难度级别——
medium(默认,不变)、hard(审稿人记忆 + 辩论协议)、nightmare(GPT 通过codex exec直接读取仓库——Claude 无法隐藏任何东西)。— difficulty: nightmare用于提交前的最大压力测试2026-03-30 — 🔥 自动调试与耗尽前不投降——experiment-bridge 自动诊断失败(OOM、导入、CUDA、NaN)并重试最多 3 次。受 PUA 启发
2026-03-30 — ☁️ Vast.ai GPU 租赁——
gpu: vast自动租赁最便宜的 GPU。作者 @YIHONG-JIN。🔧 MiniMax M2.7 升级 by @octo-patch2026-03-27 — 📄 IEEE 会议支持 (9 个系列)。🔎 Semantic Scholar。作者 @ypd666
2026-03-26 — 📄 基于文档的输入——
RESEARCH_BRIEF.md自动检测2026-03-24 — 📝 工作流 4:
/rebuttal——7 阶段流水线,3 道安全门2026-03-23 — 🔧
/training-check、/result-to-claim、/ablation-planner已集成。📦compact模式。作者 @JingxuanKang & @couragec2026-03-22 — 📋 模板——每个工作流的输入模板。📄 7 个会议模板——CVPR、ACL、AAAI、ACM MM 已添加。🛡️ 反幻觉修复——工作流 2 强制执行 DBLP → CrossRef → [VERIFY]。🔗
base repo——克隆 GitHub 仓库作为基础代码库(— base repo: https://github.com/org/project)2026-03-22 — 🔍 Codex + Gemini 评审指南——Codex 执行,Gemini 通过本地
gemini-reviewMCP bridge 评审。CN2026-03-20 — 🚀 Antigravity 适配指南——在 Google Antigravity (agent-first IDE) 中使用 ARIS 技能。社区贡献 by @PeppaPigw
2026-03-20 — 🖥️ Trae 适配指南——在 Trae (字节跳动 AI IDE) 中使用 ARIS 技能。社区贡献 by @Prometheus-cotigo。🔢
formula-derivation——社区贡献 by @Falling-Flower2026-03-19 — 🖼️
paper-poster——会议海报。社区贡献 by @dengzhe-hou2026-03-19 — 🔗 工作流 1.5 升级——
/experiment-bridgeGPT-5.4 代码评审。📊 W&B 修复2026-03-18 — 🎤
paper-slides+ 🔁 Codex+Claude bridge + 🖱️ Cursor 指南 + 🤖 Codex CLI 技能 + 📝grant-proposal+ 🎨paper-illustration(Gemini) + 📊 CitationClaw2026-03-17 — 🔧 Git 代码同步 + 🆓 ModelScope 指南 + 参数传递
2026-03-16 — 🔬
research-refine+experiment-plan——将模糊想法转化为以问题锚定的提案,并附带声明驱动的实验路线图。现已集成到工作流 1 (/idea-discovery)。社区贡献 by @zjYao362026-03-16 — 🇨🇳 阿里云 Coding Plan 指南——一个 API 密钥,4 个模型 (Kimi-K2.5 + Qwen3.5+ + GLM-5 + MiniMax-M2.7),双端点设置。社区贡献 by @tianhao909
2026-03-15 — 🔀 自带模型! 任何 OpenAI 兼容 API 现在都可以通过
llm-chatMCP 服务器作为审稿人工作。GLM、MiniMax、Kimi、LongCat、DeepSeek 均已测试——无需 Claude 或 OpenAI API2026-03-15 — 🐾 OpenClaw 适配指南——在 OpenClaw 中使用 ARIS 研究工作流,无需 Claude Code 斜杠技能
2026-03-15 — 📐
proof-writer——用于严格定理证明起草的社区技能。📚 反幻觉引用——/paper-write现在从 DBLP/CrossRef 获取真实 BibTeX,而不是 LLM 生成的条目——默认开启,零安装2026-03-14 — 📱 飞书/Lark 集成:三种模式(关闭/推送/交互式),实验、评审和检查点的移动通知
2026-03-13 — 🛑 人在回路中:所有工作流中可配置的
AUTO_PROCEED检查点。完全自动驾驶或逐步批准2026-03-12 — 🔗 Zotero + Obsidian + 本地 PDF + arXiv/Scholar:带跨模型新颖性验证的多源文献搜索
2026-03-12 — 🚀 三个端到端工作流完成:一个 prompt → 顶级会议风格论文。
/research-pipeline链式连接想法发现 → 自动评审 → 论文写作,全自动2026-03-12 — 📝
/paper-writing工作流:叙事报告 → 结构化大纲 → 图表 → LaTeX → 编译 PDF → 2 轮自动改进 (4/10 → 8.5/10)
🚀 快速开始
# 1. 安装技能
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git
mkdir -p ~/.claude/skills/ # 如果不存在则创建(新的 Claude Code 版本)
cp -r Auto-claude-code-research-in-sleep/skills/* ~/.claude/skills/
# 1b. 更新技能(当上游有新版本时)
cd Auto-claude-code-research-in-sleep && git pull
bash tools/smart_update.sh # 试运行:显示新增/更改/安全的内容
bash tools/smart_update.sh --apply # 应用:添加新的 + 更新安全的
# 可选的 Codex 镜像管理项目安装
bash tools/install_aris_codex.sh ~/your-codex-project
# 管理的 Codex 项目更新
cd Auto-claude-code-research-in-sleep && git pull
bash tools/install_aris_codex.sh ~/your-codex-project --reconcile
# 仅限复制的 Codex 安装(不适用于由 install_aris_codex.sh 安装的项目)
bash tools/smart_update_codex.sh --local ~/.codex/skills
bash tools/smart_update_codex.sh --local ~/.codex/skills --apply
# 2. 设置 Codex MCP(用于评审技能)
npm install -g @openai/codex
codex setup # 提示时将模型设置为 gpt-5.4
claude mcp add codex -s user -- codex mcp-server
# 3. 在 Claude Code 中使用
claude
> /idea-discovery "your research direction" # 工作流 1 — 要具体!不是 "NLP" 而是 "factorized gap in discrete diffusion LMs"
> /experiment-bridge # 工作流 1.5 — 有计划?实现 + 部署 + 收集结果
> /auto-review-loop "your paper topic or scope" # 工作流 2:评审 → 修复 → 隔夜重新评审
> /paper-writing "NARRATIVE_REPORT.md" # 工作流 3:叙事 → 润色 PDF
> /rebuttal "paper/ + reviews" — venue: ICML # 工作流 4:解析评审 → 起草反驳 → 后续
> /research-pipeline "your research direction" # 完整流水线:工作流 1 → 1.5 → 2 → 3 端到端
> /research-wiki init # 📚 启用持久化研究记忆(一次性)
> /meta-optimize # 元:分析使用日志 → 提出技能改进
📚 研究 Wiki(可选): 为 ARIS 提供跨会话的持久化记忆。论文、想法、失败的实验——都不会被遗忘:
# 在 Claude Code 中: > /research-wiki init # 在你的项目中创建 research-wiki/ # 就这样。从现在开始,/research-lit 自动摄取论文,/idea-creator 在头脑风暴前 # 读取 wiki(并将想法写回),/result-to-claim 更新声明状态。失败的想法成为 # 未来构思的反重复记忆。完整指南请参见研究 Wiki。
🧬 元优化(可选): 在你的普通终端(而不是 Claude Code 内部)运行以下命令以启用被动使用日志记录:
# 在你的项目目录中一次性设置 mkdir -p .claude .aris/meta tools/meta_opt cp Auto-claude-code-research-in-sleep/templates/claude-hooks/meta_logging.json .claude/settings.json cp Auto-claude-code-research-in-sleep/tools/meta_opt/*.sh tools/meta_opt/ chmod +x tools/meta_opt/*.sh # 然后启动 Claude Code — hooks 立即生效 claude事件被记录到项目级别 (
.aris/meta/events.jsonl) 和全局 (~/.aris/meta/events.jsonl) 日志中。在 5+ 次工作流运行后,运行/meta-optimize以查看数据驱动的改进提案。使用/meta-optimize --global分析所有项目的趋势。详情请参见工作流 M。
📝 模板可用! 参见
templates/获取每个工作流的即用输入模板——研究简报(工作流 1)、实验计划(工作流 1.5)、叙事报告(工作流 3)、论文计划(工作流 3)。🔎 可选:DeepXiv 渐进式检索
pip install deepxiv-sdk然后直接使用
/deepxiv或通过/research-lit的— sources: deepxiv或— sources: all, deepxiv选择加入。🔎 可选:Exa AI 驱动的网络搜索
pip install exa-py export EXA_API_KEY=your-key-here然后直接使用
/exa-search或通过/research-lit的— sources: exa或— sources: all, exa选择加入。涵盖博客、文档、新闻和研究论文,内置内容提取。🗑️ 卸载: 要移除 ARIS 技能而不影响你自己的个人技能:
cd Auto-claude-code-research-in-sleep && ls skills/ | xargs -I{} rm -rf ~/.claude/skills/{}
提示: 所有流水线行为均可通过内联覆盖进行配置——将
— key: value附加到任何命令:
参数 默认值 作用 AUTO_PROCEEDtrue在想法选择门控处自动继续。设置为 false以手动选择要追求的想法,然后再投入 GPU 时间human checkpointfalse在每轮评审后暂停,以便你可以阅读分数、给出自定义修改说明、跳过特定修复或提前停止 sourcesall要搜索的文献来源: zotero、obsidian、local、web、semantic-scholar、deepxiv、exa或all。注意:semantic-scholar、deepxiv和exa必须显式列出——不包含在all中arxiv downloadfalse在文献调查期间下载最相关的 arXiv PDF。当为 false时,仅获取元数据(标题、摘要、作者)DBLP_BIBTEXtrue从 DBLP/CrossRef 获取真实 BibTeX,而不是 LLM 生成的条目。消除幻觉引用。零安装 code reviewtrueGPT-5.4 xhigh 在 GPU 部署前评审实验代码。设置为 false以跳过wandbfalse自动向实验脚本添加 W&B 日志记录。设置为 true并在 CLAUDE.md 中配置wandb_project。/monitor-experiment从 W&B 拉取训练曲线illustrationgemini工作流 3 中的 AI 插图: gemini(默认,需要GEMINI_API_KEY)、mermaid(免费)或false(跳过)venueICLR目标会议: ICLR、NeurIPS、ICML、CVPR、ACL、AAAI、ACM。确定 LaTeX 样式文件和页面限制base repofalse要克隆为基础代码库的 GitHub 仓库 URL(例如, — base repo: https://github.com/org/project)。没有代码?在开源项目之上构建gpulocalGPU 目标: local(默认)、remote(SSH 服务器)或vast(从 Vast.ai 按需租赁——自动配置、自动销毁)compactfalse为短上下文模型和会话恢复生成紧凑摘要文件( IDEA_CANDIDATES.md、findings.md、EXPERIMENT_LOG.md)ref paperfalse要基于其构建的参考论文(PDF 路径或 arXiv URL)。首先总结,然后想法扩展/改进它。与 base repo结合用于论文+代码工作流effortbalanced工作强度: lite(0.4x tokens)、balanced(默认)、max(2.5x)、beast(5-8x)。控制广度/深度/迭代次数。Codex 推理始终xhigh。参见工作量级别reviewercodex审稿人后端: codex(GPT-5.4 xhigh,默认)、oracle-pro(通过 Oracle 的 GPT-5.4 Pro——最强推理)。参见设置 →difficultymedium审稿人对抗级别: medium(默认)、hard(+ 记忆 + 辩论)、nightmare(+ GPT 通过codex exec读取仓库)/research-pipeline "your topic" — AUTO_PROCEED: false # 在想法选择门控处暂停 /research-pipeline "your topic" — human checkpoint: true # 在每轮评审后暂停以提供反馈 /research-pipeline "your topic" — sources: zotero, web # 仅搜索 Zotero + web(跳过本地 PDF) /research-pipeline "your topic" — sources: all, deepxiv # 默认来源加上 DeepXiv 渐进式检索 /research-pipeline "your topic" — sources: all, exa # 默认来源加上 Exa AI 驱动的网络搜索 /research-pipeline "your topic" — arxiv download: true # 在文献调查期间下载最相关的 arXiv PDF /research-pipeline "your topic" — difficulty: nightmare # 提交前的最大对抗性评审 /research-pipeline "your topic" — effort: beast # 所有旋钮调到最大——顶级会议冲刺 /research-pipeline "your topic" — effort: beast, reviewer: oracle-pro # beast + GPT-5.4 Pro 审稿人——终极模式 /research-pipeline "your topic" — effort: lite # 快速探索,节省 tokens /research-pipeline "your topic" — effort: max, review_rounds: 3 # 最大 effort 但将评审限制在 3 轮 /research-pipeline "your topic" — AUTO_PROCEED: false, human checkpoint: true # 组合选项 /proof-checker "paper/" — reviewer: oracle-pro # Pro 级证明验证
重要: Codex MCP 使用
~/.codex/config.toml中的模型,而不是技能文件中的模型。确保它显示model = "gpt-5.4"(推荐)。其他选项:gpt-5.3-codex、gpt-5.2-codex、o3。运行codex setup或直接编辑文件。
想要 Codex 执行但 Claude Code 评审? 参见
docs/CODEX_CLAUDE_REVIEW_GUIDE.md。该路径安装基础skills/skills-codex/*,然后覆盖skills/skills-codex-claude-review/*,并将评审密集型技能通过本地claude-reviewMCP bridge 路由。
想要 Codex 执行但 Gemini 本地评审? 参见
docs/CODEX_GEMINI_REVIEW_GUIDE.md和 CN。该路径安装基础skills/skills-codex/*,然后覆盖skills/skills-codex-gemini-review/*,并将审稿人感知的预定义技能通过本地gemini-reviewMCP bridge 路由,默认使用直接 Gemini API。
想要 Codex 镜像安装链? 使用
tools/install_aris_codex.sh进行管理的项目安装,使用tools/smart_update_codex.sh进行复制的 Codex 安装。Claude 脚本仍然是 Claude 项目的主线入口点。
详情请参见完整设置指南,如果你没有 Claude/OpenAI API,请参见替代模型组合。
🧠 稍后更新技能? 智能更新分析哪些是安全的:
cd Auto-claude-code-research-in-sleep git pull bash tools/smart_update.sh # 试运行:显示新增/更改/安全的内容 bash tools/smart_update.sh --apply # 应用:添加新的 + 更新安全的比较本地技能与上游,检测个人自定义(服务器路径、API 密钥等),并且仅更新安全可替换的技能。包含你个人信息的技能会被标记为手动审查。
✨ 特性
📊 31 个可组合技能——混合搭配,或链接成完整流水线(
/idea-discovery、/auto-review-loop、/paper-writing、/research-pipeline)🔍 文献与新颖性——多源论文搜索(Zotero + Obsidian + 本地 PDF + arXiv/Scholar)+ 跨模型新颖性验证
💡 想法发现——文献调查 → 头脑风暴 8-12 个想法 → 新颖性检查 → GPU 试点实验 → 排名报告
🔄 自动评审循环——4 轮自主评审,隔夜从 5/10 到 7.5/10,附带 20+ GPU 实验
📝 论文写作——叙事 → 大纲 → 图表 → LaTeX → PDF → 自动评审 (4/10 → 8.5/10),一个命令。通过 DBLP/CrossRef 的反幻觉引用
🤖 跨模型协作——Claude Code 执行,GPT-5.4 xhigh 评审。对抗性,而非自对弈。可选升级:通过 Oracle 的
— reviewer: oracle-pro用于 GPT-5.4 Pro(最强推理)📝 同行评审——作为会议审稿人评审他人的论文,附带结构化评分和元评审
🖥️ 评审驱动的实验——当 GPT-5.4 说"运行消融实验"时,Claude Code 自动编写脚本,rsync 到你的 GPU 服务器,在 screen 中启动,收集结果,并将其折叠回论文。只需在
CLAUDE.md中配置你的服务器(设置指南)。没有 GPU? 使用gpu: vast从 Vast.ai 按需租赁一个🔀 灵活的模型——默认 Claude × GPT-5.4,也支持 GLM、MiniMax、Kimi、LongCat、DeepSeek 等——无需 Claude 或 OpenAI API
🛑 人在回路中——在关键决策点可配置的检查点。
AUTO_PROCEED=true用于完全自动驾驶,false用于批准每一步📱 飞书/Lark 通知——三种模式:关闭(默认,强烈推荐给大多数用户)、仅推送(webhook,移动端提醒)、交互式(从飞书批准/拒绝)。未配置时零影响
仅推送——群聊卡片(实验完成、检查点、错误、流水线完成):
交互式——与 Claude Code 的私聊(批准/拒绝、自定义指令):
📚 研究 Wiki——持久化知识库,在研究生命周期中积累论文、想法、实验和声明。失败的想法成为反重复记忆。ARIS 从错误中学习,每次运行都变得更聪明。受 Karpathy's LLM Wiki 启发
🧩 可扩展——欢迎领域特定技能!添加一个
SKILL.md并打开 PR。参见社区技能如dse-loop(架构/EDA)
📈 分数进展(真实运行)
一个 ML 研究项目上真实的隔夜 4 轮运行,从边缘拒稿到可提交:
| 轮次 | 分数 | 发生了什么 |
|---|---|---|
| 初始 | 5.0/10 | 边缘拒稿 |
| 第 1 轮 | 6.5/10 | 添加了标准指标,发现了指标解耦 |
| 第 2 轮 | 6.8/10 | 关键声明未能复现,调整了叙事 |
| 第 3 轮 | 7.0/10 | 大规模种子研究杀死了主要改进声明 |
| 第 4 轮 | 7.5/10 ✅ | 诊断证据得到巩固,可提交 |
该循环自主运行了 20+ GPU 实验,重写了论文的叙事框架,并杀死了不成立的声明——全部无需人工干预。
🏆 社区展示——使用 ARIS 构建的论文
端到端使用 ARIS 流水线生成投稿手稿的真实项目。除非某行明确说明,否则本节不声称官方录用: 评分和引用的裁决是来自 CSPaper 和 Stanford Agentic Reviewer 等工具的 AI/第三方评审信号,而非会议决定。一个重要注意事项:ARIS 旨在通过 AI 评审循环进行优化,因此升高的 AI 评审分数是工作流的正常结果,而非独立接受的证明。人类审稿人仍然可以带来更新的文献知识、社区背景、会议特定偏好以及 AI 审稿人未建模的反对意见。如果你使用 ARIS 完成了一篇论文,我们很乐意在此展示——请打开 issue 或 PR!
| 论文 | AI 评审信号 | 提交状态 | 构建者 | 备注 |
|---|---|---|---|---|
| CS 论文投稿 | CSPaper 8/10 — AI 审稿人推荐:"Top 50% of accepted papers, clear accept" | 已投稿至某 CS 会议;等待官方反馈 | @DefanXue & @Monglitay | 完整 ARIS 流水线:想法 → 实验 → 自动评审 → 论文写作。引文来自 CSPaper 的模拟评审,而非官方会议评审。 |
| AAAI 2026 论文投稿 | Stanford Agentic Reviewer 7/10 — AI 审稿人推荐:"Good paper, accept" | 已投稿至 AAAI 2026 Main Technical;等待官方决定 | @xinbo820-web | 纯 Codex CLI (ARIS-Codex skills)。7/10 信号来自 AAAI 风格的 Stanford Agentic Reviewer 运行,而非官方 AAAI 录用结果。 |
| UAV-CC | 审稿中 | 已投稿至 IEEE TGRS | @wxx827 | UAV 变化字幕基准。Claude Opus 4.6 (执行器) + Codex GPT-5.4 xhigh (审稿人) + Cursor Opus 4.6 (辅助)。PDF → |
使用 ARIS 构建的论文——从想法到投稿。知道更多?请告诉我们!
🧩 Awesome 社区技能与扩展
社区贡献的领域特定技能和外部项目。欢迎 PR——只需添加一个 skills/your-skill/SKILL.md 并打开 PR!
💡 如何使用: 社区技能不会自动接入核心工作流。要使用一个,请让你的执行器(Claude Code / OpenClaw 等)读取技能的
SKILL.md,然后根据下面的描述将其插入到适当的工作流阶段。
🎉 社区技能 (13): research-refine · experiment-plan · grant-proposal · paper-poster · paper-slides · mermaid-diagram · proof-writer · comm-lit-review · dse-loop · idea-discovery-robot · formula-derivation · paper-illustration · writing-systems-papers
🌐 外部项目与文档 (12): rosetta · open-source-hardening-skills · CitationClaw · auto-hparam-tuning · paper-to-course · Antigravity Adaptation Guide · OpenClaw Adaptation Guide · Cursor Adaptation Guide · Codex+Claude Review Bridge · Trae Adaptation Guide · paper-illustration · MiniMax-AI/cli
🙌 感谢每一位贡献者!我们将下面的表格折叠以保持 README 可读——但这里的每个技能和项目都同样受到重视。PR 永远欢迎!
| 名称 | 领域 | 描述 | Codex MCP? |
|---|---|---|---|
🔬 research-refine |
通用 | 将模糊想法转化为以问题锚定的、面向实现的方法提案。最好插入在 /idea-discovery 和 /auto-review-loop 之间 |
是 |
🧪 experiment-plan |
通用 | 将精炼的提案转化为声明驱动的实验路线图,附带消融实验、预算和运行顺序 | 否 |
🧭 research-refine-pipeline |
通用 | 一次性链:/research-refine → /experiment-plan,用于方法精炼加实验规划 |
是 |
📝 grant-proposal |
通用 | 基金提案起草 (KAKENHI/NSF/NSFC/ERC/DFG/SNSF/ARC/NWO)。链式连接 /research-lit → /novelty-check → /research-review → /paper-illustration |
是 |
🎤 paper-slides |
通用 | 会议演讲幻灯片 (beamer → PDF + PPTX),附带演讲者备注、完整演讲脚本 + Q&A 准备。根据演讲类型自动计算幻灯片数量 | 是 |
🖼️ paper-poster |
通用 | 会议海报 (article + tcbposter → A0/A1 PDF + 组件 PPTX + SVG)。会议特定颜色、视觉评审循环、Codex MCP 评审 | 是 |
📐 proof-writer |
ML 理论 | 严格的定理/引理证明起草——可行性分类、依赖图、诚实的阻塞报告 | 否 |
📡 comm-lit-review |
通信/无线 | 领域特定文献综述——IEEE/ACM/ScienceDirect 优先、会议分级、PHY/MAC/transport/NTN 分类法 | 否 |
🏗️ dse-loop |
架构/EDA | 自主设计空间探索——迭代运行、分析和调整参数 (gem5, Yosys 等) | 否 |
🤖 idea-discovery-robot |
机器人/具身 AI | 工作流 1 适配——将想法发现扎根于具身、基准、sim2real 路径和真实机器人安全约束 | 是 |
📐 mermaid-diagram |
通用 | Mermaid 图表 (20+ 种类型)——paper-illustration 的免费替代方案,无需 API 密钥 |
否 |
🔢 formula-derivation |
通用 | 研究公式开发——推导、验证和 LaTeX 格式化 | 否 |
🖥️ writing-systems-papers |
系统 | 10-12 页系统论文 (OSDI/SOSP/ASPLOS/NSDI/EuroSys) 的段落级蓝图——页面分配、写作模式、自我检查 | 是 |
| 名称 | 领域 | 描述 |
|---|---|---|
| 🪨 rosetta | Pro 级 ChatGPT MCP | 从 Node 通过 Chrome CDP Fetch 拦截 + WebSocket 第二段流式传输,以编程方式访问 ChatGPT Pro / gpt-5.5-pro / DeepResearch。附带一个用于 Claude Code / Codex / Cline 的 MCP 服务器——Oracle MCP 的替代实现路径,用于 — reviewer: oracle-pro 风格的高级别评审。支持多轮、并行并发、实时 token delta、15 分钟空闲超时看门狗(长 Pro 思考存活)。MIT,作者 @SyntaxSmith |
| 🛡️ open-source-hardening-skills | DevOps / OSS | 10 技能流水线,将研究代码加固为生产就绪的开源项目——审计、重构、测试、CI、文档、评审 |
| 📊 CitationClaw | 通用 | 引用影响分析——输入论文标题 → 引用爬取、学者识别、分层分析、HTML 仪表板 |
| 🚀 Antigravity Adaptation Guide | 通用 | 在 Google Antigravity 中使用 ARIS 技能——原生 SKILL.md 支持、双模型 (Claude Opus 4.6 / Gemini 3.1 Pro)、MCP 设置、EN + CN 指南 |
| 🐾 OpenClaw Adaptation Guide | 通用 | 在 OpenClaw 中使用 ARIS 工作流方法论——技能到阶段映射、基于文件的编排、无需 Claude Code CLI |
| 🖱️ Cursor Adaptation Guide | 通用 | 在 Cursor 中使用 ARIS 技能——@-引用技能、MCP 设置、工作流映射、跨会话状态文件恢复 |
| 🖥️ Trae Adaptation Guide | 通用 | 在 Trae (字节跳动 AI IDE) 中使用 ARIS 技能——EN + CN 指南 |
🎨 paper-illustration |
通用 | 通过 Gemini 的 AI 生成架构图。基于 PaperBanana。集成到工作流 3 |
🤖 skills-codex |
通用 | 主要研究技能的 Codex CLI 同步包,现在包括 training-check、result-to-claim、ablation-planner、rebuttal,以及 shared-references/ 支持目录 |
| 🎛️ auto-hparam-tuning | 通用 | 自动超参数调优——AI agent 读取项目、规划策略、运行实验、分析 TensorBoard、从结果中学习。基于 Hydra |
| 🔁 Codex+Claude Review Bridge | 通用 | Codex 执行 + Claude 通过本地 claude-review MCP bridge 评审,带异步轮询 |
| 📚 paper-to-course | 教育 | 将研究论文 (PDF/LaTeX) 转换为交互式六模块 HTML 课程,附带公式分解、文献时间线、测验和词汇表工具提示——单个捆绑文件,无需服务器 |
| 🤖 MiniMax-AI/cli | 通用 | 官方 MiniMax CLI——文本、图像、视频、语音和音乐生成 + 网络搜索。skill/SKILL.md 遵循 agentskills.io 标准。即插即用,用于 Alt B (MiniMax 审稿人) 设置 |
🔄 工作流
这些技能组合成一个完整的研究生命周期。四个工作流可以独立使用或链接在一起:
- 探索新领域(例如,撰写综述)? 从工作流 1 开始 →
/idea-discovery - 有计划,需要实现和运行? 工作流 1.5 →
/experiment-bridge - 已有结果,需要迭代改进? 工作流 2 →
/auto-review-loop - 准备好写论文了? 工作流 3 →
/paper-writing(或逐步:/paper-plan→/paper-figure→/paper-write→/paper-compile→/auto-paper-improvement-loop) - 收到评审意见了?需要反驳? 工作流 4 →
/rebuttal——解析评审、起草安全反驳、后续轮次 - 完整流水线? 工作流 1 → 1.5 → 2 → 3 → 提交 → 4 →
/research-pipeline+/rebuttal——从想法到录用 - 希望 ARIS 记住和学习? 📚
/research-wiki init——跨会话的持久化记忆。论文、想法、实验随时间累积 - 希望 ARIS 自我改进? 工作流 M →
/meta-optimize——分析使用日志、提出技能改进、审稿人门控
⚠️ 重要: 这些工具加速研究,但它们不能替代你自己的批判性思维。始终用你的领域专业知识评审生成的想法,质疑假设,并自己做出最终决定。最好的研究来自人类洞察 + AI 执行,而非完全自动驾驶。
完整流水线 🚀
/research-lit → /idea-creator → /novelty-check → /research-refine → /experiment-bridge → /auto-review-loop → /paper-writing → submit → /rebuttal → accept! 🎉
(survey) (brainstorm) (verify novel) (refine method) (implement+deploy) (review & fix) (write paper) (send) (reply to reviewers)
├────────────── Workflow 1: Idea Discovery ──────────────┤ ├ Workflow 1.5 ─┤ ├── Workflow 2 ──┤ ├── Workflow 3 ──┤ ├── Workflow 4 ──┤
📚 research-wiki (persistent memory — papers, ideas, experiments, claims)
↕ reads before ideation, writes after every stage, failed ideas = anti-repetition memory
/meta-optimize (Workflow M — runs independently, improves ARIS itself)
↑ reads .aris/meta/events.jsonl (accumulated from all runs above)
📝 博客文章: 梦中科研全流程开源
工作流 1:想法发现与方法精炼 🔍
"当前技术水平如何?差距在哪里?我们如何解决?"
还没有具体想法?只需给出一个研究方向——/idea-discovery 处理其余部分:
- 📚 调查领域现状(近期论文、开放问题、反复出现的局限性)
- 🧠 头脑风暴 8-12 个具体想法,通过 GPT-5.4 xhigh
- 🔍 过滤可行性、计算成本和快速新颖性搜索
- 🛡️ 验证顶级想法,进行深度新颖性检查 + 魔鬼代言人评审
- 🧪 试点前 2-3 个想法在不同的 GPU 上并行运行(每个 30 分钟 - 2 小时)
- 🏆 排名根据经验信号——具有积极试点结果的想法升至顶部
- 🔬 精炼顶级想法为以问题锚定的提案,通过迭代 GPT-5.4 评审
- 🧪 规划声明驱动的实验,附带消融实验、预算和运行顺序
输出是一个排名的 IDEA_REPORT.md,加上顶级想法的精炼提案 (refine-logs/FINAL_PROPOSAL.md) 和实验计划 (refine-logs/EXPERIMENT_PLAN.md)。死胡同想法也被记录,为未来探索节省时间。
┌─────────────────────────────────────────────────────────────────┐
│ 想法发现与方法精炼 │
│ │
│ /research-lit /idea-creator /novelty-check │
│ (find papers) (brainstorm) (verify novelty) │
│ │ │ │ │
│ ▼ ▼ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 扫描 │───▶│ 生成 │────▶│ 检查 │ │
│ │ 本地 │ │ 8-12 │ │ 想法 │ │
│ │ 论文 + │ │ 想法 │ │ 是否 │ │
│ │ 搜索 │ │ + 排名 │ │ 新颖 │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │ │
│ ▼ ▼ │
│ ┌──────────┐ ┌──────────┐ │
│ │ 过滤 │────▶│ 外部 │ │
│ │ 按成本、 │ │ LLM │ │
│ │ 新颖性 │ │ 评估 │ │
│ └──────────┘ └──────────┘ │
│ │ │
│ /research-refine ▼ │
│ (精炼方法) ┌──────────┐ │
│ │ │ 冻结 │ │
│ ▼ │ 问题 │ │
│ ┌──────────┐ │ 锚点 + │ │
│ │ 迭代 │◀───▶│ 精炼 │ │
│ │ 直到 │ │ 方法 │ │
│ │ 分数≥9 │ └──────────┘ │
│ └──────────┘ │ │
│ │ ▼ │
│ /experiment-plan ┌──────────┐ │
│ │ │ 声明 │ │
│ ▼ │ 驱动的 │ │
│ ┌──────────┐ │ 实验 │ │
│ │ 规划 │────▶│ 路线图 │ │
│ │ 运行 │ └──────────┘ │
│ └──────────┘ │
│ │
│ 典型流程: │
│ 1. /research-lit "discrete diffusion models" │
│ 2. /idea-creator "DLLMs post training" │
│ 3. 评审排名想法,选择前 2-3 个 │
│ 4. /novelty-check "top idea" (深度验证) │
│ 5. /research-review "top idea" (批判性反馈) │
│ 6. /research-refine "top idea" (问题锚点 + 方法) │
│ 7. /experiment-plan (声明驱动的路线图) │
│ 8. /run-experiment → /auto-review-loop │
└─────────────────────────────────────────────────────────────────┘
涉及的技能: research-lit + idea-creator + novelty-check + research-review + research-refine-pipeline
💡 一键快捷方式:
/idea-discovery "your research direction"自动运行此完整工作流。
🔄 人在回路中: 每个阶段呈现结果并等待你的反馈。不满意?告诉它缺少什么——它会精炼 prompt 并重新生成。信任默认值?它会自动继续使用排名最高的选项。你决定参与程度。
⚙️ 试点实验预算(最大小时数、超时时间、GPU 预算)是可配置的——参见自定义。
📝 博客文章: Claude Code 两月 NeurIPS 指北
工作流 1.5:实验桥接 🔗
"我有一个计划。现在实现它、部署它,并给我初步结果。"
已经有一个实验计划(来自工作流 1 或你自己的)?/experiment-bridge 将其转化为运行中的代码:
- 📋 解析实验计划 (
refine-logs/EXPERIMENT_PLAN.md) - 💻 实现实验脚本(重用现有代码,添加适当的 argparse/日志记录/种子)
- 🔍 GPT-5.4 代码评审——跨模型评审在浪费 GPU 小时之前捕获逻辑 bug(
code review: true默认) - ✅ 健全性检查——首先运行最小的实验以捕获运行时 bug
- 🚀 部署完整实验套件到 GPU,通过
/run-experiment - 📊 收集初步结果并更新实验追踪器
┌─────────────────────────────────────────────────────────────────┐
│ 工作流 1.5:实验桥接 │
│ │
│ EXPERIMENT_PLAN.md │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ Claude │────▶│ GPT-5.4 │────▶│ 健全性 │ │
│ │ Code │ │ xhigh │ │ 检查 │ │
│ │ 编写 │ │ 评审 │ │ (1 GPU) │ │
│ │ 代码 │ │ 代码 │ │ │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 收集 │◀────│ 监控 │◀────│ 部署 │ │
│ │ 结果 │ │ │ │ │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │
│ 典型流程: │
│ 1. /experiment-bridge (解析 EXPERIMENT_PLAN.md) │
│ 2. Claude Code 编写实验脚本 │
│ 3. GPT-5.4 评审代码(捕获逻辑 bug) │
│ 4. 健全性检查(最小实验) │
│ 5. 部署到 GPU 服务器 │
│ 6. 收集结果 → 更新 EXPERIMENT_LOG.md │
└─────────────────────────────────────────────────────────────────┘
涉及的技能: experiment-bridge + run-experiment + experiment-audit
💡 一键快捷方式:
/experiment-bridge自动运行此工作流。
🔄 人在回路中: 在代码评审和部署阶段暂停以获取你的批准。
AUTO_PROCEED=true跳过暂停。
⚙️ GPU 服务器配置在
CLAUDE.md中——参见设置指南。
工作流 2:自动评审循环 🔄
"我的论文有多好?如何让它更好?"
已有结果和草稿?/auto-review-loop 迭代改进它:
- 📝 解析当前论文(LaTeX 或叙事报告)
- 🔍 GPT-5.4 xhigh 评审——结构化评分(5 个维度:新颖性、质量、清晰度、可复现性、重要性)
- 🛠️ Claude Code 修复——根据评审意见修复弱点
- 🔄 重复直到分数稳定或达到最大轮次
- 📊 报告分数进展和剩余弱点
┌─────────────────────────────────────────────────────────────────┐
│ 工作流 2:自动评审循环 │
│ │
│ 论文 (LaTeX/叙事) │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ GPT-5.4 │────▶│ Claude │────▶│ 分数 │ │
│ │ xhigh │ │ Code │ │ 稳定? │ │
│ │ 评审 │ │ 修复 │ │ │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │ │ │
│ ▼ ▼ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 结构化 │ │ 修复 │ │ 是 → │ │
│ │ 评分 │ │ 弱点 │ │ 最终报告 │ │
│ │ (5 维度) │ │ │ │ │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │
│ ▼ │
│ ┌──────────┐ │
│ │ 分数进展 │ │
│ │ + 剩余 │ │
│ │ 弱点 │ │
│ └──────────┘ │
│ │
│ 典型流程: │
│ 1. /auto-review-loop "paper/" (解析论文目录) │
│ 2. GPT-5.4 评审 → 结构化评分 + 具体反馈 │
│ 3. Claude Code 修复弱点 │
│ 4. 重复直到分数稳定或达到最大轮次 │
│ 5. 最终报告:分数进展 + 剩余弱点 │
└─────────────────────────────────────────────────────────────────┘
涉及的技能: auto-review-loop + research-review + paper-claim-audit
💡 一键快捷方式:
/auto-review-loop "paper/"自动运行此工作流。
🔄 人在回路中: 每轮评审后暂停以提供自定义修复说明。
human checkpoint: true启用此功能。
⚙️ 评审轮次、难度和审稿人模型是可配置的——参见自定义。
工作流 3:论文写作 📝
"我有结果和叙事。现在写一篇顶级会议论文。"
已有叙事报告和结果?/paper-writing 将其转化为润色的 PDF:
- 📋 规划论文结构(大纲、章节分配、图表位置)
- 🎨 生成图表(架构图、结果图)
- ✍️ 编写LaTeX(章节、定理、算法)
- 🔧 编译PDF(修复 LaTeX 错误)
- 🔄 自动改进循环(评审 → 修复 → 重新编译)
- 📊 最终审计(声明验证、引用检查)
┌─────────────────────────────────────────────────────────────────┐
│ 工作流 3:论文写作 │
│ │
│ NARRATIVE_REPORT.md + 结果 │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 规划 │────▶│ 图表 │────▶│ 编写 │ │
│ │ 论文 │ │ 生成 │ │ LaTeX │ │
│ │ 结构 │ │ │ │ │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 最终 │◀────│ 自动 │◀────│ 编译 │ │
│ │ 审计 │ │ 改进 │ │ PDF │ │
│ │ │ │ 循环 │ │ │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │
│ 典型流程: │
│ 1. /paper-writing "NARRATIVE_REPORT.md" │
│ 2. 规划论文结构 │
│ 3. 生成图表(架构图、结果图) │
│ 4. 编写 LaTeX(章节、定理、算法) │
│ 5. 编译 PDF(修复 LaTeX 错误) │
│ 6. 自动改进循环(评审 → 修复 → 重新编译) │
│ 7. 最终审计(声明验证、引用检查) │
└─────────────────────────────────────────────────────────────────┘
涉及的技能: paper-plan + paper-figure + paper-write + paper-compile + auto-paper-improvement-loop + paper-claim-audit + citation-audit
💡 一键快捷方式:
/paper-writing "NARRATIVE_REPORT.md"自动运行此工作流。
🔄 人在回路中: 在每个阶段暂停以提供反馈。
human checkpoint: true启用此功能。
⚙️ 会议模板、图表样式和审计级别是可配置的——参见自定义。
工作流 4:反驳 📝
"评审意见出来了。如何回应?"
收到评审意见?/rebuttal 起草一份安全、结构化的反驳:
- 📋 解析评审意见(提取每个关切)
- 🧠 策略(分类关切:容易修复、需要实验、无法解决)
- ✍️ 起草反驳(逐点回应)
- 🛡️ 压力测试(GPT-5.4 xhigh 检查弱点)
- 📊 最终反驳(字符限制、格式)
┌─────────────────────────────────────────────────────────────────┐
│ 工作流 4:反驳 │
│ │
│ 论文 + 评审意见 │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 解析 │────▶│ 策略 │────▶│ 起草 │ │
│ │ 评审 │ │ 分类 │ │ 反驳 │ │
│ │ 意见 │ │ 关切 │ │ │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 最终 │◀────│ 压力 │◀────│ 后续 │ │
│ │ 反驳 │ │ 测试 │ │ 轮次 │ │
│ │ │ │ │ │ │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │
│ 典型流程: │
│ 1. /rebuttal "paper/ + reviews" — venue: ICML │
│ 2. 解析评审意见(提取每个关切) │
│ 3. 策略(分类关切:容易修复、需要实验、无法解决) │
│ 4. 起草反驳(逐点回应) │
│ 5. 压力测试(GPT-5.4 xhigh 检查弱点) │
│ 6. 后续轮次(回应审稿人的后续问题) │
│ 7. 最终反驳(字符限制、格式) │
└─────────────────────────────────────────────────────────────────┘
涉及的技能: rebuttal
💡 一键快捷方式:
/rebuttal "paper/ + reviews" — venue: ICML自动运行此工作流。
🔄 人在回路中: 在起草和压力测试阶段暂停以获取你的批准。
AUTO_PROCEED=true跳过暂停。
⚙️ 会议、字符限制和压力测试轮次是可配置的——参见自定义。
工作流 M:元优化 🧬
"ARIS 如何变得更好?"
ARIS 可以优化自身。/meta-optimize 分析使用日志并提出技能改进:
- 📊 分析使用日志(技能调用、工具调用、失败、参数覆盖)
- 🧠 提出SKILL.md 改进(基于数据)
- 🛡️ 审稿人门控(GPT-5.4 xhigh 评审提案)
- ✅ 用户批准(你决定是否应用)
┌─────────────────────────────────────────────────────────────────┐
│ 工作流 M:元优化 │
│ │
│ .aris/meta/events.jsonl │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 分析 │────▶│ 提出 │────▶│ 审稿人 │ │
│ │ 使用 │ │ 改进 │ │ 门控 │ │
│ │ 日志 │ │ │ │ │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │
│ ▼ │
│ ┌──────────┐ │
│ │ 用户 │ │
│ │ 批准 │ │
│ └──────────┘ │
│ │
│ 典型流程: │
│ 1. 在正常终端中启用日志记录(一次性) │
│ 2. 运行 5+ 个工作流以积累数据 │
│ 3. /meta-optimize (分析日志 → 提出改进) │
│ 4. 审稿人门控 (GPT-5.4 xhigh 评审提案) │
│ 5. 用户批准 (你决定是否应用) │
└─────────────────────────────────────────────────────────────────┘
涉及的技能: meta-optimize
💡 一键快捷方式:
/meta-optimize自动运行此工作流。
🔄 人在回路中: 在应用改进前需要你的批准。
⚙️ 日志记录在正常终端中启用——参见快速开始。
⚙️ 设置
先决条件
- Claude Code(安装并配置)
- Codex CLI(用于评审技能)
- Git
安装
# 1. 克隆仓库
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git
cd Auto-claude-code-research-in-sleep
# 2. 安装技能
mkdir -p ~/.claude/skills/
cp -r skills/* ~/.claude/skills/
# 3. 设置 Codex MCP
npm install -g @openai/codex
codex setup # 提示时将模型设置为 gpt-5.4
claude mcp add codex -s user -- codex mcp-server
# 4. 验证安装
claude
> /idea-discovery "test" # 应该显示帮助信息
GPU 服务器设置(用于自动实验)
在 CLAUDE.md 中配置你的 GPU 服务器:
## GPU 服务器
- 主机:your-server.com
- 用户:your-username
- 端口:22
- 路径:/path/to/projects
- Conda 环境:your-env
- GPU 数量:4
可选:GPT-5.4 Pro 通过 Oracle
# 安装 Oracle MCP
git clone https://github.com/steipete/oracle.git
cd oracle
npm install
# 按照 Oracle 文档设置 API 密钥或浏览器模式
# 在 Claude Code 中配置
claude mcp add oracle -s user -- node /path/to/oracle/build/index.js
然后在任何技能中使用 — reviewer: oracle-pro。
可选:Codex Plugin 用于代码评审
# 安装 Codex CLI
npm install -g @openai/codex
codex setup # 提示时将模型设置为 gpt-5.4
# 在 Claude Code 中配置
claude mcp add codex -s user -- codex mcp-server
可选:飞书/Lark 集成
# 设置飞书 webhook
export FEISHU_WEBHOOK_URL=https://open.feishu.cn/open-apis/bot/v2/hook/your-webhook-id
# 设置飞书交互式模式(可选)
export FEISHU_APP_ID=your-app-id
export FEISHU_APP_SECRET=your-app-secret
可选:Zotero 集成
# 设置 Zotero API 密钥
export ZOTERO_API_KEY=your-api-key
export ZOTERO_USER_ID=your-user-id
可选:Obsidian 集成
# 设置 Obsidian vault 路径
export OBSIDIAN_VAULT_PATH=/path/to/your/vault
🔧 自定义
工作量级别
| 级别 | Tokens | 论文 | 想法 | 评审轮次 | 写作深度 |
|---|---|---|---|---|---|
lite |
0.4x | 5-10 | 4-6 | 1 | 快速 |
balanced |
1x | 10-20 | 8-12 | 2-3 | 标准 |
max |
2.5x | 20-40 | 12-16 | 3-4 | 深度 |
beast |
5-8x | 40-80 | 16-20 | 4-6 | 极致 |
审稿人难度
| 级别 | 描述 |
|---|---|
medium |
标准评审,无记忆 |
hard |
审稿人记忆 + 辩论协议 |
nightmare |
GPT 通过 codex exec 直接读取仓库 |
会议模板
| 会议 | 样式文件 | 页面限制 |
|---|---|---|
| ICLR | iclr2026.sty |
8 页 |
| NeurIPS | neurips_2026.sty |
8 页 |
| ICML | icml2026.sty |
8 页 |
| CVPR | cvpr_2026.sty |
8 页 |
| ACL | acl2026.sty |
8 页 |
| AAAI | aaai2026.sty |
7 页 |
| ACM | acm2026.sty |
10 页 |
🤝 贡献
欢迎贡献!请参见 CONTRIBUTING.md 了解详情。
添加新技能
- 在
skills/中创建一个新目录 - 添加一个
SKILL.md文件,描述技能及其用法 - 可选:添加一个
SKILL.md的 Codex 版本到skills/skills-codex/ - 打开一个 PR
报告问题
请使用 GitHub Issues 报告 bug 或请求功能。
📄 许可
本项目采用 MIT 许可证——参见 LICENSE 文件了解详情。
📖 引用
如果你在研究中使用了 ARIS,请引用:
@software{aris2026,
author = {Wanshui Yin and Contributors},
title = {Auto-claude-code-research-in-sleep (ARIS)},
year = {2026},
url = {https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep}
}
💬 社区
🙏 致谢
ARIS — 让你在睡觉时做研究。🌙