WARN CodexClaude Code

ARIS (Auto Research In Sleep)

轻量级 Markdown 驱动自主 ML 研究技能集——跨模型审稿循环、idea 发现和实验自动化。适合 ML/CV/NLP 方向。

核心能力

ARIS 将 ML 研究拆解为可组合的 Markdown 技能单元：

Idea 发现：基于文献和社区论文生成研究方向
实验自动化：自动编写和运行实验代码
跨模型审稿：让不同 LLM 扮演 reviewer 角色互相审阅
社区驱动：接受社区贡献的论文复现和扩展

模型适配

以下分级为 ARIS 技术报告中的建议配置，非本站独立评测结果：

模型	文献检索	实验代码生成	审稿质量
GPT-4o / Claude 3.5+	✓	✓	✓
GPT-4o-mini / Claude 3.0	✓	△	△
本地 7B-13B 模型	△	✗	✗

主要边界

仅适用于 ML/CV/NLP 方向，非 AI 领域完全不可用。
实验代码由 AI 生成，运行前必须人工审查——特别是数据路径、超参数和评估逻辑。
跨模型审稿的质量取决于配置的 LLM 能力，用一个弱模型做 reviewer 会产生误导性反馈。
最终论文的科学主张和实验设计必须由研究者决定，ARIS 的输出是辅助而非替代。

适用场景

ML 研究全流程自动化（idea 生成 → 实验设计 → 论文初稿）
跨模型审稿循环：让不同 LLM 扮演 reviewer 角色互相审阅
社区论文复现与扩展（基于已发表 arxiv 论文）

不适用

非 ML 领域（化学合成、生物湿实验、材料制备）——技能逻辑深度绑定 ML 工作流
纯文本模型——部分实验代码生成需要较强的代码能力，建议使用 GPT-4o+ 或 Claude 3.5+
完全无人值守的"睡觉出论文"——最终科学判断必须由研究者做出

安装方式

**前置条件**：Python 3.10+、Git、一个或多个 LLM API key（用于不同模型的审稿循环）。 **步骤 1：克隆仓库** git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git cd Auto-claude-code-research-in-sleep 如无法访问 GitHub，可通过镜像站点或下载 ZIP 包获取。 **步骤 2：配置环境变量** 复制 ".env.example" 为 ".env"，填入你的 LLM API key。ARIS 需要至少一个 API key（推荐配置 2-3 个不同模型用于审稿循环）： OPENAI_API_KEY=sk-... ANTHROPIC_API_KEY=sk-ant-... **步骤 3：安装 Skill** - Codex 用户：将 "skills/" 目录内容复制到 "$CODEX_HOME/skills/" - Claude Code 用户：将 "skills/" 目录内容复制到 Claude Code 的 skills 目录 **步骤 4：验证** 启动 Codex/Claude Code，输入 "用 ARIS 探索一个研究方向：transformer 架构的效率优化"。观察是否开始自动文献搜索和 idea 生成。 **常见问题**：如果 API 调用报错，检查 ".env" 文件中的 API key 是否正确，以及账户余额是否充足。

查看完整安装文档 →

输出样例

提示词：`用 ARIS 研究 vision transformer 的轻量化方法` → 输出流程：(1) 自动检索 2024-2025 相关论文并生成文献综述 Markdown (2) 提出 3 个可行的改进方向 (3) 生成实验代码框架 (4) 写初稿 Intro + Related Work。
提示词：`审稿这篇论文草稿 [附 Markdown]` → 输出：从 Method、Experiment、Writing 三个维度给出审稿意见，标注 major/minor concern，建议修改方案。
边界案例：输入`帮我设计一个新型 MOF 材料` → ARIS 会返回：该技能仅适用于 ML/CV/NLP 研究，不适用于材料设计。