WARN CodexClaude Code

ARIS (Auto Research In Sleep)

轻量级 Markdown 驱动自主 ML 研究技能集——跨模型审稿循环、idea 发现和实验自动化。适合 ML/CV/NLP 方向。

核心能力

ARIS 将 ML 研究拆解为可组合的 Markdown 技能单元:

  • Idea 发现:基于文献和社区论文生成研究方向
  • 实验自动化:自动编写和运行实验代码
  • 跨模型审稿:让不同 LLM 扮演 reviewer 角色互相审阅
  • 社区驱动:接受社区贡献的论文复现和扩展

模型适配

以下分级为 ARIS 技术报告中的建议配置,非本站独立评测结果:

模型文献检索实验代码生成审稿质量
GPT-4o / Claude 3.5+
GPT-4o-mini / Claude 3.0
本地 7B-13B 模型

主要边界

  • 仅适用于 ML/CV/NLP 方向,非 AI 领域完全不可用。
  • 实验代码由 AI 生成,运行前必须人工审查——特别是数据路径、超参数和评估逻辑。
  • 跨模型审稿的质量取决于配置的 LLM 能力,用一个弱模型做 reviewer 会产生误导性反馈。
  • 最终论文的科学主张和实验设计必须由研究者决定,ARIS 的输出是辅助而非替代。

适用场景

  • ML 研究全流程自动化(idea 生成 → 实验设计 → 论文初稿)
  • 跨模型审稿循环:让不同 LLM 扮演 reviewer 角色互相审阅
  • 社区论文复现与扩展(基于已发表 arxiv 论文)

不适用

  • 非 ML 领域(化学合成、生物湿实验、材料制备)——技能逻辑深度绑定 ML 工作流
  • 纯文本模型——部分实验代码生成需要较强的代码能力,建议使用 GPT-4o+ 或 Claude 3.5+
  • 完全无人值守的"睡觉出论文"——最终科学判断必须由研究者做出

安装方式

**前置条件**:Python 3.10+、Git、一个或多个 LLM API key(用于不同模型的审稿循环)。 **步骤 1:克隆仓库** git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git cd Auto-claude-code-research-in-sleep 如无法访问 GitHub,可通过镜像站点或下载 ZIP 包获取。 **步骤 2:配置环境变量** 复制 ".env.example" 为 ".env",填入你的 LLM API key。ARIS 需要至少一个 API key(推荐配置 2-3 个不同模型用于审稿循环): OPENAI_API_KEY=sk-... ANTHROPIC_API_KEY=sk-ant-... **步骤 3:安装 Skill** - Codex 用户:将 "skills/" 目录内容复制到 "$CODEX_HOME/skills/" - Claude Code 用户:将 "skills/" 目录内容复制到 Claude Code 的 skills 目录 **步骤 4:验证** 启动 Codex/Claude Code,输入 "用 ARIS 探索一个研究方向:transformer 架构的效率优化"。观察是否开始自动文献搜索和 idea 生成。 **常见问题**:如果 API 调用报错,检查 ".env" 文件中的 API key 是否正确,以及账户余额是否充足。

查看完整安装文档 →

输出样例

  • 提示词:`用 ARIS 研究 vision transformer 的轻量化方法` → 输出流程:(1) 自动检索 2024-2025 相关论文并生成文献综述 Markdown (2) 提出 3 个可行的改进方向 (3) 生成实验代码框架 (4) 写初稿 Intro + Related Work。
  • 提示词:`审稿这篇论文草稿 [附 Markdown]` → 输出:从 Method、Experiment、Writing 三个维度给出审稿意见,标注 major/minor concern,建议修改方案。
  • 边界案例:输入`帮我设计一个新型 MOF 材料` → ARIS 会返回:该技能仅适用于 ML/CV/NLP 研究,不适用于材料设计。