Engineering Figure Agent
工科/CS 论文图表制作,支持概念图(image mode)和精确数值图(plot mode)双模式,中英文标注,面向中文科研用户优化。
评测任务
从工科/CS 论文的图表需求出发,通过双模式(概念图的 image mode 和精确数值图的 plot mode)生成符合发表要求的论文图表,支持中英文标注。
模型适配边界
此技能的核心边界取决于图表类型:
- plot mode:纯文本模型即可——本地运行 matplotlib 生成精确图表,数值准确性由代码保证。但多模态模型可预览输出效果,迭代效率更高。
- image mode:需要多模态模型进行视觉 QA——概念图生成后必须人工或由多模态模型检查标签正确性、布局合理性和科学准确性。纯文本模型无法完成此工作。
主要边界
- image mode 依赖外部图像生成 API(Gemini 或 OpenAI),需要网络连接和 API key。生成的图像可能包含幻觉标注,必须人工验证。
- plot mode 使用本地 matplotlib,数值准确但图表美观度受限于 matplotlib 默认样式。
- 两类图表模式互斥:概念图走 image mode,数值图走 plot mode,不可混合。
- figure brief 是必填项——skill 要求明确受众、主张、模块、标签和数据后再生成。
- 生成后必须人工检查图表科学性、标签和数值,skill 不替代作者判断。
适用场景
- 工科和计算机科学论文中的系统架构图、算法流程图
- 需要精确数值的基准测试柱状图、消融实验图、热图
- 参考图重绘和布局探索
- 已明确图表结论和研究主张的成图任务
不适用
- 替代人工检查图表科学性、标签和数值——生成后必须人工验证
- 无明确图表构思的模糊需求——skill 要求先定义 figure brief
- 非工科/CS 领域的高度专业化图表(如化学结构式、生物通路图)
安装方式
**Codex 安装** 克隆到 Codex skills 目录: git clone https://github.com/heyu-233/engineering-figure-agent.git "$env:USERPROFILE\.codex\skills\engineering-figure-agent" 运行环境检查和安装脚本: & "$env:USERPROFILE\.codex\skills\engineering-figure-agent\scripts\install_and_test.ps1" -RunSetupCheck **Claude Code 安装** git clone https://github.com/heyu-233/engineering-figure-agent.git ~/.claude/skills/engineering-figure-agent **API Key 配置(image mode 需要)** Gemini 后端:设置环境变量 NANOBANANA_API_KEY OpenAI 后端:设置环境变量 OPENAI_API_KEY plot mode 不需要外部 API key,使用本地 matplotlib **验证安装** 运行向导检查所有组件: & "$env:USERPROFILE\.codex\skills\engineering-figure-agent\scripts\wizard.ps1" **Python 依赖** 需要 Python 3.9+,安装 matplotlib: pip install matplotlib
输出样例
- 提示词:画一张检索增强生成(RAG)系统的系统架构图,包含 OCR、分块、嵌入、向量搜索、重排序和答案合成模块 → 输出:使用 image mode 生成完整的系统架构图,标注各模块和数据流向。
- 提示词:plot the benchmark results for three models on five datasets as a grouped bar chart with error bars → 输出:使用 plot mode 本地生成精确的柱状图,每个数据集上三条柱子,带误差棒,导出为 SVG。
- 边界案例:输入「帮我画个好看的图」(无数据无要求)→ skill 要求先填写 figure brief,明确受众、主张、模块和数据。