Agnes Image 2.1 Flash
图像生成与视觉能力转化 Skill,对接 Agnes AI 图像 API,支持文生图、图生图、三阶段流水线(图片-视觉理解-Prompt优化-生图),是科研场景中将视觉概念快速转化为图像的首选工具。
★ 编辑推荐原因
实测通过。三阶段流水线(图片-视觉理解-Prompt优化-生图)是独特优势,在 Codex 环境中运行稳定。火山引擎 Vision API 和 Agnes 图像生成 API 目前均为免费,零成本即可上手。需注意上下文安全规则(禁用 view_image)。
这是什么
Agnes Image 2.1 Flash 是一个将视觉概念快速转化为图像的 Skill。对接 Agnes AI 的图像生成 API,支持文生图、图生图,以及独创的三阶段流水线。
与 Nature Figure 的区别
| Agnes Image | Nature Figure | |
|---|---|---|
| 适用场景 | 概念图、示意图、封面图 | 精确数据图、投稿级图表 |
| 输入方式 | 文字/图片 | 数据+图表类型 |
| 输出格式 | PNG/WebP | SVG/PDF/TIFF |
| 核心能力 | 视觉创意转化 | 数据可视化 |
两者互补而非替代。Agnes 负责画概念,Nature Figure 负责画数据。
三阶段流水线(独特优势)
图片 - 火山引擎 Vision(看图描述) - LLM(优化Prompt) - Agnes(生图)
这是该 Skill 最有价值的功能:你给一张实验照片或草图,它先看懂图片内容,再用优化的 Prompt 生成高质量渲染图。
安装难度
中等。需要注册 Agnes AI 获取 API Key,其余为标准的 codex-skill 安装流程。
安全评估
- 网络:是(调用 Agnes AI API)
- 读取本地文件:是(图生图输入)
- 写入本地文件:是(保存生成的图片)
- 执行脚本:是(Python 脚本)
- 风险等级:中等(API 调用有成本,需注意上下文安全)
评测方法
人工实测。在 Codex 环境中完成文生图、图生图、三阶段流水线的完整测试,验证输出质量与上下文安全性。
适用场景
- 科研示意图、概念图、封面图的快速生成
- 将实验照片/草图转化为高质量渲染图(图生图)
- 需要视觉理解后再创作的复杂图像任务(三阶段流水线)
- 批量生成论文配图或展示材料的初稿
不适用
- 需要精确科学数据的定量图表(应使用 Nature Figure 等专业绘图 Skill)
- 纯文本模型用户,该 Skill 依赖 Codex 的工具调用能力
- 无 API Key 的场景,需要注册 Agnes AI 获取密钥
安装方式
**Codex(技能安装器一键安装)** 在 Codex 对话中输入: "Install agnes-image-21-flash from feihanyu953-web/codex-skill-agnes-image" **手动安装** git clone https://github.com/feihanyu953-web/codex-skill-agnes-image.git "$CODEX_HOME/skills/agnes-image-21-flash" **API Key 配置** 1. 在 Agnes AI 注册并获取 API Key 2. PowerShell: $env:AGNES_API_KEY="sk-..." 3. 运行测试: python scripts/generate_agnes_image.py "测试" --size 512x512 --response-format url **注意**:使用该 Skill 时 Agent 不应调用 view_image,避免 base64 撑爆上下文窗口。
输出样例
- 提示词:生成一张 Pt/CeO2 催化剂的界面结构示意图 -- 输出:1024x768 的科学示意图 PNG
- 提示词:将这张实验装置照片转为干净的 3D 渲染示意图 -- 输出:图生图转换后的高清渲染图
- 提示词:帮我生成一张电催化氨氧化反应机理的示意图 -- 输出:多步反应路径的概念图
- 边界案例:需要带误差棒的电化学 LSV 曲线 -- 应改用 Nature Figure Skill