多智能体 PPT 幻灯片生成工作流,支持跨平台运行。
LLM 生成 + Gemini 审查,输出 SVG 1280×720 Bento Grid 布局的演示幻灯片。
同一提示词、同一工作流,不同模型 × 不同宿主的对比效果:
/ppt-agent:ppt 帮我收集一下新一代小米su7的发布会资料然后做一套PPT
这是 OpenCode 中 GPT-5.4 的效果 | 深色科技蓝橙配色 | 12页 | 平均质量分 8.53/10
当前运行效果 | 深蓝商务橙配色 | 14页 | 平均质量分 8.5/10
小米品牌橙 #FF6900 | 深色科技风格 | 平均质量分 8.34/10
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
claude plugin marketplace add zengwenliang416/ppt-agent
claude plugin install ppt-agent/ppt-agent:ppt <主题或需求描述>
| 参数 | 默认值 | 说明 |
|---|---|---|
--style |
business | 风格预设;实际可用值以 skills/_shared/index.json 中 domain=style 的注册表为准 |
--brand-colors |
无 | 品牌色彩 YAML 文件路径 |
--pages |
10-15 | 目标页数范围 |
--run-id |
自动生成 | 恢复已有运行目录,按已有产物断点续跑 |
当前内置 style 注册表包含 17 个风格:business、tech、creative、minimal、blueprint、bold-editorial、chalkboard、editorial-infographic、fantasy-animation、intuition-machine、notion、pixel-art、scientific、sketch-notes、vector-illustration、vintage、watercolor。
brand:
primary: "#FF6900" # 主品牌色
secondary: "#000000" # 辅助品牌色
logo_text: "Mi" # 品牌标识(2-3字符)使用方式:
/ppt-agent:ppt --brand-colors=brand.yaml 小米SU7发布会
- 初始化 — 解析参数,创建运行目录
- 需求调研 — 背景搜索 + 用户确认需求(Hard Stop)
- 素材收集 — 按章节并行深度搜索
- 大纲规划 — 金字塔原理结构化大纲 + 用户审批(Hard Stop)
- 规划草稿 — 每页生成简版 SVG 草稿
- 设计稿 + 审查 — Bento Grid SVG 生成 + Gemini 质量审查循环
- 交付 — 最终 SVG 文件 + 交互式 HTML 预览页(Hard Stop)
说明:当 Gemini 不可用时,审查阶段会降级为技术校验模式,继续检查 XML、viewBox、字号下限、安全边距、对比度与样式 token 合规性,但不再生成审美优化建议。
| 智能体 | 职责 |
|---|---|
research-core |
需求调研 + 素材收集 |
content-core |
大纲规划 + 规划草稿 |
slide-core |
设计 SVG 生成(Bento Grid 布局) |
review-core |
Gemini 驱动的 SVG 质量审查 |
openspec/changes/<run_id>/
├── input.md # 输入参数
├── proposal.md # 变更提案
├── tasks.md # 任务清单
├── research-context.md # 调研上下文
├── requirements.md # 需求文档
├── materials.md # 素材汇总
├── style.yaml # 样式配置
├── outline.json # 结构化大纲
├── outline-preview.md # 大纲预览
├── draft-manifest.json # 草稿清单
├── drafts/slide-{nn}.svg # 规划草稿
├── slides/slide-{nn}.svg # 设计稿
├── slide-status.json # 逐页进度(支持中断恢复)
├── reviews/review-{nn}.md # 审查报告
├── review-manifest.json # 审查汇总(Phase 6→7 质量门控)
└── output/
├── slide-{nn}.svg # 最终 SVG
├── index.html # 交互式预览页
└── speaker-notes.md # 演讲者备注
| 指标 | 最低要求 | 优秀标准 |
|---|---|---|
| 加权总分 | ≥ 7.0 | ≥ 8.5 |
| 布局评分 | ≥ 6 | ≥ 8 |
| 可读性 | ≥ 6 | ≥ 8 |
| 修复轮次 | ≤ 2 | 0 |
补充说明:以上加权评分门槛适用于 Gemini 可用时的完整审查链路;若进入技术校验模式,则以硬规则通过/失败作为放行标准,不生成审美分数。
PPT Agent 当前已验证多个平台和模型:
| 平台 | 模型 | 状态 | 备注 |
|---|---|---|---|
| OpenCode | GPT-5.4 | ✅ 已验证 | 新一代小米 SU7 12页效果 |
| OpenCode | MiniMax M2.5 | ✅ 已验证 | 当前运行效果 |
| OpenCode | MiMo V2 Pro | ✅ 已验证 | 小米品牌橙配色 |
| Claude Code | Claude Opus | ✅ 已验证 | 经典商务风格 |
- MCP Server 化:将核心工作流封装为 MCP Server,暴露
ppt/generate、ppt/outline、ppt/review等标准 tools。所有支持 MCP 的宿主(Claude Code / Codex / OpenCode / Droid / Cursor / Zed 等)均可直接接入,一次开发全平台通用。 - 核心解耦:将 7 阶段工作流逻辑与宿主特有协议(Task / SendMessage / AskUserQuestion)分离为平台无关的
core/层,新增平台只需编写轻量 adapter。 - Headless 模式:支持无交互批量生成,适用于 CI/CD pipeline 和 API 调用场景。
MIT











