GStack 调研报告
GStack 调研报告
基于 GitHub 开源项目 garrytan/gstack 的深度技术调研
调研日期:2026-03-22(更新)
一、项目概述
1.1 基本信息
| 属性 | 信息 |
|---|---|
| 项目名称 | GStack |
| GitHub | https://github.com/garrytan/gstack |
| 开发者 | Garry Tan (陈嘉兴) |
| 身份 | Y Combinator CEO & President |
| 核心定位 | Claude Code 专业工作流工具集 |
| 开源状态 | MIT License |
| Stars | 36,386+ (持续增长中) |
| 技术栈 | TypeScript, Bun, Playwright |
1.2 一句话介绍
GStack 是 Y Combinator CEO Garry Tan 开源的 Claude Code 工作流配置,将通用 AI 助手转变为可按需召唤的专家团队(CEO、工程经理、QA 等),实现 10K LOC/周、100 PRs/周的惊人生产力。
1.3 发展历程
2025 年
├── Garry Tan 个人使用 Claude Code 进行高强度开发
├── 50 天内产出 10K LOC/周、100 PRs/周
└── 打磨出一套成熟的工作流配置
2026 年 3 月
├── GStack 正式开源发布
├── 24 小时内获得 6,000+ Stars
├── 48 小时内突破 11,900+ Stars
├── 截至 3 月 22 日:36,386+ Stars
└── 引发社区广泛讨论和争议
1.4 核心价值
- 角色切换:一键切换 AI 的"认知模式"(创始人/工程师/审查员/发布)
- 工作流标准化:将模糊的 AI 交互转变为结构化流程
- 浏览器自动化:让 AI 拥有"眼睛",能够测试 UI
- 并行执行:通过 Conductor 运行多达 10 个并行会话
二、核心功能
2.1 十大工作流技能
| 技能 | 模式 | 功能描述 |
|---|---|---|
/plan-ceo-review |
创始人/CEO | 重新思考问题,找到隐藏在需求中的 10 星产品 |
/plan-eng-review |
工程经理/技术负责人 | 锁定架构、数据流、边界条件和测试矩阵 |
/review |
偏执的高级工程师 | 找出能通过 CI 但在生产环境爆炸的 Bug |
/ship |
发布工程师 | 同步 main、运行测试、解决 Greptile 审查、推送、创建 PR |
/browse |
QA 工程师 | 让 Agent 拥有"眼睛",登录、点击、截图、发现故障 |
/qa |
QA + 修复工程师 | 测试应用、发现 Bug、用原子提交修复、重新验证 |
/qa-only |
QA 报告员 | 仅报告模式,不修改任何代码 |
/setup-browser-cookies |
会话管理器 | 从真实浏览器导入 Cookies 到无头会话 |
/retro |
工程经理 | 团队复盘:深度分析 + 每人表扬和成长机会 |
/document-release |
技术文档工程师 | 更新 README、ARCHITECTURE、CONTRIBUTING 等文档 |
2.2 核心理念:显式认知齿轮
Garry Tan 的核心观点:
"我不希望 AI 编码工具停留在一种模糊模式。
规划不是审查。审查不是发布。创始人品味不是工程严谨。
如果你把所有这些都混在一起,通常会得到四者的平庸混合。
我想要显式的齿轮。
这些技能让我告诉模型我现在想要什么样的'大脑'。
我可以按需切换认知模式 —— 创始人、工程经理、偏执审查员、发布机器。
这就是解锁。"
2.3 工作流示例
一个功能,五种模式:
You: [进入计划模式,描述功能]
我想在商品列表应用中添加卖家照片上传功能。
卖家应该能够上传商品照片,我们从照片创建列表。
You: /plan-ceo-review
Claude: "照片上传"不是功能。真正的工作是帮助卖家创建能卖出去的列表。
10 星版本长这样:从照片自动识别产品,从网络提取规格和定价参考,
起草标题和描述,建议最佳主图...
You: /plan-eng-review
Claude: [架构图,上传→分类→丰富→草稿流水线的状态机,
异步作业边界,失败模式,测试矩阵]
You: [退出计划模式,实现计划]
You: /review
Claude: 发现竞态条件:两个标签页可能覆盖封面照片选择。
信任边界:将网络数据拉入草稿生成会创建提示注入向量。
缺失:失败上传的孤立文件清理。
You: (修复问题)
You: /ship
Claude: [同步 main,运行测试,推送分支,创建 PR — 6 个工具调用,完成]
You: /qa
Claude: 分析分支差异... 8 个文件变更,3 个路由受影响。
[测试 /listings/new, /listings/:id, /api/listings]
所有 3 个路由正常工作。上传 + 丰富流程端到端通过。
三、技术架构
3.1 整体架构
┌─────────────────────────────────────────────────────────────────────────┐
│ GStack 系统架构 │
├─────────────────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────────────────────────────────────────────────────────┐ │
│ │ Claude Code CLI │ │
│ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │
│ │ │ /plan │ │ /review │ │ /ship │ │ /browse │ │ /qa │ │ │
│ │ │ -ceo │ │ │ │ │ │ │ │ │ │ │
│ │ └────┬────┘ └────┬────┘ └────┬────┘ └────┬────┘ └────┬────┘ │ │
│ └───────┼───────────┼───────────┼───────────┼───────────┼─────────┘ │
│ │ │ │ │ │ │
│ ┌───────┴───────────┴───────────┴───────────┴───────────┴─────────┐ │
│ │ Skills Layer (~/.claude/skills/) │ │
│ │ ┌─────────────────────────────────────────────────────────┐ │ │
│ │ │ gstack/ │ │ │
│ │ │ ├── plan-ceo-review.md (CEO 模式提示词) │ │ │
│ │ │ ├── plan-eng-review.md (工程经理模式提示词) │ │ │
│ │ │ ├── review.md (审查模式提示词) │ │ │
│ │ │ ├── ship.md (发布模式提示词) │ │ │
│ │ │ ├── browse.md (浏览模式提示词) │ │ │
│ │ │ ├── qa.md (QA 模式提示词) │ │ │
│ │ │ ├── retro.md (复盘模式提示词) │ │ │
│ │ │ ├── document-release.md (文档模式提示词) │ │ │
│ │ │ └── browse/ (浏览器自动化模块) │ │ │
│ │ │ ├── src/ (TypeScript 源码) │ │ │
│ │ │ └── dist/browse (编译后二进制 ~58MB) │ │ │
│ │ └─────────────────────────────────────────────────────────┘ │ │
│ └─────────────────────────────────────────────────────────────────┘ │
│ │
│ ┌─────────────────────────────────────────────────────────────────┐ │
│ │ External Integrations │ │
│ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │
│ │ │ Greptile │ │ Chromium │ │ Git/GitHub │ │ │
│ │ │ (PR 审查) │ │ (Playwright) │ │ (PR/CI) │ │ │
│ │ └─────────────┘ └─────────────┘ └─────────────┘ │ │
│ └─────────────────────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────────────┘
3.2 浏览器自动化模块
/browse 技术架构:
┌─────────────────────────────────────────────────────────────────┐
│ /browse 命令 │
├─────────────────────────────────────────────────────────────────┤
│ │
│ ┌───────────────┐ ┌───────────────┐ ┌───────────────┐ │
│ │ Claude Code │ --> │ browse 二进制 │ --> │ Playwright │ │
│ │ (调用命令) │ │ (Bun 编译) │ │ (浏览器控制) │ │
│ └───────────────┘ └───────────────┘ └───────────────┘ │
│ │ │
│ ▼ │
│ ┌───────────────┐ │
│ │ Chromium │ │
│ │ (持久会话) │ │
│ └───────────────┘ │
│ │
│ 特点: │
│ - 首次调用启动浏览器 (~3s) │
│ - 后续调用响应快 (~100-200ms) │
│ - Cookies、tabs、localStorage 在命令间保持 │
│ - 30 分钟空闲后自动关闭 │
│ │
└─────────────────────────────────────────────────────────────────┘
3.3 Greptile 集成
Greptile 集成流程:
┌─────────────────────────────────────────────────────────────────┐
│ /review 或 /ship │
├─────────────────────────────────────────────────────────────────┤
│ │
│ 1. 读取 PR 上的 Greptile 评论 │
│ ┌───────────────────────────────────────────────────┐ │
│ │ Greptile Comments │ │
│ │ ├── 竞态条件警告 │ │
│ │ ├── 安全问题提示 │ │
│ │ └── 代码风格建议 │ │
│ └───────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ 2. 分类处理 │
│ ┌──────────────┬──────────────┬──────────────┐ │
│ │ 有效问题 │ 已修复问题 │ 误报 │ │
│ │ (自动修复) │ (自动回复) │ (推送反驳) │ │
│ └──────────────┴──────────────┴──────────────┘ │
│ │ │
│ ▼ │
│ 3. 学习和记录 │
│ ┌───────────────────────────────────────────────────┐ │
│ │ ~/.gstack/greptile-history.md │ │
│ │ (记录已知误报模式,未来自动跳过) │ │
│ └───────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────┘
3.4 Conductor 并行架构
Conductor: 10 个并行 Claude Code 会话
┌─────────────────────────────────────────────────────────────────────────┐
│ Conductor │
├─────────────────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ Session │ │ Session │ │ Session │ │ Session │ │ Session │ │
│ │ #1 │ │ #2 │ │ #3 │ │ #4 │ │ #5 │ │
│ │ │ │ │ │ │ │ │ │ │ │
│ │ /qa │ │ /review │ │ 实现功能 │ │ 实现功能 │ │ /browse │ │
│ │ staging │ │ PR #42 │ │ 分支 A │ │ 分支 B │ │ 测试 │ │
│ └────┬────┘ └────┬────┘ └────┬────┘ └────┬────┘ └────┬────┘ │
│ │ │ │ │ │ │
│ ┌────┴────┐ ┌────┴────┐ ┌────┴────┐ ┌────┴────┐ ┌────┴────┐ │
│ │Workspace│ │Workspace│ │Workspace│ │Workspace│ │Workspace│ │
│ │ #1 │ │ #2 │ │ #3 │ │ #4 │ │ #5 │ │
│ │ 独立浏览器│ │ 独立浏览器│ │ 独立浏览器│ │ 独立浏览器│ │ 独立浏览器│ │
│ └─────────┘ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │
│ │
│ 每个工作空间: │
│ - 独立的代码库副本 │
│ - 独立的 Chromium 进程 │
│ - 独立的 Cookies 和会话 │
│ - 无端口冲突,无共享状态 │
│ │
└─────────────────────────────────────────────────────────────────────────┘
四、核心技能详解
4.1 /plan-ceo-review - 创始人模式
设计哲学:Brian Chesky 模式(Airbnb CEO)
核心问题:这个产品到底是为了什么?
行为特征: - 不按字面意思理解需求 - 从用户角度重新思考问题 - 寻找"不可避免、令人愉悦、甚至有点神奇"的版本 - 追问"隐藏在这个需求中的 10 星产品是什么"
示例:
输入: "让卖家上传商品照片"
弱助手: 添加文件选择器,保存图片
/plan-ceo-review:
"照片上传"不是真正的功能。
真正的工作是帮助卖家创建能卖出去的列表。
应该追问:
- 能否从照片识别产品?
- 能否推断 SKU 或型号?
- 能否搜索网络并自动起草标题和描述?
- 能否提取规格、类别和定价参考?
- 能否建议哪张照片最适合做主图?
- 能否检测照片是否丑陋、黑暗、杂乱或低信任度?
4.2 /plan-eng-review - 工程经理模式
核心任务:让想法变得可构建
关注点: - 架构设计 - 系统边界 - 数据流 - 状态转换 - 失败模式 - 边界条件 - 信任边界 - 测试覆盖
关键解锁:图表
图表类型:
├── 架构图
├── 状态图
├── 组件图
├── 数据流图
└── 测试矩阵
图表强制将隐藏假设暴露出来,
使模糊的规划变得更难。
4.3 /review - 偏执高级工程师模式
核心问题:什么还会出错?
关注点:通过 CI 但在生产环境爆炸的 Bug
审查清单:
├── N+1 查询
├── 过期读取
├── 竞态条件
├── 错误的信任边界
├── 缺失索引
├── 转义 Bug
├── 破坏的不变量
├── 错误的重试逻辑
└── 测试通过但遗漏真正失败模式的测试
4.4 /ship - 发布机器模式
核心任务:执行最后一公里
自动化流程:
/ship 流程:
1. 同步 main
2. 运行测试
3. 确保分支状态正常
4. 更新 changelog/版本号
5. 推送分支
6. 创建/更新 PR
设计理念:此时不需要头脑风暴,只需要执行
4.5 /browse - QA 工程师模式
核心能力:给 Agent 眼睛
技术实现: - 基于 Playwright (Microsoft) - 编译为原生二进制 (~58MB) - 持久 Chromium 守护进程 - 首次调用 ~3s,后续 ~100-200ms
/browse 命令集:
├── goto <url> # 导航到 URL
├── snapshot # 获取页面快照
├── fill <selector> # 填充表单
├── click <selector> # 点击元素
├── screenshot # 截图
├── console # 检查控制台错误
└── text # 获取页面文本
4.6 /qa - QA + 修复工程师模式
四种模式:
| 模式 | 说明 | 耗时 |
|---|---|---|
| Diff-aware | 读取 git diff,识别受影响页面,针对性测试 | 自动 |
| Full | 系统性探索整个应用 | 5-15 分钟 |
| Quick | 30 秒冒烟测试 | 30 秒 |
| Regression | 与基线对比,发现新/修复的问题 | 可变 |
/qa 输出示例:
QA Report: staging.myapp.com — Health Score: 72/100
Top 3 Issues:
1. CRITICAL: Checkout form submits with empty required fields
2. HIGH: Mobile nav menu doesn't close after selecting an item
3. MEDIUM: Dashboard chart overlaps sidebar below 1024px
4.7 /retro - 工程经理复盘模式
核心功能:团队感知的周度复盘
输出内容: - 提交历史分析 - 工作模式识别 - 发货速度追踪 - 每个贡献者的具体表扬和成长机会
/retro 输出示例:
Week of Mar 1: 47 commits (3 contributors), 3.2k LOC, 38% tests, 12 PRs
## Your Week
32 commits, +2.4k LOC, 41% tests. Peak hours: 9-11pm.
Biggest ship: cookie import system
## Team Breakdown
### Alice
12 commits focused on app/services/
Opportunity: test ratio at 12% — worth investing
### Bob
3 commits — fixed the N+1 query on dashboard
Opportunity: only 1 active day — check if blocked
五、安装配置
5.1 环境要求
| 工具 | 版本要求 | 说明 |
|---|---|---|
| Claude Code | 最新版 | Anthropic 官方 CLI |
| Git | 任意版本 | 版本控制 |
| Bun | v1.0+ | JavaScript 运行时(用于编译浏览器二进制) |
| macOS/Linux | x64/arm64 | 浏览器二进制支持平台 |
5.2 安装步骤
方式一:全局安装(推荐)
# 在 Claude Code 中粘贴以下命令:
# 安装 gstack
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && \
cd ~/.claude/skills/gstack && \
./setup
然后在 ~/.claude/CLAUDE.md 中添加:
## gstack
使用 gstack 的 /browse 技能进行所有 Web 浏览,不要使用 mcp__claude-in-chrome__* 工具。
可用技能:
- /plan-ceo-review: 创始人模式,重新思考产品方向
- /plan-eng-review: 工程经理模式,锁定架构和边界
- /review: 偏执审查模式,发现潜在问题
- /ship: 发布模式,自动化发布流程
- /browse: 浏览器自动化,让 AI 看见 UI
- /qa: QA 模式,测试和修复
- /qa-only: 仅报告 QA 模式
- /setup-browser-cookies: 导入浏览器 Cookies
- /retro: 团队复盘模式
- /document-release: 文档更新模式
方式二:项目级安装
# 将 gstack 复制到项目中,让团队成员共享
cp -Rf ~/.claude/skills/gstack .claude/skills/gstack
rm -rf .claude/skills/gstack/.git
cd .claude/skills/gstack && ./setup
5.3 安装内容
安装后的文件结构:
~/.claude/skills/gstack/
├── setup # 安装脚本
├── plan-ceo-review.md # CEO 模式提示词
├── plan-eng-review.md # 工程经理模式提示词
├── review.md # 审查模式提示词
├── ship.md # 发布模式提示词
├── browse.md # 浏览模式提示词
├── qa.md # QA 模式提示词
├── qa-only.md # 仅报告 QA 模式提示词
├── setup-browser-cookies.md # Cookie 导入提示词
├── retro.md # 复盘模式提示词
├── document-release.md # 文档更新提示词
└── browse/ # 浏览器自动化模块
├── src/ # TypeScript 源码
└── dist/browse # 编译后二进制 (~58MB)
符号链接:
~/.claude/skills/browse -> gstack/browse
~/.claude/skills/qa -> gstack/qa
~/.claude/skills/review -> gstack/review
... 等等
5.4 配置文件
# ~/.gstack/config.yaml (可选)
# 自动升级
auto_upgrade: true
# 浏览器会话超时(分钟)
browser_session_timeout: 30
# Greptile 集成
greptile:
enabled: true
auto_reply: true
# QA 报告存储
qa_reports_dir: .gstack/qa-reports/
# 复盘快照存储
retro_snapshots_dir: .context/retros/
六、使用场景
6.1 适用场景
| 场景 | 推荐技能 | 价值 |
|---|---|---|
| 新功能规划 | /plan-ceo-review → /plan-eng-review |
确保"做正确的事" |
| 代码审查 | /review |
发现 CI 遗漏的问题 |
| 发布部署 | /ship |
自动化繁琐的发布流程 |
| UI 测试 | /browse / /qa |
自动化浏览器测试 |
| 团队复盘 | /retro |
数据驱动的周度复盘 |
| 文档维护 | /document-release |
保持文档与代码同步 |
6.2 典型工作流
功能开发工作流
1. [计划阶段]
/plan-ceo-review # 验证产品方向
/plan-eng-review # 锁定技术架构
2. [实现阶段]
# 正常编码...
3. [审查阶段]
/review # 发现潜在问题
# 修复问题...
4. [发布阶段]
/ship # 自动化发布
/qa # 验证发布
5. [文档阶段]
/document-release # 更新文档
QA 自动化工作流
1. [准备]
/setup-browser-cookies staging.myapp.com
2. [测试]
/qa https://staging.myapp.com --quick # 冒烟测试
/qa https://staging.myapp.com # 完整测试
3. [验证]
/browse staging.myapp.com # 手动检查特定页面
6.3 不适用场景
- 初学者:需要熟悉 Claude Code 基本用法
- 简单任务:一句话能解决的不需要复杂工作流
- 非技术项目:主要针对软件开发场景
- Windows 平台:浏览器二进制暂不支持 Windows
七、对比分析
7.1 与类似工具对比
| 特性 | GStack | GSD | Superpowers | Cursor Rules |
|---|---|---|---|---|
| 平台 | Claude Code | Claude Code | Claude Code | Cursor IDE |
| 类型 | 技能配置 | 开发框架 | 开发框架 | 原生功能 |
| 核心理念 | 角色切换 | 规范驱动 | TDD 工作流 | 规则指令 |
| 技能数量 | 10 个 | 多阶段流程 | 可组合技能 | 自定义 |
| 浏览器自动化 | ⭐⭐⭐⭐⭐ | ❌ | ⭐⭐⭐ | ⭐⭐ |
| 并行会话 | ⭐⭐⭐⭐⭐ (Conductor) | ❌ | ⭐⭐⭐ | ❌ |
| 学习曲线 | 中等 | 较高 | 较高 | 较低 |
| 创建者 | Garry Tan (YC) | Glitter Cowboy | obra | Cursor 团队 |
7.2 技术栈对比
GStack GSD Superpowers
───────── ───────── ────────────
核心机制 Skills Markdown Skills + Hooks
提示词存储 .md 文件 .md 文件 .md 文件
浏览器支持 Playwright 无 有限
并行支持 Conductor 无 有限
外部集成 Greptile 无 可选
7.3 选型建议
| 需求场景 | 推荐选择 | 原因 |
|---|---|---|
| 角色切换工作流 | GStack | 专为多角色设计 |
| 规范驱动开发 | GSD | 强调规范和文档 |
| TDD 测试驱动 | Superpowers | 强制 RED/GREEN 流程 |
| Cursor 用户 | Cursor Rules | 原生集成,零配置 |
| 需要浏览器自动化 | GStack | 最完整的浏览器支持 |
八、最佳实践
8.1 技能组合使用
# 最佳实践:按顺序使用技能
# 1. 产品规划
/plan-ceo-review # 确保方向正确
# 2. 技术规划
/plan-eng-review # 确保架构可行
# 3. 实现
# ... 正常编码 ...
# 4. 代码审查
/review # 发现问题
# 5. 发布
/ship # 自动化发布
# 6. 测试
/qa # 验证功能
# 7. 文档
/document-release # 更新文档
8.2 浏览器测试技巧
# 导入已登录的会话
/setup-browser-cookies github.com,myapp.com
# 快速冒烟测试
/qa https://staging.myapp.com --quick
# 完整测试
/qa https://staging.myapp.com
# 检查特定页面
/browse https://staging.myapp.com/checkout
8.3 避坑指南
常见问题:
1. 技能未显示
解决:运行 cd ~/.claude/skills/gstack && ./setup
2. 浏览器二进制缺失
解决:运行 cd ~/.claude/skills/gstack && bun install && bun run build
3. Bun 未安装
解决:curl -fsSL https://bun.sh/install | bash
4. Cookies 导入失败
解决:确保在 macOS Keychain 提示时点击"允许"
5. Greptile 集成不工作
解决:确保在 greptile.com 安装了 GitHub 应用
九、总结
9.1 优势
| 优势 | 说明 |
|---|---|
| 角色切换 | 一键切换 AI 的认知模式 |
| 浏览器自动化 | 让 AI 拥有"眼睛" |
| 工作流标准化 | 将模糊交互转为结构化流程 |
| 并行执行 | Conductor 支持 10 个并行会话 |
| 名人背书 | YC CEO 的真实工作配置 |
| 开源免费 | MIT 许可证 |
9.2 劣势
| 劣势 | 说明 |
|---|---|
| 学习曲线 | 需要熟悉 Claude Code |
| 平台限制 | 不支持 Windows |
| 争议 | 生产力声明引发质疑 |
| 依赖 Bun | 需要额外安装 |
| 文档 | 部分功能文档不完整 |
9.3 最终评价
推荐指数:⭐⭐⭐⭐⭐ (5/5)
适合人群:
- 重度 Claude Code 用户
- 追求高效率的开发团队
- 需要浏览器自动化的场景
- 想要标准化工作流的团队
不建议人群:
- Claude Code 新手
- 只需要简单 AI 辅助的用户
- Windows 用户
- 不需要复杂工作流的场景
十、参考资料
官方资源
社区讨论
相关文章
- Garry Tan's gstack: Running Claude Like an Engineering Team
- GStack: Installing Garry Tan's Claude Code Setup
- The Y Combinator CEO Crushed 100 PRs in 7 Days
调研完成于 2026-03-17