Claude Code CLI + Ralph：让 AI 自动完成大型编程任务的终极方案

Fuyu Jia

13 Apr 2026 — 7 min read

TL;DR

当你的编程任务大到一个 AI 对话窗口装不下时，Ralph 会帮你把任务拆成小块，让 Claude Code CLI 一个接一个地自动完成——每轮都用全新的上下文窗口，不会越写越糊涂。

一、什么是 Ralph？

Ralph Hero Image — Ralph — 自主 AI Agent 循环引擎

Ralph 是一个开源项目（GitHub 16k+ Stars），基于 Geoffrey Huntley 提出的 "Ralph Pattern" 构建。它的核心理念很简单：

不要让 AI 在一个漫长的会话里做完所有事情，而是把大任务拆成小故事，每个故事用一个全新的 AI 实例来完成。

这解决了 AI 编程中最常见的痛点——上下文窗口耗尽。当对话越来越长，AI 的输出质量会明显下降。Ralph 通过「每轮一个新实例」的方式，确保每次 AI 都在最佳状态下工作。

核心特性

自主循环：无需人工干预，自动一个接一个完成用户故事
上下文常新：每轮迭代都启动全新的 AI 实例，告别上下文污染
跨轮记忆：通过 Git 历史 + progress.txt + prd.json 实现"记忆传递"
质量守护：每轮自动运行 typecheck、lint、测试，确保代码质量
支持多种 AI 工具：兼容 Claude Code CLI 和 Amp CLI

二、安装与配置

前置要求

Claude Code CLI：npm install -g @anthropic-ai/claude-code
jq（JSON 处理工具）：brew install jq（macOS）或 apt install jq（Linux）
一个 Git 仓库（Ralph 依赖 Git 来持久化进度）

安装方式一：复制到项目（推荐入门）

# 克隆 Ralph
git clone https://github.com/snarktank/ralph.git

# 复制到你的项目
mkdir -p scripts/ralph
cp ralph/ralph.sh scripts/ralph/
cp ralph/CLAUDE.md scripts/ralph/CLAUDE.md
chmod +x scripts/ralph/ralph.sh

安装方式二：全局安装 Skills

# 安装 PRD 生成和 Ralph 转换技能
cp -r skills/prd ~/.claude/skills/
cp -r skills/ralph ~/.claude/skills/

安装后你可以在 Claude Code 中直接使用 /prd 和 /ralph 命令。

安装方式三：Claude Code 插件市场

# 在 Claude Code 中执行
/plugin marketplace add snarktank/ralph
/plugin install ralph-skills@ralph-marketplace

三、工作原理

Ralph 的核心就是一个 Bash 循环脚本。下面这张流程图展示了它的完整工作流：

每轮迭代的 10 个步骤

检查/创建特性分支：根据 prd.json 中的 branchName 字段
启动全新 AI 实例：将 CLAUDE.md 作为 prompt 传入 Claude Code
读取任务状态：AI 读取 prd.json 和 progress.txt
选取最高优先级的未完成故事：找到 passes: false 的用户故事
实现该故事：编写代码、修改文件
运行质量检查：typecheck → lint → test
提交代码：feat: [Story ID] - [Story Title]
更新 prd.json：标记故事为 passes: true
记录经验到 progress.txt：供后续迭代参考
检查是否全部完成：是 → 输出 COMPLETE 并退出；否 → 下一轮

记忆传递的三大支柱

虽然每轮 AI 实例都是"失忆"的，但 Ralph 通过三个文件实现了跨轮记忆：

文件	作用	类比
Git 历史	保存所有已完成的代码变更	长期记忆
progress.txt	记录每轮的经验教训和踩坑记录	笔记本
prd.json	追踪每个用户故事的完成状态	看板/待办清单

此外，Ralph 还会更新 AGENTS.md 文件，记录代码库的模式和注意事项。Claude Code 会自动读取这个文件，相当于给 AI 提供了"团队知识库"。

四、完整使用教程

Step 1：创建 PRD（产品需求文档）

在 Claude Code 中使用 /prd 技能：

> Load the prd skill and create a PRD for:
  为博客系统添加文章标签过滤功能

Ralph 会向你提 3-5 个澄清问题，然后生成结构化的 PRD 文件，保存为 tasks/prd-tag-filter.md。

Step 2：将 PRD 转换为 Ralph 格式

> Load the ralph skill and convert tasks/prd-tag-filter.md to prd.json

这会生成核心的 prd.json 文件，结构如下：

{
  "project": "MyBlog",
  "branchName": "ralph/tag-filter",
  "goal": "为博客添加标签过滤功能",
  "userStories": [
    {
      "id": "US-001",
      "title": "创建标签数据模型",
      "passes": false,
      "priority": 1
    },
    {
      "id": "US-002",
      "title": "实现标签 API 端点",
      "passes": false,
      "priority": 2
    },
    {
      "id": "US-003",
      "title": "添加前端标签过滤 UI",
      "passes": false,
      "priority": 3
    }
  ]
}

注意事项：每个用户故事必须足够小，能在一个 AI 上下文窗口内完成。好的拆分粒度示例：

✅ "添加数据库字段和迁移"
✅ "为现有页面添加一个 UI 组件"
❌ "构建整个仪表盘"（太大）
❌ "添加完整的认证系统"（太大）

Step 3：启动 Ralph

# 使用 Claude Code 运行，最多 15 轮迭代
./scripts/ralph/ralph.sh --tool claude 15

然后就可以泡杯咖啡，看 Ralph 自动干活了。它会：

创建 ralph/tag-filter 分支
逐个完成用户故事
每完成一个就提交代码并更新状态
全部完成后自动停止

Step 4：检查进度

在 Ralph 运行过程中，你随时可以查看进度：

# 查看每个故事的完成状态
cat prd.json | jq '.userStories[] | {id, title, passes}'

# 查看经验记录
cat progress.txt

# 查看 Git 提交历史
git log --oneline -10

五、实际运行效果

以一个典型的中型功能为例，Ralph 的表现大致如下：

指标	手动使用 Claude Code	使用 Ralph
可处理的任务规模	1 个上下文窗口	理论上无限
上下文质量	随对话变长而下降	每轮都是满血状态
是否需要人工干预	经常需要	基本不需要
代码质量保障	依赖人工 review	每轮自动 check

六、最佳实践与注意事项

故事要小：每个用户故事应该能在单个上下文窗口内完成，这是 Ralph 能正常工作的前提
测试先行：确保项目有完善的 typecheck、lint 和测试，Ralph 依赖这些反馈循环来保证质量
按依赖排序：priority 字段决定执行顺序，确保被依赖的故事优先完成
定制 CLAUDE.md：根据你的项目添加特定的质量检查命令、代码规范和常见坑点
定期检查：虽然 Ralph 是自动化的，但建议每隔几轮检查一下 progress.txt 和代码质量

七、项目关键文件一览

文件	用途
`ralph.sh`	核心 Bash 循环脚本
`CLAUDE.md`	Claude Code 的 Prompt 模板
`prd.json`	用户故事及完成状态
`progress.txt`	跨轮经验记录
`AGENTS.md`	AI 的"团队知识库"
`skills/prd/`	PRD 生成技能
`skills/ralph/`	PRD 转 JSON 技能

总结

Ralph 代表了 AI 辅助编程的一个重要演进方向：不是让 AI 更聪明，而是让 AI 更聪明地工作。通过将大任务拆解为小故事、每轮使用全新上下文、并通过文件系统传递记忆，Ralph 突破了单次对话的局限，让 Claude Code 能够处理真正大规模的编程任务。

如果你正在使用 Claude Code 进行日常开发，强烈建议尝试 Ralph。它可能会改变你对 AI 编程的认知——从"AI 助手"变成"AI 自动化工程团队"。

相关链接：

序章：长夜之后

后来的历史书把那一天称为“长夜之后”。这个名字并不准确。事情发生在地球上的许多个白天和夜晚之间，发生在不同经度的清晨、午后、傍晚，发生在地下库房、山体掩体、海军基地、荒原试验场和无人值守的材料贮存井里。它既不是一场战争，也不是一次统一指挥的袭击。没有人按下那个能够解释一切的按钮。但历史需要一个名称。 “长夜之后”最终被保留下来，是因为调查者在追溯事件源头时，不得不一次又一次回到海王星。回到那颗距离太阳太远、光照近乎吝啬的蓝色行星。回到六名中国宇航员死去的地方。回到一艘核动力科考船熄灭后的漫长黑暗。在联合调查委员会公开的第一版报告中，事件时间线被压缩成了一页表格。 2030年9月，问海一号在海王星附近失联。 2034年11月，问海二号抵达失事区域，确认问海一号全员死亡。 2035年1月，问海二号完成样本封装，开始返航。 2038年6月，海王星样本进入地球高等级隔离实验室。 2038年7月，全球多个核材料设施发生不可逆事故，部分核电站进入最高级别应急。 2038年8月，所有已知核武库事实上失效，全球核电装机大规模停运。这张表格后来被反复引用，因为它足够冷静，也

第一章：四小时以前的地球

林予舟第一次听见“问海一号”的最后通信，是在距离地面三百九十公里的轨道上。那不是一个适合听遗言的地方。舷窗外，地球从飞船腹侧缓慢转过去，云层像被谁铺平的白色金属屑，青藏高原的阴影压在晨昏线上。太阳还没有完全越出地平线，近地轨道的黑暗因此显得很薄，像一层马上要被擦掉的墨。 “链路稳定。”林予舟说。他的声音被舱内麦克风收进去，压缩，打包，送进中继卫星，再落回海南深空任务中心。延迟不到一秒。这样奢侈的实时感，在他们离开地月系统后会迅速消失。等飞船抵达海王星附近，地球说一句话，要四个小时左右才能抵达；他们回一句，地球也要再等四个小时。对话会变成考古。控制台上方的状态灯一排排亮着，绿色多得几乎让人不安。问海二号还在近地轨道泊位上，推进舱、居住舱、通信桁架和补给舱刚完成最后一次组合检查。它不像公众宣传片里那样优雅。现实中的深空飞船更像一串被迫相互妥协的工程物：银灰色隔热层、外露管线、姿控喷口、展开到一半的高增益天线，所有东西都为了质量、功耗、散热和冗余让步。它也不像一艘该去海王星的船。至少不像一艘该去救援核动力深空飞船的船。问海二号没有主反应堆。这件事在公开报

第二章：没有核反应堆的船

发射前四十分钟，林予舟收到了一条来自地面的私人通信。通信被压在任务数据包后面，标记为低优先级。它随着推进剂温度曲线、姿态平台校准结果、医学监测基线和最后一版逃逸窗口修正量一起进入问海二号的主机，像一枚被夹在工具箱里的薄纸片。林予舟本来不该在这个时候打开它。发射前四十分钟，人的每一个动作都应当有明确目的。检查阀门状态，确认加压序列，复诵逃逸程序，核对地面口令。人的情绪如果在这个时候出现，就应该被折叠起来，放进某个不影响任务的地方。他还是点开了。画面里是母亲的厨房。抽油烟机没有开，镜头被热气熏得微微发白。桌上摆着一碗面，青菜、荷包蛋和切得很薄的牛肉。母亲没有出镜，只在画面外说：“我知道你现在不能吃，等回来再吃也一样。” 林予舟看着那碗面，隔了几秒才意识到自己没有呼吸。 “怎么了？”沈从越问。 “私人包。” “家里？” “嗯。” “看完删掉。”沈从越说，“别让它留在主屏缓存里。发射时系统会重排任务窗口，乱七八糟的东西越少越好。” 他语气平淡，不像关心，也不像责备。沈从越说话常常这样，像把所有情绪都预先压成了流程。林予舟关掉视频，把它转存进私人存储区。那碗面从

第三章：地球变成录音

离开地月系统后的第十九天，林予舟第一次觉得，地球不是一个地方，而是一种延迟。最初的几天，通信仍然近乎实时。地面问，他们答；他们报数，地面确认。贺岚的声音穿过中继链路抵达舱内时，还带着地球上办公室的秩序感：清晰、稳定、克制。林予舟甚至能从她停顿的长度判断总控大厅里有多少人在看同一块屏幕。后来，停顿被拉长。五秒。十七秒。一分钟。再后来，地球的每一句话都像从更早的时间里寄来。母亲发来的第二条视频在一个姿态修正段后抵达。她说北京降温了，问他那边冷不冷。林予舟看着舷窗外没有温度的黑暗，忽然不知道该怎么回答。他当然冷。但那不是气温。 “私人日志，任务日二十。”他说，“今天第一次做梦，梦见自己回到地面，站在厨房里。锅里有水，水一直不开。母亲在旁边说火太小，我低头看，灶台下面接着的是问海二号的离子推进器。” 他说完后，自己笑了一下。笑声在舱内很短，很快被风机吞掉。沈从越从设备舱飘过，听见最后半句：“梦境记录？” “心理监测要求。” “别把自己写得太正常。