第 12 章 · 系统实战
自主 AI 代理团队搭建实战
本章基于两篇实战材料整理:X 平台英文原帖《How I built an Autonomous AI Agent team that runs 24/7》与其中文整理文章,聚焦可落地的系统方法。
🎯 案例核心结论
- 单 Agent 同时承担多职责,容易出现上下文拥挤与输出质量下降。
- 多 Agent 专职分工可提升稳定性:每个 Agent 只做一个清晰岗位任务。
- 系统护城河来自流程与记忆,而不是某个单一模型。
- “一写多读”的文件协作比复杂中间件更可靠、可维护。
🧑🤝🧑 角色分工模板(6 Agent 参考)
| 角色 | 职责 | 关键产出 |
|---|---|---|
| Monica(协调) | 统筹任务、分发工作、监控健康状态 | 任务路由、异常处理、每日汇总 |
| Dwight(研究) | 多源检索、去噪、结构化情报输出 | intel/DAILY-INTEL.md + JSON 数据 |
| Kelly(X 内容) | 读取情报并生成 X 内容草稿 | 单条/线程草稿与发布时间建议 |
| Rachel(LinkedIn) | 同源情报转化为专业观点型内容 | LinkedIn 长文草案 |
| Ross(工程) | 代码审查、缺陷修复、实现任务 | PR 审核意见、修复补丁 |
| Pam(通讯) | 将情报压缩为可发送通讯摘要 | Newsletter 草稿 |
📂 文件系统协作架构(推荐)
workspace/
├── SOUL.md # 主协调 Agent
├── AGENTS.md # 全局规则
├── MEMORY.md # 主 Agent 长期记忆
├── HEARTBEAT.md # 自愈检查
├── agents/
│ ├── dwight/
│ │ ├── SOUL.md
│ │ ├── AGENTS.md
│ │ └── memory/
│ ├── kelly/
│ ├── rachel/
│ ├── ross/
│ └── pam/
└── intel/
├── DAILY-INTEL.md # 一写多读
└── data/YYYY-MM-DD.json
关键设计:坚持“一写多读”。研究 Agent 写入,其他 Agent 只读,避免并发写冲突。
🧠 记忆与自愈机制
双层记忆
memory/YYYY-MM-DD.md:会话原始日志。MEMORY.md:长期提炼结论(偏好、规则、经验教训)。
心跳自愈
# 每次 heartbeat 执行
# 如果某个日常任务超过 26 小时未运行,强制重跑
openclaw cron run <jobId> --force
实践要点:心跳用于“健康巡检 + 批处理补偿”,Cron 用于“精确时间触发”。
🧪 常见故障与修复策略
| 问题 | 典型原因 | 修复方式 |
|---|---|---|
| Gateway 异常 | 进程异常退出 | openclaw gateway restart |
| Cron 漏跑 | 休眠/断网/API 限流 | HEARTBEAT 检测陈旧任务并补跑 |
| 上下文溢出 | 启动加载过多历史文件 | SOUL 简化到 40-60 行,仅加载近 1-2 天记忆 |
| 输出质量波动 | 记忆文件冲突或噪声累积 | 定期归档 daily log,提炼 MEMORY |
| 协作冲突 | 多 Agent 并发写同一文件 | 改为单写者(One Writer)模式 |
📅 四周渐进实施路线
Week 1:1 个 Agent + 1 个任务 + 1 个定时规则,先跑稳。
Week 2:引入双层记忆,持续纠偏 SOUL 与规则。
Week 3:新增第 2 个 Agent,建立“写-读”共享文件协作。
Week 4+:按真实工作缺口逐个扩编,不追求一次性堆满编制。