第 12 章 · 系统实战

自主 AI 代理团队搭建实战

本章基于两篇实战材料整理：X 平台英文原帖《How I built an Autonomous AI Agent team that runs 24/7》与其中文整理文章，聚焦可落地的系统方法。

🎯 案例核心结论

单 Agent 同时承担多职责，容易出现上下文拥挤与输出质量下降。
多 Agent 专职分工可提升稳定性：每个 Agent 只做一个清晰岗位任务。
系统护城河来自流程与记忆，而不是某个单一模型。
“一写多读”的文件协作比复杂中间件更可靠、可维护。

🧑‍🤝‍🧑 角色分工模板（6 Agent 参考）

角色	职责	关键产出
Monica（协调）	统筹任务、分发工作、监控健康状态	任务路由、异常处理、每日汇总
Dwight（研究）	多源检索、去噪、结构化情报输出	`intel/DAILY-INTEL.md` + JSON 数据
Kelly（X 内容）	读取情报并生成 X 内容草稿	单条/线程草稿与发布时间建议
Rachel（LinkedIn）	同源情报转化为专业观点型内容	LinkedIn 长文草案
Ross（工程）	代码审查、缺陷修复、实现任务	PR 审核意见、修复补丁
Pam（通讯）	将情报压缩为可发送通讯摘要	Newsletter 草稿

📂 文件系统协作架构（推荐）

workspace/
├── SOUL.md                 # 主协调 Agent
├── AGENTS.md               # 全局规则
├── MEMORY.md               # 主 Agent 长期记忆
├── HEARTBEAT.md            # 自愈检查
├── agents/
│   ├── dwight/
│   │   ├── SOUL.md
│   │   ├── AGENTS.md
│   │   └── memory/
│   ├── kelly/
│   ├── rachel/
│   ├── ross/
│   └── pam/
└── intel/
    ├── DAILY-INTEL.md      # 一写多读
    └── data/YYYY-MM-DD.json

关键设计：坚持“一写多读”。研究 Agent 写入，其他 Agent 只读，避免并发写冲突。

🧠 记忆与自愈机制

双层记忆

memory/YYYY-MM-DD.md：会话原始日志。
MEMORY.md：长期提炼结论（偏好、规则、经验教训）。

心跳自愈

# 每次 heartbeat 执行
# 如果某个日常任务超过 26 小时未运行，强制重跑
openclaw cron run <jobId> --force

实践要点：心跳用于“健康巡检 + 批处理补偿”，Cron 用于“精确时间触发”。

🧪 常见故障与修复策略

问题	典型原因	修复方式
Gateway 异常	进程异常退出	`openclaw gateway restart`
Cron 漏跑	休眠/断网/API 限流	HEARTBEAT 检测陈旧任务并补跑
上下文溢出	启动加载过多历史文件	SOUL 简化到 40-60 行，仅加载近 1-2 天记忆
输出质量波动	记忆文件冲突或噪声累积	定期归档 daily log，提炼 MEMORY
协作冲突	多 Agent 并发写同一文件	改为单写者（One Writer）模式

📅 四周渐进实施路线

Week 1：1 个 Agent + 1 个任务 + 1 个定时规则，先跑稳。

Week 2：引入双层记忆，持续纠偏 SOUL 与规则。

Week 3：新增第 2 个 Agent，建立“写-读”共享文件协作。

Week 4+：按真实工作缺口逐个扩编，不追求一次性堆满编制。

🔗 原始资料

X 原帖：How I built an Autonomous AI Agent team that runs 24/7
公众号整理文：用OpenClaw打造一支24小时无休的AI团队，实战来了！

从“一个万能 Agent”转向“一支可维护团队”

先跑通单点，再做分工与自愈，长期收益会明显放大。

进入第 13 章