第 12 章 · 系统实战

自主 AI 代理团队搭建实战

本章基于两篇实战材料整理:X 平台英文原帖《How I built an Autonomous AI Agent team that runs 24/7》与其中文整理文章,聚焦可落地的系统方法。

🎯 案例核心结论

  • 单 Agent 同时承担多职责,容易出现上下文拥挤与输出质量下降。
  • 多 Agent 专职分工可提升稳定性:每个 Agent 只做一个清晰岗位任务。
  • 系统护城河来自流程与记忆,而不是某个单一模型。
  • “一写多读”的文件协作比复杂中间件更可靠、可维护。

🧑‍🤝‍🧑 角色分工模板(6 Agent 参考)

角色 职责 关键产出
Monica(协调) 统筹任务、分发工作、监控健康状态 任务路由、异常处理、每日汇总
Dwight(研究) 多源检索、去噪、结构化情报输出 intel/DAILY-INTEL.md + JSON 数据
Kelly(X 内容) 读取情报并生成 X 内容草稿 单条/线程草稿与发布时间建议
Rachel(LinkedIn) 同源情报转化为专业观点型内容 LinkedIn 长文草案
Ross(工程) 代码审查、缺陷修复、实现任务 PR 审核意见、修复补丁
Pam(通讯) 将情报压缩为可发送通讯摘要 Newsletter 草稿

📂 文件系统协作架构(推荐)

workspace/
├── SOUL.md                 # 主协调 Agent
├── AGENTS.md               # 全局规则
├── MEMORY.md               # 主 Agent 长期记忆
├── HEARTBEAT.md            # 自愈检查
├── agents/
│   ├── dwight/
│   │   ├── SOUL.md
│   │   ├── AGENTS.md
│   │   └── memory/
│   ├── kelly/
│   ├── rachel/
│   ├── ross/
│   └── pam/
└── intel/
    ├── DAILY-INTEL.md      # 一写多读
    └── data/YYYY-MM-DD.json

关键设计:坚持“一写多读”。研究 Agent 写入,其他 Agent 只读,避免并发写冲突。

🧠 记忆与自愈机制

双层记忆

  • memory/YYYY-MM-DD.md:会话原始日志。
  • MEMORY.md:长期提炼结论(偏好、规则、经验教训)。

心跳自愈

# 每次 heartbeat 执行
# 如果某个日常任务超过 26 小时未运行,强制重跑
openclaw cron run <jobId> --force

实践要点:心跳用于“健康巡检 + 批处理补偿”,Cron 用于“精确时间触发”。

🧪 常见故障与修复策略

问题 典型原因 修复方式
Gateway 异常 进程异常退出 openclaw gateway restart
Cron 漏跑 休眠/断网/API 限流 HEARTBEAT 检测陈旧任务并补跑
上下文溢出 启动加载过多历史文件 SOUL 简化到 40-60 行,仅加载近 1-2 天记忆
输出质量波动 记忆文件冲突或噪声累积 定期归档 daily log,提炼 MEMORY
协作冲突 多 Agent 并发写同一文件 改为单写者(One Writer)模式

📅 四周渐进实施路线

Week 1:1 个 Agent + 1 个任务 + 1 个定时规则,先跑稳。
Week 2:引入双层记忆,持续纠偏 SOUL 与规则。
Week 3:新增第 2 个 Agent,建立“写-读”共享文件协作。
Week 4+:按真实工作缺口逐个扩编,不追求一次性堆满编制。

🔗 原始资料

从“一个万能 Agent”转向“一支可维护团队”

先跑通单点,再做分工与自愈,长期收益会明显放大。

进入第 13 章