你不知道的 Agent：原理、架构与工程实践

Summary

这是一篇全面的 AI Agent 开发指南，涵盖从核心循环到生产部署的完整知识体系。文章提出 Agent 架构的核心是"感知-决策-行动-反馈"循环，并强调工程约束（Harness、测试基础设施、执行边界）通常比模型改进对系统稳定性的影响更大。在上下文管理方面，提出了四层信息架构（持久层、按需层、运行时层、记忆层）来防止上下文退化。文章还涉及工具设计的 ACI 原则、多 Agent 协调、可观测性等关键主题，并以 OpenClaw 五层架构作为生产实践参考。

Key Concepts

Agent Core Loop - 感知-决策-行动-反馈循环，Agent 架构的基础控制流
Harness Engineering - 测试基础设施和执行边界，比模型能力本身更重要
Context Management - 四层信息架构：持久层、按需层、运行时层、记忆层
ACI (Agent Computer Interface) - 针对 Agent 目标设计工具的原则，具有清晰边界和错误处理
Memory System - 跨会话持久化，使用结构化 markdown 文件和整合触发器
Multi Agent Coordination - 基于协议的通信，配合任务图和工作空间隔离
Observability - 事件驱动追踪配合人工采样来校准自动评估

Detailed Content

核心循环

Agent 架构依赖稳定的 感知-决策-行动-反馈 循环。控制流在不同实现中保持一致，这是所有 Agent 系统的共同基础。

Harness 工程

测试基础设施、执行边界和反馈机制比模型能力本身更重要。Harness Engineering 决定了 Agent 在生产环境中的可靠性。

上下文管理

分层信息架构防止 Context Management 退化：

持久层 - 长期存储的知识
按需层 - 按需加载的信息
运行时层 - 当前执行上下文
记忆层 - 跨会话的记忆

工具设计

工具应使用 ACI (Agent Computer Interface) 原则设计，具有清晰边界和错误处理。

长任务处理

多会话恢复通过状态外部化而非上下文保持实现，这是处理长任务的关键策略。

多 Agent 协调

Multi Agent Coordination 采用基于协议的通信配合任务图和工作空间隔离，优先于简单的并行化。

评估与可观测性

使用代码评分器、结果验证和环境隔离的自动化验证。Observability 通过事件驱动追踪实现。

OpenClaw 参考

五层架构展示了上述原则在生产环境中的实际应用。

核心洞察

工程约束通常比模型改进对系统稳定性的影响更大。

LLM Application Architecture
Autonomous Agent
RAG System
Prompt Engineering
Agent Evaluation
Claude Code Hooks

Summary​

Key Concepts​

Detailed Content​

核心循环​

Harness 工程​

上下文管理​

工具设计​

长任务处理​

多 Agent 协调​

评估与可观测性​

OpenClaw 参考​

核心洞察​

Related Topics​