你不知道的Agent：原理、架构与工程实践

Summary

Tw93的Agent工程实践深度指南，覆盖从基础原理到生产架构的完整知识体系。核心论点是Harness质量比模型层级更重要，Agent稳定性来自工程严谨性而非复杂性。文章系统性地阐述了Agent Loop基础、Context Engineering分层策略、五种控制模式、四层Memory Architecture、多Agent组织结构，以及评测与可观测性方法。特别强调工具设计遵循ACI原则，出问题时"先检查工具定义"。

Key Concepts

Agent Loop - 感知->决策->行动->反馈的基本循环，约20行代码
Harness - 工程约束（验收基线、执行边界、回退机制），比模型能力更重要
Context Engineering - 按频率分层信息管理，避免Context Rot
Memory Architecture - 四层记忆：上下文窗口、Skills、JSONL日志、MEMORY.md
Multi Agent System - Director模式（同步）与Orchestrator模式（异步）
Agent Evaluation - Pass@k（能力探索）与Pass^k（回归测试）

Detailed Content

核心原则

****Agent Loop基础：基本循环约20行代码，经过感知->决策->行动->反馈阶段。能力通过工具集和状态外部化扩展。

****Harness比模型更重要：工程约束对可验证任务来说比原始模型能力更重要。

Context Engineering：Context Rot（无关内容稀释信号）比上下文不足更成问题。按频率分层：永久、按需、运行时、记忆、系统。避免将确定性逻辑塞入prompt。

五种控制模式

Prompt Chaining - 提示词链式调用
Routing - 路由分发
Parallelization - 并行化
Orchestrator-Workers - 编排器-工作者
Evaluator-Optimizer - 评估器-优化器

大多数系统有效组合2-3种模式。

工具设计（ACI原则）

映射到Agent目标而非API端点；包含使用边界（"何时使用/不要使用"）；提供带恢复建议的结构化错误；添加调用示例（准确率从72%提升到90%）。

Memory Architecture

四层记忆：上下文窗口（工作记忆）、Agent Skills（程序性记忆）、JSONL日志（情景记忆）、MEMORY.md（语义记忆）。在50% token使用率时自动整合。保留架构决策和约束推理，选择性压缩工具输出。

Multi Agent System

Director模式：同步，持续人类参与
Orchestrator模式：异步委派，产出持久化产物（分支、PR）

严格协议优于自然语言，幻觉在Agent层间放大，交叉验证打破错误链。

Agent Evaluation

Pass@k：Agent理论上能否完成任务（能力探索）
Pass^k：所有k次运行都成功吗（回归测试）

"评测系统的bug比Agent的bug更难发现"，先修评测系统再调Agent。

安全模式

三层防护：白名单授权、工作区隔离+路径验证、全面审计日志。

常见反模式

工具无控制膨胀、记忆断连、零评测、过早多Agent扩展、文档化约束（应通过linter/hooks强制执行）。

Claude Code
Agent Skills
Progressive Disclosure
Agentic Engineering
OpenClaw

Summary​

Key Concepts​

Detailed Content​

核心原则​

五种控制模式​

工具设计（ACI原则）​

Memory Architecture​

Multi Agent System​

Agent Evaluation​

安全模式​

常见反模式​

Related Topics​