你不知道的Agent:原理、架构与工程实践
Summary
Tw93的Agent工程实践深度指南,覆盖从基础原理到生产架构的完整知识体系。核心论点是Harness质量比模型层级更重要,Agent稳定性来自工程严谨性而非复杂性。文章系统性地阐述了Agent Loop基础、Context Engineering分层策略、五种控制模式、四层Memory Architecture、多Agent组织结构,以及评测与可观测性方法。特别强调工具设计遵循ACI原则,出问题时"先检查工具定义"。
Key Concepts
- Agent Loop - 感知->决策->行动->反馈的基本循环,约20行代码
- Harness - 工程约束(验收基线、执行边界、回退机制),比模型能力更重要
- Context Engineering - 按频率分层信息管理,避免Context Rot
- Memory Architecture - 四层记忆:上下文窗口、Skills、JSONL日志、MEMORY.md
- Multi Agent System - Director模式(同步)与Orchestrator模式(异步)
- Agent Evaluation - Pass@k(能力探索)与Pass^k(回归测试)
Detailed Content
核心原则
****Agent Loop基础:基本循环约20行代码,经过感知->决策->行动->反馈阶段。能力通过工具集和状态外部化扩展。
****Harness比模型更重要:工程约束对可验证任务来说比原始模型能力更重要。
Context Engineering:Context Rot(无关内容稀释信号)比上下文不足更成问题。按频率分层:永久、按需、运行时、记忆、系统。避免将确定性逻辑塞入prompt。
五种控制模式
- Prompt Chaining - 提示词链式调 用
- Routing - 路由分发
- Parallelization - 并行化
- Orchestrator-Workers - 编排器-工作者
- Evaluator-Optimizer - 评估器-优化器
大多数系统有效组合2-3种模式。
工具设计(ACI原则)
映射到Agent目标而非API端点;包含使用边界("何时使用/不要使用");提供带恢复建议的结构化错误;添加调用示例(准确率从72%提升到90%)。
Memory Architecture
四层记忆:上下文窗口(工作记忆)、Agent Skills(程序性记忆)、JSONL日志(情景记忆)、MEMORY.md(语义记忆)。在50% token使用率时自动整合。保留架构决策和约束推理,选择性压缩工具输出。
Multi Agent System
- Director模式:同步,持续人类参与
- Orchestrator模式:异步委派,产出持久化产物(分支、PR)
严格协议优于自然语言,幻觉在Agent层间放大,交叉验 证打破错误链。
Agent Evaluation
- Pass@k:Agent理论上能否完成任务(能力探索)
- Pass^k:所有k次运行都成功吗(回归测试)
"评测系统的bug比Agent的bug更难发现",先修评测系统再调Agent。
安全模式
三层防护:白名单授权、工作区隔离+路径验证、全面审计日志。
常见反模式
工具无控制膨胀、记忆断连、零评测、过早多Agent扩展、文档化约束(应通过linter/hooks强制执行)。
Related Topics
- Claude Code
- Agent Skills
- Progressive Disclosure
- Agentic Engineering
- OpenClaw