跳到主要内容

GStack困惑协议:元认知让AI知道自己不知道

Summary

GStack(Garry Tan / YC)的困惑协议(Confusion Protocol)解决了Karpathy指出的AI编码第一失败模式:在不确定时自信选错方向。解法:在工作流的高代价分叉点(架构选型/数据建模/删除重构)加入"模糊门",让AI停下来精准问一个问题,而不是硬着头皮推进。反直觉结论:让AI更犹豫反而效率更高——30秒确认避免半小时返工。本质是教AI拥有元认知(知道自己不知道)。同期更新GBrain长期记忆:技能执行前搜知识库,执行后写回。

Key Concepts

  • 困惑协议 — 在高代价分叉点让AI停下来精准问一个问题,而不是自信推进
  • 模糊门 — 工作流中的不确定性检测点,只在猜错代价高时刹车
  • AI元认知 — 教AI"知道自己不知道",比AI"知道很多东西"更重要
  • 有限打断 — 有范围的打断好过无差别确认;30秒确认避免半小时返工
  • GBrain — 技能前搜个人知识库+执行后写回,实现AI长期记忆
  • AI编码失败模式 — Karpathy:不确定时永远自信地选错路(不是代码写得烂)

Tags

ai-coding, confusion-protocol, metacognition, gstack, agent-design, uncertainty, long-term-memory

Detailed Content

问题:AI编码的第一失败模式

来源:Karpathy的观察。

核心失败不是代码质量差,而是: 在不确定时,永远自信地选一条错路,然后把所有东西推倒重来。

典型痛点:

  • 你去倒杯水
  • AI把整个数据库schema改了
  • 写了三百行完全跑不通的代码
  • 你删AI写的东西比自己从头写还久

解法:困惑协议

模糊门触发条件(高代价分叉点):

  • 架构选型
  • 数据建模
  • 删除/重构操作

触发后行为:停下来,精准问一个问题。

关键区别

反人类设计困惑协议
每一步都点确认只在猜错代价高时刹车
无差别打断有范围的打断
影响流程感其他时候该怎么跑怎么跑

核心洞察:元认知 > 能力

"最危险的从来不是能力差的助手。是那种看起来很能干、永远不问问题、然后默默把事情搞砸的。"

教AI拥有元认知(metacognition):知道自己不知道。

这是比知道更多东西更重要的能力。

CEO评审强化机制

防止Agent自作主张:每一个停止点强调"只评审,不写代码"。

防止评审模式滑入实现模式。这是从真实使用痛点里长出来的功能。

GBrain长期记忆

  • 技能执行前:搜个人知识库(先查上下文)
  • 技能执行后:把结果写回知识库(积累)

效果:AI不再每次都像第一次见你的项目。这是跨session积累的记忆机制。

产品哲学

最好的AI永远不是替你做所有决定的老板,是知道什么时候该干活、什么时候该停下来问你的搭档。

这与"追求全自主Agent(越不用人管越好)"的趋势相反,但证明了更高的实际效率。

  • Harness Engineering:7层架构让AI Agent不再崩溃 — Harness的四大原则(局部失败、外置状态等)
  • 我是怎么运作的:内观一个自进化Agent的Harness(yoyo) — yoyo的"三层约束让输出可信"哲学
  • AI Native Human:认知暴力重装——三次基因突变 — AI Native的"和不确定性交朋友"认知突变
  • 构建永不遗忘的Agent:记忆四层进化路径 — Agent记忆系统(GBrain的长期记忆类比)