learn claude code
workflow、提示词链编排库、无代码……不是agent。
只是一个脆弱的流水线,pipline。
在开发agent时,只可能是两个意思
- 训练模型,通过强化学习、微调、rlhf去调整权重
- 构造harness,为模型提供一个可操作的环境。
1 | Harness = Tools + Knowledge + Observation + Action Interfaces + Permissions |
模型做决策,harness执行。模型做推理,harness提供上下文。模型是决策者,而harness是载具。
如何做一名master of harness?
- 实现工具。要给agent一双手。文件读写、shell执行、api调用、浏览器控制、数据库查询。
- 策划知识。要给agent领域专长。比如产品文档、架构决策记录、风格指南、合规要求。应该要按需加载,agent要自己获得所需的内容。
- 管理上下文。给agent干净的记忆。sub agent隔离防止噪声泄露,上下文压缩来防止历史淹没,任务系统让目标持久化到单次对话之外。
- 控制权限。给agent边界,沙箱化文件访问。
- 收集任务过程数据。agent在每一次执行的行动序列都是训练信号。
1 | Claude Code = 一个 agent loop |
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Johnny-Zhao's TechBlog!
