在日常生活和工作中,从OpenClaw到各种Code Agent,我们接触了各种各样的AI Agent,这也是AI大模型在日常应用中最主要的应用形式。
早期的AI应用,大多停留在”提示词调优”的阶段——通过优化单次对话的Prompt,让大模型完成特定任务。但当我们试图让AI真正落地到复杂业务场景时,只通过对Prompt的优化很快就遇到了瓶颈:工具调用频繁出错、多任务协同混乱、上下文溢出导致幻觉等问题层出不穷。

针对这些问题,慢慢衍生出一些标准的工程化基础设施,其中最核心的三个是:MCP协议、SKILLS封装和Context Engineer上下文工程。
MCP(Model Context Protocol)由Anthropic在2024年11月开源发布,核心价值是为大模型与工具之间提供一套统一的、上下文感知的通信协议。它定义了标准化的工具元数据格式、参数校验规则、返回结构与错误处理机制,Agent无需针对单个工具做定制化适配,大幅提升工具调用的成功率与稳定性。
SKILLS的本质,是将多个原子工具、固定业务流程、Prompt逻辑和错误处理机制打包封装成的可复用业务能力单元。比如”用户行为数据分析”技能,就可以封装”SQL数据查询→数据清洗→指标计算→可视化生成→报告输出”的全流程,无需让大模型每次都从零拆解任务。

Context Engineer要解决的是80%的Agent故障都不是大模型能力不足,而是上下文管理混乱导致的。短期记忆支撑当前任务执行,中期记忆支撑任务复盘与反思,长期记忆支撑Agent的持续学习迭代。
实现个人助理Agent时,技术栈选择pydantic-AI框架,原因是它提供了开箱即用的MCP客户端实现,通过MCPServerStdio构建客户端连接,支持流式响应,且对上下文的处理提供很好的支持。

SKILLS的支持核心逻辑是:当获取到用户输入内容时,依次和收集的SKILL元数据的描述内容做对比,如果匹配到了,就将完整SKILL内容拼接到系统提示词后面,随用户输入内容一起发送给大模型。
整个Agent系统的开发,是将MCP、SKILLS和Context Engineer三者协同运作的过程。MCP提供标准化的协议与管控层,SKILLS基于前两者完成面向业务的能力封装,Context Engineer负责全流程的上下文高效流转。三者共同构成了Agent完整的行动体系,让Agent真正具备”动手做事”的能力。
OpenClaw—AI研究