值得关注的 Agent Skills

落笔之前，顺手翻了一下之前关于LLM领域的技术动向记录，发现一个有意思的事情：Anthropic 这家公司除了经常在用户使用协议和声名上经常搞很抽象的事，在工程和模型上面不得不说真的是个落地和推进都很强的团队，颇有点当年Google几篇论文教育行业的味道。

去年十月，Anthropic 发布了一个叫做 Agent Skills 的项目，目标是让大模型能够更好地适应和执行复杂任务。这个项目的核心思想是通过定义一套“技能”（Skills），让模型能够像人类一样，逐步学习和掌握各种任务的执行方法：Equipping agents for the real world with Agent Skills。我其实没有立即跟进，因为当时看到大家的讨论都觉得这个项目和颇有点从MCP又回到function calling的感觉，不仅没什么新意，反而有种背叛初心的意味。

几个月以后，重新审视了这个项目，发现它其实有一些值得我们深入探讨。Agent Skills提到的几个核心优势：

可组合性：技能可以像积木一样组合，形成更复杂的行为。
可重用性：技能可以在不同任务中复用，提高开发效率。
专用性：为领域任务进行能力剪裁适配。

而这几个优势其实本质上都是基于LLM的function calling能力，但Anthropic通过“技能”这个概念，赋予了这些能力更高的抽象层次和组织结构，使得开发者能够更方便地管理和调用这些功能模块。而这种工程上的构建思路其实是非常值得借鉴的：

当前的 Agent 其实都免不了在 workflow 与 task decomposition 上面下功夫，而agent本身也可以看所是一个复杂的function calling。
这个世界本身就是一个无限嵌套循环的function calling过程，不断折叠的过程。
这种无限循环嵌套的过程需要进行更高层次的抽象和组织，才能更好地管理和调用这些功能模块。
而这个层次的抽象和组织，其实跟OpenAI定义的人工智能能力标准和方向不谋而合。

使用文件系统进行技能的构建很多人觉得“挺落后的”。而我认为这本身本身无可厚非。一方面技能本身是一个工程实践的产物，如果使用场景本身就是跟沙箱等环境相关联，那么使用文件系统进行技能的构建其实是非常合适的。另一方面，回归的本质，对于操作系统来说，万物皆文件，这本身也是更高层次抽象的成熟手段。

当前的技能更多的是介于子workflow与原子function calling之间的一个产物。因此，它当前面向的用户更多是开发者和Pro级用户，而非普通终端用户。因此，任何从普通终端用户视角对它的评判都可能会有失偏颇。但是它迈出了非常有意义的工程实践第一步：如果这种模式被证明是可以梯度降低使用门槛的，那么我们可以顺着这条路一直构建和梯度降低，最终让普通终端用户也能享受到这种能力。这个梯度过程，将会是工程实践与模型迭代不断双向奔赴的过程，而这是有可能点燃无限希望的过程。一年以后，我们回头再看。

–EOF–

版权声明
转载请注明出处，本文原始链接

行思錄 | Travel Coder

Arch, Coding, Life