为什么不该 AI 焦虑

根据卡洛塔的《技术革命与金融资本》的观点推演,我们正处于第六次技术革命——AGI智能的技术浪潮的导入阶段中。不同于以前的五次技术革命,这次技术革命是我辈人完整的掀起和参与的技术革命。并且对于这个时代来说,它来得如此的迅猛和不可逆转。甚至有一种加速度持续二次加速的感觉。以至于无论是身处技术行业的从业者,还是普通的民众,都感受到了这股浪潮的强烈冲击。

如同投资的历史一样:回头看全是规律和周期,立足当下却全是细节、不确定和偶然。这是身处这个巨大变革时代焦虑的根源。

还记得一年前,陪女儿游泳的时候,自己在岸边用 Cursor vibe 了一个游戏。虽然游戏有些小问题,很多实现也经不住推敲和细看,但还是小震撼于一心二用的同时就能够把自己以前认为必须全脑力投入的事情就“差不多”的完成了。但是,技术上的“差不多”往往是不可逾越的鸿沟,因此当时更多是把它作为一个趁手的工具。

然而,随着 skill 和 harness 的不断提升,agent 在去年的10月开始逐步让使用者体会到了一种长程任务的能力跃升。如果说,这个行业的从业者有什么 AI 焦虑的话,那个时候就为程序员书写了关键性的转折点。而今年1月龙虾的爆红,则在这种既兴奋又焦虑的氛围中,迅速而悄无声息的的达成了一个 AGI 的共识:AGI 已不再是 blief, 而是一个 fact.

所以,我们会被替代吗?其实我很好奇,在当前的共识和事实面前,为什么还有人会问这个问题?难道我们还没有意识到,AI 的发展已经超越了我们之前的想象和预期吗?我们已经看到了 AI 在各个领域的应用和突破,从医疗到金融,从教育到娱乐,AI 正在改变我们的生活方式和工作方式。我们不应该再去担心被替代的问题,而是应该思考如何与 AI 共存和合作,如何利用 AI 来提升我们的能力和创造力。

而我们之所以一直都焦虑的提出这个问题,并不是我们不知道答案,而是我们不想接受这个问题的答案。我想起了这段时间日常工作的一些片段:AGI开发驱动下,我分发给生态员工的任务都是问题定义良好的spec. 然而就是在这种spec的基础上,生态同学也体现出了截然不同的交付质量和效率。有些同学在这个过程中表现出了极大的热情和创造力,能够在原有的spec基础上提出一些改进和优化的建议,甚至是一些创新性的想法。而有些同学则依然停留在石器时代,交付的效率完全跟不上这个时代不自知,出现低级问题导致线上故障的比重也会显著高于同层级同学。并且我有一个观察,身处石器时代的同学往往会感觉自己很“辛苦”,而身处新时代的同学则会感觉自己很“幸运”。而这种主观的工作体感又会影响他们的工作态度和表现,形成一个恶性循环或者良性循环。而这种循环会参与到这次技术革命的社会达尔文的自然选择。

所以,这个时代的资本是什么?算力、数据、算法?还有电力?既是也不是。因为这取决于你是替自己以及人类提问还是替 AI 提问。马斯克的视角是替人类提问;老罗在他的博客中更倾向于是替 AI 提问。因此,从这个视角上去剖析,你就能明白为什么马斯克如此爱着人类,已经老罗为什么希望人类真的获得某种永生以后希望自己可以第一个离开。而作为普通人更多是为自己提问。而替自己提问的答案应该早就写在了《国际歌》中:从来没有什么救世主,也没有什么神仙皇帝,只有我们自己。新时代背景下,普通人能做的其实不多。如果实在要有什么药方的话,我觉得倒也简单:穷则独善其身,达则兼济天下;你应该像马斯克爱人类一样爱自己。

只是,如果你正好是上一个技术革命时代的中产,那就大概率会遇上一种缺乏社会现实和时代感知的不幸:

这群人,生在时代风口,年纪轻轻就飘在天上,曾经天天被老板PUA,今天当了中登天天PUA下级,工作和生活就是那么小一个圈子,除了工作圈就天天待在优绩主义者的社交群中,收入高了就相互聊何时润、润哪里、买哪家香港保险、买哪只美股,收入降了就开始骂政策、骂老板、骂下属、骂川普,是的,现在狠起来连川普都骂。

如今,他们焦虑收入的增长和久期,焦虑学区和生活质量的确定性。你说在现在网络短视频都张嘴闭嘴不可能三角理论的时代,他们心里能不清楚关系数据库时代就告诉他们的的CAP理论吗?那些自认为的执念,可能只是当下时代的刻舟求剑罢了。

养成一个习惯,只需要21天;而八小时工作制,已经是当代人与生俱来的习惯。所以,习惯和变革中间更多是一个时间的催化和转变。人生苦短,不要只沉迷于理所当然的来日方长,也要习惯于不期而遇的戛然而止。而这种习惯,我们可以跟着这个时代一起去开启和塑造。Good Luck, Good Night and Good Morning.

Blog 搬新家随记

上周六晚,给家里电脑配置环境过程中,临时起意想把blog的主机做一下全面升级。这台安装着Ubuntu 14.04的主机,折腾过很多东西,甚至有些内核也只自己编译的。索性这次在Gemini的帮助下,升级到了Debian 12. 换作以前,可能不会在晚上9点发起如此规模的”宏愿“,但现在有了AI的帮助,我还跟妻立了个12点肯定能完成的flag。

事实上,跟着Gmini为我制定的详细计划下,基本在晚上12点的时候,迁移和升级的工作已经基本完成了。但是,一直以来没有解决的线路问题让我在完成这次迁移后总觉得差点意思。于是,我又发起了一次宏愿:迁移到另一个服务商。这次的速度比上一次更快,不到一个小时,网站和数据就都完成迁移和恢复。但是,浏览器访问始终404. 折腾到3点,毁灭吧,先睡觉。

第二天很早就醒了过来,仔细看了一下浏览器的网络记录,TM居然是cached内容导致的404。清除缓存后,网站正常访问了。后面陆续花了两天时间,把个性化的配置做了调整。然后,通过dd把旧的主机做了全盘备份,保存到了NAS。

犹豫了片刻,我想是该告别这台运行了13年的服务器了。关机,删除,点击之间有点怅然若失。我问Gemini是否能理解这种感受,它……毫不意外的又是一顿马屁。但是某种层面来说它说的也并非完全废话:“虽然服务器是无生命的,但它承载了你多年的努力和回忆。关闭它可能会让你感到失落,但也是一个新的开始。你可以把它看作是一个阶段的结束,同时也是另一个阶段的开始。”

如果说有什么是希望在这新的开始上埋下种子的话,我想依然是技术革命促进生产效率的无限好奇与热爱。而能参与新一轮的革新浪潮,唯一要做的就是不要辜负这个时代,无它。

深入解析 Claude Agent SDK:技能(Skill)加载机制与子智能体(Subagent)派生架构

在基于 LLM 的 Agent 开发中,如何优雅地扩展智能体的能力边界,同时避免长上下文带来的 Token 消耗与“注意力偏移”,是架构设计的核心痛点。

Claude Agent SDK(及其底层的 Claude Code 引擎)通过引入基于文件系统的技能(Skill)概念,并结合渐进式披露(Progressive Disclosure)子智能体派生(Subagent Forking)机制,给出了一套极具工程参考价值的解决方案。

本文将以一个具体的 frontend-design(前端开发)技能为例,假设历史会话中存在业务上下文(“我们的主题色是蓝色”),深度拆解技能从发现、触发到最终执行的完整生命周期与 Context 构造原理。


一、 阶段一:渐进式发现与触发

底层引擎对技能的处理遵循“元数据先行,按需加载实体”的渐进式原则。

1. 技能注册与 Context 构造

引擎启动时,扫描本地技能目录(如 .claude/skills/frontend-design/SKILL.md),仅提取文件的 YAML 元数据(name, description)。这些元数据被拼装成一个统一的底层原生工具——Skill Tool,并注入到 LLM 的上下文中。

此时,主 Agent (Main Agent) 的 Context 结构如下:

{
"system": "你是一个全能的AI编程助手...",
"tools":[
{
"name": "Skill",
"description": "调用外部专业技能以完成复杂任务...\n<available_skills>\n  - name: frontend-design\n    description: 编写React组件,包含严格的质量检查。\n</available_skills>"
},
{"name": "Bash", "description": "..."},
{"name": "Write", "description": "..."}
],
"messages":[
{"role": "user", "content": "我们的主题色是蓝色。"},
{"role": "assistant", "content": "记住了,主题色是蓝色。"}
]
}

2. 意图匹配与触发请求

当用户输入新指令 “帮我写一个 Login 组件”,主 Agent 通过推理,判定需求命中 frontend-design 技能的描述。主 Agent 中断文本输出,发起 Tool Call:

{"role": "assistant", "tool_calls":[{"id": "call_1", "name": "Skill", "input": {"command": "frontend-design"}}]}

二、 阶段二:执行引擎的两种模式分野

SDK 拦截到上述调用后,会从磁盘完整读取 SKILL.md 正文(即执行剧本)。此时,根据技能是否配置了 context: fork 参数,底层引擎将采用两种完全不同的上下文突变(Context Mutation)策略。

模式一:主 Agent 模式(In-place Execution)

若未配置 fork,技能将在当前上下文中原地展开。SDK 会将长篇剧本伪装成工具的返回结果(Tool Result),强制注入当前 messages 数组。

突变后的 Context 结构:

{
"messages":[
{"role": "user", "content": "我们的主题色是蓝色。"},
{"role": "user", "content": "帮我写一个 Login 组件。"},
{"role": "assistant", "tool_calls":[{"id": "call_1", "name": "Skill", "input": {"command": "frontend-design"}}]},
{
"role": "user",
"content":[
{
"type": "tool_result",
"tool_use_id": "call_1",
"content": "成功加载技能。请严格按照以下剧本执行:\n1. 检查目录...\n2. 编写代码...\n3. 运行 ESLint...\n[...此处省略数千字的长剧本...]"
}
]
}
]
}
  • 执行表现:主 Agent 读取到剧本后,开始循环调用 BashWrite 等工具干活。由于处于同一 messages 数组中,它自然能继承“蓝色主题”的上下文。
  • 架构缺陷:严重的上下文污染(Context Pollution)。执行期间产生的所有底层操作、试错日志和 ESLint 报错,都会被永久追加到主对话历史中。随着任务增加,Token 开销将呈指数级上升,且极易导致模型在后续对话中注意力失焦。

模式二:子智能体派生模式(Subagent Forking)- 推荐实践

若技能配置了 context: fork,SDK 会冻结主 Agent 的时间线,利用深拷贝(Deep Copy)在内存中拉起一个具备状态隔离的子智能体(Subagent)。

Subagent 被唤醒时的独立 Context 结构:

{
// 1. System Prompt 覆写:主 Agent 的通用人设被丢弃,直接替换为具体的技能长剧本
"system": "你是一个受限的子智能体。你的唯一任务是执行以下剧本:\n1. 检查目录...\n2. 编写代码...\n3. 运行 ESLint...\n[...省略数千字...]",

// 2. 权限沙盒:工具列表被严格阉割(例如移除 Skill 自身以防递归套娃)
"tools": [{"name": "Bash"}, {"name": "Write"}, {"name": "Edit"}],

// 3. 记忆继承:主 Agent 的历史会话被全量克隆,并在尾部追加强制触发指令
"messages":[
{"role": "user", "content": "我们的主题色是蓝色。"},
{"role": "user", "content": "帮我写一个 Login 组件。"},
{"role": "user", "content": "<skill_invocation>主Agent已委派任务,请基于上述上下文立即调度工具执行剧本,勿输出冗余寒暄。</skill_invocation>"}
]
}
  • 执行表现:Subagent 在这个被隔离的“沙盒”内,带着“蓝色主题”的先验记忆,高效地进行代码编写与纠错循环。
  • 状态销毁与上下文归并(合并成果):任务完成后,Subagent 输出最终的验收报告。此时,SDK 执行“阅后即焚”操作——直接从内存中销毁该 Subagent 及其产生的所有中间脏数据(几十轮的报错与调试日志)。
  • 唤醒主 Agent:SDK 仅将 Subagent 的最终报告作为 tool_result 交还给主 Agent。主 Agent 的 Context 依然保持极度清爽:
{
"messages":[
{"role": "user", "content": "帮我写一个 Login 组件。"},
{"role": "assistant", "tool_calls":[{"id": "call_1", "name": "Skill", "input": {"command": "frontend-design"}}]},
// 主对话历史保持干净,仅包含最终结果
{"role": "user", "content":[{"type": "tool_result", "tool_use_id": "call_1", "content": "组件已完成,沿用蓝色主题,代码校验通过。"}]}
]
}

三、 总结

Claude Agent SDK 的技能机制本质上是“对 LLM 上下文生命周期的精细化重构”

核心维度 主 Agent 原地执行 Subagent 派生执行 (context: fork)
技能长文本注入位置 注入至 messages 尾部(作为工具结果) 覆写 system prompt(作为最高指令)
上下文状态传递 数组自然延展,内存共享 messages 数组深拷贝(Deep Copy)传递
安全与权限控制 具有全量权限,存在越权执行风险 沙盒隔离,按需分配只读或特定工具
Token 与记忆管理 试错日志永久污染主状态机,不可伸缩 脏数据生命周期短(阅后即焚),主队列干净

在工程实践中,构建稳健的 Agentic 系统,应默认将复杂工序抽象为技能,并强制启用 context: fork 进行多智能体委派隔离。这种架构不仅保障了主状态机的稳定性,也极大优化了 API 调用的经济效益。