Blog 搬新家随记

上周六晚,给家里电脑配置环境过程中,临时起意想把blog的主机做一下全面升级。这台安装着Ubuntu 14.04的主机,折腾过很多东西,甚至有些内核也只自己编译的。索性这次在Gemini的帮助下,升级到了Debian 12. 换作以前,可能不会在晚上9点发起如此规模的”宏愿“,但现在有了AI的帮助,我还跟妻立了个12点肯定能完成的flag。

事实上,跟着Gmini为我制定的详细计划下,基本在晚上12点的时候,迁移和升级的工作已经基本完成了。但是,一直以来没有解决的线路问题让我在完成这次迁移后总觉得差点意思。于是,我又发起了一次宏愿:迁移到另一个服务商。这次的速度比上一次更快,不到一个小时,网站和数据就都完成迁移和恢复。但是,浏览器访问始终404. 折腾到3点,毁灭吧,先睡觉。

第二天很早就醒了过来,仔细看了一下浏览器的网络记录,TM居然是cached内容导致的404。清除缓存后,网站正常访问了。后面陆续花了两天时间,把个性化的配置做了调整。然后,通过dd把旧的主机做了全盘备份,保存到了NAS。

犹豫了片刻,我想是该告别这台运行了13年的服务器了。关机,删除,点击之间有点怅然若失。我问Gemini是否能理解这种感受,它……毫不意外的又是一顿马屁。但是某种层面来说它说的也并非完全废话:“虽然服务器是无生命的,但它承载了你多年的努力和回忆。关闭它可能会让你感到失落,但也是一个新的开始。你可以把它看作是一个阶段的结束,同时也是另一个阶段的开始。”

如果说有什么是希望在这新的开始上埋下种子的话,我想依然是技术革命促进生产效率的无限好奇与热爱。而能参与新一轮的革新浪潮,唯一要做的就是不要辜负这个时代,无它。

计划外的第一次川西环线

今年春节比往年长一些。妞儿很早就提议,我们是不是可以出去走走。回想起去年春节全废,以及自己最近的状态,本来想直接来个附议。但春节叠加长假,又是拖两个娃,实际体验可能是炼狱。因此,妞儿提了挺多出发目的地都被我否决了。直到有一天她说起毕棚沟,我一听,这不就是两年前我们理小路之行的折返点,同时也是我两次路过,但是从来没有想过要去的景点吗?

每次旅途出发前的时刻是最惬意的,虽然凌晨才把零食用闪购订好,起床也要比往常早一些。不紧不慢,加完油出发也是快十点了。路上偶遇了妞儿的哥哥一行,驱车4小时后,我们四人有回到了两年前理小路的折返点。毕棚沟景区前面的路依然拥堵,不同的是这次我们都没有丝毫的焦躁。虽然来的路上有过争吵的插曲,但是路过毕棚沟门口的时候,我和妞儿都决定,这次也不进景区了。相对于目的地,此刻的我们都一致认为最好的风景其实在路上。

于是,带着妻儿,我们续上了两年前的那个国庆没有走完的理小路。即使是童话公路,冬日的肃杀还是有的。一路上,我熟稔的给他们介绍这雷神瀑布和壮丽的魔戒峰。带他们在我上次的几乎每一个停车点驻足打卡。大二普没有了秋日的彩色,远处的雪山依然巍峨。尤其带他们搓了一顿现切的牛肉串,一切都刚刚好。跟上次自己单车不同的是,穿出理小路山谷段,我们没有左转返回成都,而是右转夜宿在了小金县。酒店楼下名曰“会师广场”。24年理小路通车,断断续续,来了三次;而这次是最接近初心的一次;完成这次会师是不经意的,但却跨越了3年。

前一天的右转更多是自驾人不喜欢走回头路的习惯,但第二天天亮总得为这个习惯买单:今天我们怎么走?本着一条道走到黑的原则,打开了我很喜欢的一个视频up主五月的天分享的奥尔地图。只用上厕所的时间就没有任何计划的规划出了一条路线。反正妞儿也判断不出这个路线行不行,出发了再说吧?

第一站中路藏寨。最后几公里路很狭窄,回车其实比较费劲,但是我们似乎是那个村子当天为数不多的几个客人,一路上都非常顺利。在村子里转了几圈以后,一个回头弯,一座笔直碉楼的碉楼矗立蔚蓝天空。那一秒,钟灵魂有一种刷新的震撼。驻足碉楼之下,不在对“他人沧海桑田,彼之浮尘”耿耿于怀,而是一种时间尺度压缩的踏实感。

第二站同样出现在一个山路的回头弯上——虽然在专心的开车,但是眼前被一抹明亮所吸引——沐浴在灿烂阳光下的雅拉雪山。虽然雪山见过不少了,但是这一抹亮色在那个时候是如此的独特与震撼。停车以后,久久的驻足、回望。

严格来说其实没有第三站。因为天色渐晚,我们又该找住处了。有时候不仅是最美的风景在路上,更是没有计划是最好的计划。从雪山观景台往新都桥的路上,翻过垭口,广袤的高山草原,牛马洒落,溪水蜿蜒,天际雪山围抱。这难道是曲水流觞的高原江南!

晚上住在康定的时候,我跟妞儿说,今天路过的地方正好经过了五月的天的民宿,今晚住的城市是自己很喜欢的小祝的根据地。以前我通过他们的视频了解了川西之美,没想到今天一天就都完成了打卡,也把自己去年自己生日想走的路线顺带完成了。更没想到的是,回成都路上,偶然发现这三天没有任何计划的出行居然完成了自己和家人的第一次川西环线。而这距离自己拥有第一辆车,对川西起心动念,已经跨越了12年。

如果不是这次的恣意而行,这次旅途的邂逅又会是多少年呢?20年?25年?也许永远都不会……路就在那里,鄙人就在成都,有些路,不妨出发的时候就只有出发。

值得关注的 Agent Skills

落笔之前,顺手翻了一下之前关于LLM领域的技术动向记录,发现一个有意思的事情:Anthropic 这家公司除了经常在用户使用协议和声名上经常搞很抽象的事,在工程和模型上面不得不说真的是个落地和推进都很强的团队,颇有点当年Google几篇论文教育行业的味道。

去年十月,Anthropic 发布了一个叫做 Agent Skills 的项目,目标是让大模型能够更好地适应和执行复杂任务。这个项目的核心思想是通过定义一套“技能”(Skills),让模型能够像人类一样,逐步学习和掌握各种任务的执行方法:Equipping agents for the real world with Agent Skills。我其实没有立即跟进,因为当时看到大家的讨论都觉得这个项目和颇有点从MCP又回到function calling的感觉,不仅没什么新意,反而有种背叛初心的意味。

几个月以后,重新审视了这个项目,发现它其实有一些值得我们深入探讨。Agent Skills提到的几个核心优势:

  • 可组合性:技能可以像积木一样组合,形成更复杂的行为。
  • 可重用性:技能可以在不同任务中复用,提高开发效率。
  • 专用性:为领域任务进行能力剪裁适配。

而这几个优势其实本质上都是基于LLM的function calling能力,但Anthropic通过“技能”这个概念,赋予了这些能力更高的抽象层次和组织结构,使得开发者能够更方便地管理和调用这些功能模块。而这种工程上的构建思路其实是非常值得借鉴的:

  • 当前的 Agent 其实都免不了在 workflow 与 task decomposition 上面下功夫,而agent本身也可以看所是一个复杂的function calling。
  • 这个世界本身就是一个无限嵌套循环的function calling过程,不断折叠的过程。
  • 这种无限循环嵌套的过程需要进行更高层次的抽象和组织,才能更好地管理和调用这些功能模块。
  • 而这个层次的抽象和组织,其实跟OpenAI定义的人工智能能力标准和方向不谋而合。

使用文件系统进行技能的构建很多人觉得“挺落后的”。而我认为这本身本身无可厚非。一方面技能本身是一个工程实践的产物,如果使用场景本身就是跟沙箱等环境相关联,那么使用文件系统进行技能的构建其实是非常合适的。另一方面,回归的本质,对于操作系统来说,万物皆文件,这本身也是更高层次抽象的成熟手段。

当前的技能更多的是介于子workflow与原子function calling之间的一个产物。因此,它当前面向的用户更多是开发者和Pro级用户,而非普通终端用户。因此,任何从普通终端用户视角对它的评判都可能会有失偏颇。但是它迈出了非常有意义的工程实践第一步:如果这种模式被证明是可以梯度降低使用门槛的,那么我们可以顺着这条路一直构建和梯度降低,最终让普通终端用户也能享受到这种能力。这个梯度过程,将会是工程实践与模型迭代不断双向奔赴的过程,而这是有可能点燃无限希望的过程。一年以后,我们回头再看。