重新出发

两个月前,在写下《秋意》的时候,更多的是想倾听自己内心的声音。因此准确的讲,当时的动作甚至都不是刻意的“写”。当时临近计划的国情出行,匆匆停笔之后,一直觉得缺了点什么。时间,机遇,机缘……并不确切的知道。

一个月前,老爸跟我说他决定推迟5年之后再退休。我当然是完全尊重他的决定的,但好像上次我说了我的建议后,他分明做了一个相反的决定。脑子里会不自觉的绘制两条成本-收益的曲线,尤其在这经济大环境不是那么景气的当下……哎,这该死的“算计”。

是月初,趁着生日当前索性也没去公司。去了一趟龙泉山上的北周文王碑。天落石的风化造像尤其读到之处,但是击中自己的是去的狭窄路上回望瞥见的那汪水库。七年前,一样逼仄的路,一样的柳暗花明,一样的心境。那时的我,正值人生的一个重要转折点。如今再回望,虽然是不一样的路线,但竟然在同一个地点以不同的角度相遇。我想,这是最好的安排。

半个月前,一个成都日常没有暖阳的下午,带着儿子和女儿在楼下的空地玩耍。落叶婆娑,总会让人联想起一点秋日肃杀。但周围嘈杂的人声,又似乎并没有什么影响。有些文字可能正适合在这样泾渭分明,甚至冷暖冲突的场景展开,因为它本身就带有某种张力,以及一种内心的安全感。我打开了李飞飞《我看见的世界》。不仅看到了她看到的世界。苦难一直都不值得歌颂,我也很能理解,那本书作为出版物,有些时代的描写智能浓缩到那么几十个文字,但是人生能找到和追求自己的北极星,对任何人来说都是三生有幸,更何况,飞飞是在面临极致的生活心智带宽挑战。

坦率讲,即时作为行业的从业者,我之前并不确切知道为何李飞飞会有如此高的行业地位。但是,随着这本书的阅读,我看到的更多是一个立体和有血有人的优秀,其次才是学术和科研上的成就。因此,从前者看,从她身上,我更多的是知道了如何去感知当前自己的世界。

也只是在那一刻,我大概明白,之前缺少的并不是时间,机遇,机缘,而是托起好奇的勇气。

大模型这四年

从大模型元年2022年开始,当前关注度和影响力依然势头不减的大模型已经走到了第四个年尾。回头翻了一下快三年前写的使用ChatGPT的一点感受和思考
,当时提到的几点感受和思考,放在今天看来又有了一些新的感受和收获。

关于一个更好的wikipedia,但是时效性较差,也没法输入新的知识这个观点,今天看来已经不太成立了。大模型的知识库和知识图谱的结合,已经让大模型可以具备更好的时效性和可扩展性。比如结合检索增强生成(RAG)技术,可以让大模型在回答问题时,实时检索最新的信息,从而提供更准确和及时的回答。而随着基模能力的增强,尤其是推理能力、MoE 的引入,RAG在很多场景也越来越变得不那么必要了。短短三年,大模型技术从单纯的知识问答,已经发展到了可以进行复杂推理和决策支持的阶段。

关于它能帮你代笔写东西,但不是创作这个观点依然有争议。从身边的内容创作者样本来看,很多人已经开始将大模型作为创作的辅助工具,帮助他们生成初稿、提供灵感和优化语言表达。大模型在创作过程中扮演了一个重要的角色,尤其是在需要大量文本生成的场景下,比如写作、编程、设计等。然而,大模型生成的内容仍然需要人类的审校和润色,以确保其质量和准确性。因此,大模型更多地被视为一种增强创作能力的工具,而不是完全替代人类创作者。但这两年也也分明越来越明确的听到内容创作者的两个心声:恐惧和拥抱。恐惧的是大模型可能会取代一部分内容创作者的工作,尤其是那些重复性较高、技术含量较低的工作。而拥抱则是看到大模型带来的效率提升和创作灵感,愿意积极利用大模型来提升自己的创作能力和竞争力。

特别有意思的是,在前两天——52%比48%:互联网上AI生成的内容数量首超人类. 关于这点其实三年前自己也有过非常准确的判断:

及格内容生成的成本极低,互联网高质量内容将会以快的速度被稀释。而最有可能形成垃圾内容成山的领域就是导购、营销、水军等一软文为生存手段的领域。

但是,真的没想到这么快就达到了这个临界点。而这个临界点几乎宣布了一些行业的终结,比如传统的SEO写手、低质量内容创作者,甚至是传统的不思进取的搜索引擎。未来的内容创作将更多地依赖“独一无二”。关于这一点,看看百度和小红书的搜索流量和势头就会有深切的体感。虽然百度在搜索中也引入了AI生成内容,但是用户对AI生成内容的信任度和满意度仍然存在较大差距。相比之下,小红书等平台更注重用户生成内容(UGC)的真实性和多样性,吸引了大量用户进行分享和交流。因此,未来的内容创作将更多地依赖于独特的视角、真实的体验和个性化的表达,而不是单纯依赖于AI生成的内容。

关于“嵌入派”与“降临派”。嵌入派的观点认为大模型AI即工具,应该被嵌入到各种应用和服务中,以提升用户体验和工作效率。而降临派则认为大模型AI将会带来颠覆性的变革,甚至可能改变人类社会的运作方式。从目前的发展趋势来看,嵌入派与降临派分别代表了两种典型的工程构建方式:自下而上与自上而下。而比较奇妙的点在于,这两个构建方式都在同时进行,并且在不同的尺度上不断融合发展。比如,Anthropic提出的 MCP 以及 Claude Skills,都是典型的基于大模型嵌入派思路的延生;而Claude Code又为开发者提供强大的vibe coding能力,推进降临派的发展。DeepSeek R1、 OCR 这样的技术,则更多地体现了降临派的思路,通过模型架构和设计的创新,推进大模型能力的跃迁。

如果你是当前大模型技术的从业者或者爱好者,建议你仔细回顾和研究一下 LangChain 的技术架构变更。如果一定要在现在给出一个明确的建议,那就是:在可控的系统架构上去嵌入大模型能力,然后不断地沉淀为系统的确定性模块或子系统,进而扩大嵌入的尺度,持续迭代,无限进步。从这个思路触发,这就跟一门编程语言最终要实现如何自举的设计哲学几乎完全一致。毕竟,别忘了,LLM 的中心正是 Language.