大模型这四年

从大模型元年2022年开始,当前关注度和影响力依然势头不减的大模型已经走到了第四个年尾。回头翻了一下快三年前写的使用ChatGPT的一点感受和思考
,当时提到的几点感受和思考,放在今天看来又有了一些新的感受和收获。

关于一个更好的wikipedia,但是时效性较差,也没法输入新的知识这个观点,今天看来已经不太成立了。大模型的知识库和知识图谱的结合,已经让大模型可以具备更好的时效性和可扩展性。比如结合检索增强生成(RAG)技术,可以让大模型在回答问题时,实时检索最新的信息,从而提供更准确和及时的回答。而随着基模能力的增强,尤其是推理能力、MoE 的引入,RAG在很多场景也越来越变得不那么必要了。短短三年,大模型技术从单纯的知识问答,已经发展到了可以进行复杂推理和决策支持的阶段。

关于它能帮你代笔写东西,但不是创作这个观点依然有争议。从身边的内容创作者样本来看,很多人已经开始将大模型作为创作的辅助工具,帮助他们生成初稿、提供灵感和优化语言表达。大模型在创作过程中扮演了一个重要的角色,尤其是在需要大量文本生成的场景下,比如写作、编程、设计等。然而,大模型生成的内容仍然需要人类的审校和润色,以确保其质量和准确性。因此,大模型更多地被视为一种增强创作能力的工具,而不是完全替代人类创作者。但这两年也也分明越来越明确的听到内容创作者的两个心声:恐惧和拥抱。恐惧的是大模型可能会取代一部分内容创作者的工作,尤其是那些重复性较高、技术含量较低的工作。而拥抱则是看到大模型带来的效率提升和创作灵感,愿意积极利用大模型来提升自己的创作能力和竞争力。

特别有意思的是,在前两天——52%比48%:互联网上AI生成的内容数量首超人类. 关于这点其实三年前自己也有过非常准确的判断:

及格内容生成的成本极低,互联网高质量内容将会以快的速度被稀释。而最有可能形成垃圾内容成山的领域就是导购、营销、水军等一软文为生存手段的领域。

但是,真的没想到这么快就达到了这个临界点。而这个临界点几乎宣布了一些行业的终结,比如传统的SEO写手、低质量内容创作者,甚至是传统的不思进取的搜索引擎。未来的内容创作将更多地依赖“独一无二”。关于这一点,看看百度和小红书的搜索流量和势头就会有深切的体感。虽然百度在搜索中也引入了AI生成内容,但是用户对AI生成内容的信任度和满意度仍然存在较大差距。相比之下,小红书等平台更注重用户生成内容(UGC)的真实性和多样性,吸引了大量用户进行分享和交流。因此,未来的内容创作将更多地依赖于独特的视角、真实的体验和个性化的表达,而不是单纯依赖于AI生成的内容。

关于“嵌入派”与“降临派”。嵌入派的观点认为大模型AI即工具,应该被嵌入到各种应用和服务中,以提升用户体验和工作效率。而降临派则认为大模型AI将会带来颠覆性的变革,甚至可能改变人类社会的运作方式。从目前的发展趋势来看,嵌入派与降临派分别代表了两种典型的工程构建方式:自下而上与自上而下。而比较奇妙的点在于,这两个构建方式都在同时进行,并且在不同的尺度上不断融合发展。比如,Anthropic提出的 MCP 以及 Claude Skills,都是典型的基于大模型嵌入派思路的延生;而Claude Code又为开发者提供强大的vibe coding能力,推进降临派的发展。DeepSeek R1、 OCR 这样的技术,则更多地体现了降临派的思路,通过模型架构和设计的创新,推进大模型能力的跃迁。

如果你是当前大模型技术的从业者或者爱好者,建议你仔细回顾和研究一下 LangChain 的技术架构变更。如果一定要在现在给出一个明确的建议,那就是:在可控的系统架构上去嵌入大模型能力,然后不断地沉淀为系统的确定性模块或子系统,进而扩大嵌入的尺度,持续迭代,无限进步。从这个思路触发,这就跟一门编程语言最终要实现如何自举的设计哲学几乎完全一致。毕竟,别忘了,LLM 的中心正是 Language.

聊聊老罗的十字路口

上个月写随笔《李想的理想》的时候其实已经了解到老罗要进军播客赛道。相较于早年创办锤子科技以及近期宣布的泡面而言,这次大众都异常默契的认为老罗选择了“正确的道路”。节目名称《罗永浩的十字路口》是对乔布斯科技与人文的致敬,另一方面也是老罗自我阶段性的自我调侃吧。

截至这个月底,已经出了两期节目,虽然先前肯定早有谋划筹备和存货,但长谈内容达到这个更新频率,老罗还是挺拼的,看后期这个节奏能保持多久。

陆陆续续看完了前两期节目,没有错过任何一秒内容,有些段落会倒退回放。本身就是长谈的节目,两期节目完整听下来。第一期李想,第二期小鹏。按说下一期应该是李斌了。如果真的如此,我倒有点期待老罗能否从没有未来的公司创始人那里聊出一些能影响自己先前认知和判断的内容。

回到已经看过的两期内容,李想的内容其实把我之前已知的内容进行了完整的串联,没有太多的补充内容。但是其在节目中完整的表述的自我强化学习的理论、实践,以及基于这套方法论下对未来AI、机器人的判断还是让自己非常惊奇。而关于AI的发展有两个看法还是洞见的,一个业界其实不太看得上的朴素而精准的是OpenAI的关于AI的chatBot, agent, 管理者, 组织者的阶段划分;一个是模型能力不断内化提升,落地场景不断外化为流程的双循环进化理论。而后者其实也是自己已知在一些工作落地场景里面一直有模糊思考,但是第一次听到这样精确表达,后面做的一些事情其实也在验证这个理论。

李想的思维其实非常理工科,很多兴趣和观点让自己有很深同频共鸣感。但是反观其事,又是一个不太理工科的方式。而他总结这一期都是一次次深刻的痛苦和教训带来的。老罗问及他为什么很早就明明有机会选择小富即安,但是偏偏走上了更加艰险的创业之路,两者都动容了。某种程度上,任何个体的选择,只要守住了底限,本身无可厚非,但是很多时候我们又何尝不是新时代的井底之蛙,自以为知道和了解全球的资讯、历史,任何信息都在指尖触手可达。但是我们真的知道吗?我们真的有必要知道吗?看完节目,我有点明白为什么Tim在100小时生存上岛以后,会在总结里面不断提及所谓的“知道”。

而第二期小鹏,因为之前并没有系统看过何小鹏的信息,很多内容对自己而言都是全新的。整体听感上,小鹏的思维和表达就是自己更加熟悉的很理工男,甚至可以更加精确到计算机科学专业男。直率,知道就给直球,不知道就承认没想清楚不知道。这里有老罗提问的功底,更多是小鹏的个人特质。但是,如果从企业经营上看,跟李想比较,小鹏无疑还处在更加前期的成长阶段。但是,显然他更加的知道和理解技术细节,但是也有一种之前履职过阿里带着的一点“废话文学”味道。因此,如果从钱包投资的角度看,我会毫不犹豫的继续追加前者,而会对后者一直保持关注。如果说有所失望的话,应该就是小鹏其实有点故意的在梳理技术,会更加在意自己在宏大叙事上的表达和铺陈,而没有太多的细节和实操内容的分享。而老罗的节目也专门安排了这个环节来迎合观众的胃口,也不是不能理解。只是从上一代互联网红利中投身实业,在国内真的没有几个,还是希望小鹏能够走得更高更远一些。

两期节目听下来老罗提问的节奏和套路已经非常成熟,甚至可以说是炉火纯青了。无论是对话题的把控,还是对嘉宾的引导,都非常到位。尤其是对李想的提问,几乎没有任何废话,都是直击要点。对小鹏的提问则稍微有点宽松和铺陈,但是也在情理之中。老罗的提问其实是有技巧的,既不会让嘉宾觉得被逼问,也不会让观众觉得无聊。尤其是他会在关键节点上进行一些总结和升华,让整个对话更加有层次感。也会简短的讲一些自己的经历和感受。可能前两期嘉宾的行业和话题重合度比较高,总觉得这两期节目多元化缺了点,就看下期嘉宾是谁。如果内容10期以后,都能达到这两期节目的声量和传播量,商业化应该是个水到渠成,也是老罗做起来很舒服的一件事了。