从大模型元年2022年开始,当前关注度和影响力依然势头不减的大模型已经走到了第四个年尾。回头翻了一下快三年前写的使用ChatGPT的一点感受和思考
,当时提到的几点感受和思考,放在今天看来又有了一些新的感受和收获。
关于一个更好的wikipedia,但是时效性较差,也没法输入新的知识这个观点,今天看来已经不太成立了。大模型的知识库和知识图谱的结合,已经让大模型可以具备更好的时效性和可扩展性。比如结合检索增强生成(RAG)技术,可以让大模型在回答问题时,实时检索最新的信息,从而提供更准确和及时的回答。而随着基模能力的增强,尤其是推理能力、MoE 的引入,RAG在很多场景也越来越变得不那么必要了。短短三年,大模型技术从单纯的知识问答,已经发展到了可以进行复杂推理和决策支持的阶段。
关于它能帮你代笔写东西,但不是创作这个观点依然有争议。从身边的内容创作者样本来看,很多人已经开始将大模型作为创作的辅助工具,帮助他们生成初稿、提供灵感和优化语言表达。大模型在创作过程中扮演了一个重要的角色,尤其是在需要大量文本生成的场景下,比如写作、编程、设计等。然而,大模型生成的内容仍然需要人类的审校和润色,以确保其质量和准确性。因此,大模型更多地被视为一种增强创作能力的工具,而不是完全替代人类创作者。但这两年也也分明越来越明确的听到内容创作者的两个心声:恐惧和拥抱。恐惧的是大模型可能会取代一部分内容创作者的工作,尤其是那些重复性较高、技术含量较低的工作。而拥抱则是看到大模型带来的效率提升和创作灵感,愿意积极利用大模型来提升自己的创作能力和竞争力。
特别有意思的是,在前两天——52%比48%:互联网上AI生成的内容数量首超人类. 关于这点其实三年前自己也有过非常准确的判断:
及格内容生成的成本极低,互联网高质量内容将会以快的速度被稀释。而最有可能形成垃圾内容成山的领域就是导购、营销、水军等一软文为生存手段的领域。
但是,真的没想到这么快就达到了这个临界点。而这个临界点几乎宣布了一些行业的终结,比如传统的SEO写手、低质量内容创作者,甚至是传统的不思进取的搜索引擎。未来的内容创作将更多地依赖“独一无二”。关于这一点,看看百度和小红书的搜索流量和势头就会有深切的体感。虽然百度在搜索中也引入了AI生成内容,但是用户对AI生成内容的信任度和满意度仍然存在较大差距。相比之下,小红书等平台更注重用户生成内容(UGC)的真实性和多样性,吸引了大量用户进行分享和交流。因此,未来的内容创作将更多地依赖于独特的视角、真实的体验和个性化的表达,而不是单纯依赖于AI生成的内容。
关于“嵌入派”与“降临派”。嵌入派的观点认为大模型AI即工具,应该被嵌入到各种应用和服务中,以提升用户体验和工作效率。而降临派则认为大模型AI将会带来颠覆性的变革,甚至可能改变人类社会的运作方式。从目前的发展趋势来看,嵌入派与降临派分别代表了两种典型的工程构建方式:自下而上与自上而下。而比较奇妙的点在于,这两个构建方式都在同时进行,并且在不同的尺度上不断融合发展。比如,Anthropic提出的 MCP 以及 Claude Skills,都是典型的基于大模型嵌入派思路的延生;而Claude Code又为开发者提供强大的vibe coding能力,推进降临派的发展。DeepSeek R1、 OCR 这样的技术,则更多地体现了降临派的思路,通过模型架构和设计的创新,推进大模型能力的跃迁。
如果你是当前大模型技术的从业者或者爱好者,建议你仔细回顾和研究一下 LangChain 的技术架构变更。如果一定要在现在给出一个明确的建议,那就是:在可控的系统架构上去嵌入大模型能力,然后不断地沉淀为系统的确定性模块或子系统,进而扩大嵌入的尺度,持续迭代,无限进步。从这个思路触发,这就跟一门编程语言最终要实现如何自举的设计哲学几乎完全一致。毕竟,别忘了,LLM 的中心正是 Language.
