我的 AI/Agent 碎碎念

Posted by YUN on Tue, May 12, 2026

PROLOGUE

步入 IT 职场至今,距离我从 Microsoft 离职也已经过了有小半年时间了。在换到新工作的这段时间里,我亲身接触并重度使用了各式各样的 AI Agent(不仅限于 Coding Agent),并且自己也正在作为一名 Agent 研发工程师,亲身研发各种各样的 Agents 应用。

不过这篇博文我并不想过于深入探究 AI/Agent/LLM 的技术细节,只想聊聊这半年来我自己的最大感受和对未来发展的个人判断。

1. 不服不行的 V 法编程

从 ChatGPT 横空出世到 Opus 4.5 Coding 惊人、从 Sora 初见端倪到 SeeDance 天马行空、从 Nano Banana 半步惊云到 GPT Image 2 以假乱真……仔细回想,好像每个领域都没有耗费特别长的时间。我不敢说其他行业如何如何,但至少在 Coding 领域,Vibe Coding(V 法编程)的的确确改变了绝大部分研发的开发模式和就业现状。

V 法编程从最开始的即便是 CS 科班出身的研发都很难用 LLM 写出复杂代码,到如今毫无 CS 技术背景的营销号也可以轻松做出各种 APP,只能说技术发展的速度让人不禁感叹不服不行。

随着时间的演进,模型能力越来越强应该无需过多质疑了,而各个产品对于研发的真实需求也必然会越来越少。在这个 LLM 做知识讲解比非升即走的双一流大学教授讲课可能都要更加清晰明白的时代,越来越追求代码细节本身将会变成一种病态的表现(我不认为此言是我的个人暴论,而是我亲身经历而导致必然离开后,不得不迫于现实而得出的扎心结论)。

话说回来,任何已有的软件工程项目,即便没有 AI Coding 介入,也会随着负责人变更、人员规模的扩张,而使得代码质量越来越不可控、大公司病化越来越严重。而如今在 AI Coding 的介入之下,只是让这个不可控的速度变得更快了而已,而 AI 也仅仅是极大加速了原本人类自己搭建屎山代码的速度。

2. 本质未变 —— Agentic Loop

人类真的非常擅长使用各式各样的名词来掩盖原理和本质的简单性:从 Assist 到 Vibe、从 Prompt 到 Context/Skill(Skill 的本质就是 Prompt,没啥特别的)、从 Agent/Tools 到 Harness(MCP 的本质就是远程工具,即非 Agent 自身内的工具),从 Claw 到 Hermes……真的,如果以后出来一个 Patek Philippe AI,我都不会感到有丝毫的奇怪……

实际上,Agent 的本质却永远没变,抛开所有复杂的名词,原理实际上非常简单:

1Agentic Loop:
2  (Prompt → LLM) + Tools

所以从 Agent 层面来看,还真是没有什么技术壁垒,真正的技术壁垒在于 Agent 前端能否作为 SFT + RL 的依据反馈回 LLM 的训练中(这也是为什么大家觉得同样的基模但 CodeX 和 CC 远强于其他家 Agent 的核心原因)。而从单 Agent 扩展到多 Agent 的所有系统,不过是把曾经人们在大规模分布式系统上走的老路,再作为“创新”方向重走一遍罢了……

至于说 CLI 取代 GUI 这种事情,那就更为可笑了,这是可以一眼鉴定为非 CS 专业的营销号的直接判定依据。从最早的 Cursor Tab,到如今的 Claude Code,改变的核心只是“产品形态”(从需要亲自写代码,变成只需要 review 代码),而不是“产品形式”(从 GUI 变到 CLI 里)。每次想到这个奇葩的“CLI 即未来”的观点,我都很难绷住不笑,连软件架构分层都在这胡掰(视图层、逻辑层),这不是营销号还能是什么,哈哈~

最直接的打脸论证就是:如果 CLI 真的是未来,那么 Anthropic / OpenAI 就完全没有必要推出 Claude / CodeX 桌面版了,一直迭代各自的 CLI 就 OK 了……

3. Robot 仍未迎来 ChatGPT 时刻

如今,多模态 LLM 的发展实在是太快了,太多的工作方式将会迎来变化。但另一方面,机器人 Robot 目前仍未迎来 ChatGPT 时刻。虽然我个人认为,机器人的 ChatGPT 时刻可能还要等上不少日子,但是在这之前,多掌握几门高级蓝领技能,不失为不错的备选出路。

随着 LLM 基模能力越来越强,只要配套的 Coding Agentic Loop 能自我开发迭代 + Auto Train LLM 形成闭环,基模 + Agent 通过自我 RL 自我迭代更新也将不再是梦,那么创新力、学习力、反思力、经验积累,这一切人类目前认为 LLM 无法取代的东西,很快就会被无情击溃。

4. 始终无法取代的 —— 体验(Experience)

那既然 AI 能取代这么多人类可以做的事情,尤其是在 AGI 之后,AI 将会在写代码、做 Office、做音乐、做视频、玩游戏等等领域全面超越人类(更不用说日后 Robot 迎来 ChatGPT 时刻了),那么有什么事情是 AI 绝对无法取代人类的吗?

有的,朋友,那就是“体验”Experience,也就是过程。AI 能代替你画画、能代替你做音乐、也能代替你去爬山,但是人类逐笔作画、学习乐器、完成登山这些过程中的体验(无论是人教的你还是 AI 教的你),这种很唯心的东西,是 AI 什么时候都取代不了的。因为人类需要过程的体验来积累经验和能力,只要这个地球还有一天未被 AI 统治,那么“体验”将会是 AI 永远无法取代人类的事情。

更何况,体验本身可以创造资本价值(看球赛、看演唱会等),所以只要目前还是人类 + 资本阶级 Rule World,体验这个东西的需求必然一直存在,一直不会被 AI 所取代。

当然,体验可以创造资本价值,但是不能当饭吃,这就是另一回事了。

5. 回归现实

OK,瞎扯了四章“宏伟远大”的 AI 能力畅想,是时候回归一些现实了。

虽然我强调即便 AGI 到来,AI 也无法取代人类完成“体验”;但更现实一些(当下),AI 无法取代人类的事情还是不少的。

在《人月神话》这本书中,曾简单地提到过“本质复杂度”和“偶然复杂度”的概念,但回到本文中,我结合我个人的理解,给出如下我所理解的两种复杂度的定义:

  • 本质复杂度:凡是涉及到“人”与“人”之间交流、沟通、合作、共事、竞争、攻击、防御等等的事情,均称之为“本质复杂度”;即“本质复杂度”的来源是“人”与“人”之间的复杂度
  • 偶然复杂度:为了服务于“人”与“人”之间“本质复杂度”的一切工具性质的事物,例如 WXP、Coding、机械制造、电气制造等等,称之为“偶然复杂度”

“本质复杂度”因人的社群属性而产生,“偶然复杂度”的根本只是工具的不同。

举个极端一些的例子:人与人打交道,主动会设置各种门槛,设置阻碍障碍,纷争和内斗,算计与利己主义,让本来并不复杂的事物运转得并不顺利(不只适用于职场)。只要世界还未被 AI 统治,世界上还剩余 ≥1 的人,那么“本质复杂度”就永远不可能消失。

接下来“偶然复杂度”就很好理解了,人类的工业革命,其实是工具本身的迭代,是不断降低当前遇到的“偶然复杂度”的事情。从蒸汽代替马力、电气取代蒸汽、信息取代纸质、AI Coding 取代古法编程,这一切都不过只是“偶然复杂度”的演变更替。永远不变的,是“本质复杂度”,更本质一些,即阶级矛盾。

6. Product Lead 还是 Tech Lead ?

本章节内容纯主观、不客观,只是基于个人亲身真实经历的个人实际感悟。不抬杠,也不辩论。

如果问我在微软 CN 工作了三年半,所学习到的最大的事情是什么?那毫无疑问,就是“技术的高低没有任何实质性作用,人与人之间的复杂度才是职场生存的前提”。说白了,都是中国人当领导,没啥外企不外企的……职级大半级压死人、清除异己、培养嫡系、心态打击、性格控制,所有的这些我都有目共睹。

换句话说,因为人与人之间的“本质复杂度”,职级与“能力”本就没有什么强链接的直接关系;在 AI 时代到来后更是如此,能力差距几乎被抹平,剩下的全是人与人之间打交道的事情了。

所以:技术人只专注技术而不处理人际关系,除非他去单干,否则真的走不远。在大部分公司里,死磕技术(细节)没有任何出路,而成为制造阻碍的人(即领导),避免只做 Coding 工作,才有一线生机(这似乎也能解释为何在微软时我组的 PM 翻云覆雨、指鹿为马、欲加之罪何患无辞的现象了)。

说到现在,我觉得已经很清楚了,真的是 AI Coding 让技术研发大批量失业了吗?做出裁员决策的不还是 Lead Team 吗?正是因为 Lead Team / 资产阶级 决策将这部分被裁人的成本拿去用于 AI,而不是从净利润中抽取一部分去用于 AI,才造成了如此职场现状(本质又回到工业革命和阶级矛盾了,没办法,无产阶级和资产阶级,这就是一切的本源)。

我曾经也是“好代码,古法出”的坚定坚持者,但在微软观察到了如此多代码 / 技术之外的事情之后、亲身经历了很多变故之后,我最终成为了一个彻底拥抱 AI Coding 的加速主义者。既然 Coding 是我的主业,而我恰好又有很多代码之外的兴趣和爱好等着我去“体验”,我也真的没必要给自己找不痛快了、跟自己过不去了。

回到本章标题,我如今给出的答案是 Product Lead 无疑。由于本质复杂度的缘故,在软件工程中,代码本来就是最简单的那部分;而 AI Coding 加速之后,代码更是变成了最无聊的那部分。我们需要承认,这世界上 90% 的人都无法创业成功,而在公司里干活,你的技术品味、技术选择、技术现实因素,在不懂技术的 Lead Team 面前,毫无意义。

7. “模因污染”与 LLM 的真实实力

我之所以放弃很多技术坚持,转而走向加速主义,无非是因为死循环了:“职级上不去,你说的所有真正无比正确的真相和结论,会被丝毫不懂的 Lead Team 和 Partner Team 用各种绊子 Steer To 对你自己的人身能力 / 性格攻击;从而职级更升不上去”。OK,关于这方面我已经说的太多了,如何生存如何应对,能听懂的人自然不必多教了。

那么在本章节最后技术坚持一小下,那就是目前而言,即便强如 Opus 4.7 1M Max Effort 的模型,海量幻觉依然出现、依然需要人工纠偏、依然需要对产出进行人工介入、依然需要客观进行真实验证;A/ 自己 100% AI Coding 的 Claude Code / Claude Cowork 各自的 BUG 满天飞;AI 比人类更擅长发现捷径,例如 Mock 一层跑通所有 UT、GPT 的哥布林 Reward Hacking 污染……这些是不得不承认的现实,即便很多 Lead Team 不 Care 也不想 Listening,但这就是事实。

自互联网出现之后,模因污染就已经开始;只是现在的 AI LLM 时代,未经任何验证的 AI Slop 已经铺天盖地,模因污染的速度变得更快了而已。当前,GPT、Gemini、Claude 模型的各种产出内容,已经如洪水般淹没了互联网的各个角落。而这些真假混杂的 Slop 也终将被一视同仁的作为后续各家 LLM 的训练基础数据。最终的结果,无非就是各家 LLM 互相蒸馏、互相训练、互相影响,最终高质量的 Human GC 内容越来越少,LLM 也会越来越像 AIGC 而非 Human GC。

但如果乐观一点,其实 LLM 基础训练趋同也并不是什么太大的问题,毕竟 A/ 力大砖飞的稠密模型已经打过我无数次脸了。继续力大砖飞堆参数量,训练数据污染可能真的不会是什么太大的问题,最后就看各家的 SFT 和 RLHF 的偏好取向了。

8. 算笔经济账

接下来进入更加扎心的事实,就是 AI LLM 计算成本之下的经济账,全是泡沫,无法细算。

人类善于白嫖,白嫖建立的基础是“买量引流”,而“买量引流”必有截止;所以我给出一个暴论,就是日后 LLM 的所有 Plan 都会消失,都会回归 Token 计费。

在目前,摩尔定律趋近极限,我们必须承认的一个事实就是,Opus 4.6 级别的模型,在很长一段时间内都不会降低到白菜价。能力强的模型不可避免的会很贵,能力差的模型单纯就是浪费时间。对于公司/团队而言,AI 的 Token 开销是一笔非常离谱的账单,平均每雇佣两个研发,就要多花一个研发的钱用于 AI Coding 上,我很难想象这样的泡沫会持续多久。

我不认为 AI 成本泡沫是危言耸听,在知乎上关于 AI 计算成本泡沫的回答海了去了,而现实情况也能说明很多问题:

  • 字节跳动因 AI 投入利润下滑 70%
  • 豆包推出了价格媲美曾经国产价格一哥 Kimi 的付费月租
  • 各家 Coding Plan 相继停售
  • Github Copilot 由次数计费改为 Token 计费
  • DeepSeek 开始融资
  • 提供 LLM 云计算基建的亚马逊和微软更是裁员一个比一个狠
  • ……

AI LLM 真的很烧钱,经济泡沫越来越大,Too Big to Fall……

9. AI 时代下 Coder 的就业大环境

我说了这么多东西,明白人也都能看得出来,虽然 AI 现在很厉害,但的确有点过于“大跃进”了……

我再泼盆冷水,别看现在人人都能 V 法做出产品,但市场是有限的,(细分)需求是过饱和的,很快这些 V 法 APP 一定会死掉一大批,在 Opus4.6(先不提 4.7 了)级别的模型远远不可能白菜价的当下,指望 LLM 独立创业来解决就业和生存,实在是有点异想天开了。

知道的越多,真的越难乐观起来,作为一名从古法时代过来的 Coder,也只好在时代洪流中学会拥抱变化……但即便如此,Coder 在未来几年何去何从,真的太难讲了。现实状况是什么,是人还是太多了,市场需要的是 Super Junior——又要年轻、又要经历匹配、又要啥也都懂、又要学历高、又要能卷,就这都有筛不完的人,而年龄问题是所有人都要面对的事情。我不是在危言耸听,而是就业环境现在就是如此。更何况现在是一代版本一代神,从当前的 CV 四小龙,到如今的国产御三家(GLM、Kimi、MiniMax),变化很快,但 Coder 的年龄无法倒退,35 岁危机甚至都在提前……

回到根本,一切都是本质复杂度的问题,都是权力、分配、经济、政治、阶级问题。打工人很难短时间内在这个“鱿鱼游戏”中醒悟,因为的确有不少人想的是自己比同事晚一天被干掉比什么都强(人类不会从历史中学到任何教训)。

最后补充两句有用的东西,也算是我这个曾经的技术坚持者最后的倔强了:

  • 具有 LLM 能力的,打通第一方 Agent 到 SFT 和 RLHF 中无比重要(例如 CodeX 和 CC)
  • 不具有 LLM 能力,建立自己 Agent 的可信、客观评估体系至关重要(便于快速且可信的更换不同基模和 Prompt 编排方法)

EPILOGUE

人生三万六千天,快乐还是最关键,迎接变化,享受体验,提前焦虑屁用没有……
无论在哪个国家,放下面子,放下身段,那斩杀线永远都轮不到自己。

作为一名从曾经的古法编程和技术信仰者走过来的准·中登,我最后能坚持的事情,就是我所有的博客文章(包含在国内平台同步的),都是 AI 零生成、我自己一个字一个字亲自编写的(最后的倔强了)


版权声明:本文遵循 CC BY-SA 4.0 版权协议,转载请附上原文出处链接和本声明。

Copyright statement: This article follows the CC BY-SA 4.0 copyright agreement. For reprinting, please attach the original source link and this statement.