首页 > 深度停招初级工程师，大厂样板无实战价值、软件黑灯工厂死路一条，三位AI 编程老炮：AI越骂越灵

停招初级工程师，大厂样板无实战价值、软件黑灯工厂死路一条，三位AI 编程老炮：AI越骂越灵

2026年02月01日 09:12

停招初级工程师，大厂样板无实战价值、软件黑灯工厂死路一条，三位AI 编程老炮：AI越骂越灵

本文来自微信公众号： InfoQ ，编辑：宇琪，作者：褚杏娟、Tina，原文标题：《停招初级工程师！大厂样板无实战价值、软件黑灯工厂死路一条，三位AI 编程老炮：AI越骂越灵！》

在2026年初突然刷屏的Clawdbot又给AI编程的火爆添了一把柴。根据项目创始人Peter Steinberger的说法，他一个人完全用AI写出了这个超级AI助手。

AI Coding高速演进，有人借助它如虎添翼，效率和能力被成倍放大；也有人一上手就频频踩雷，代码质量、系统风险反而被放大。但如今企业纷纷拥抱AI Coing，代码已经是“cheap”，技术从业者现在面临的问题已经成为“如何与编程Agent相处”，无论是工作还是生活中。

近日，在InfoQ技术编辑组策划的《2025年度盘点与趋势洞察》直播节目中，Kreditz Al Orchestrater马工、资深AI产品专家松子（李博源）、资深独立咨询师&Al Coding资深实践者张汉东一起，分享了他们的AI编程工具使用经验和过对行业的观察，他们三人都去年大量使用AI编程，并在组织层面进行了一些探索。

在访谈中，三位专家都表示，彻底回不去之前的手工coding时代了，AI已深度接管开发者的主观能动性，成为工作的核心环节。人类在AI时代的核心价值不是写代码，而是需求表达、方案判断、架构设计的能力，这是AI目前无法替代的“最后护城河”。

根据使用经验，现在AI编程的成本远低于人力成本，其产出效率相当于数人团队，哪怕订阅制有额度限制，也是极高性价比的选择。AI编程并非降低行业门槛，而是入门门槛降低、精通门槛拉高、天花板抬升，靠手速和熟练度生存的中间层工程师正被快速替代，其成长路径被直接掐断。当前，AI无法真正理解“优雅的架构”，这是人类的审美问题而非技术问题，也不该指望AI把控，架构设计本就是人类的核心职责，因此真正具备架构能力的人因AI变得更稀缺，

他们评价现在对AI Coding工具好坏与否的唯一标准是能否在真实生产系统落地交付，大厂未经过实战的全套AI方案毫无价值。专家指出，全自动AI程序员（如Devin）现阶段完全行不通，易出现需求理解偏差、架构不一致、交付质量不稳定等问题，未来3-5年人机协作是企业级开发主流，长期Agent才是发展方向。当前，开发工作的核心已从“怎么写”转向“写什么”，从关注代码细节转向业务逻辑、边界条件、异常处理；思考必须更清晰，才能让AI准确理解需求。

他们预计，2026年AI编程将成为行业标配，“一人公司”会成批出现；创业的技术门槛被拉平，核心竞争力转向商业模式、业务理解和业务架构。linker、compiler、操作系统未来或向AI友好形态升级，这背后存在大量创业机会。

而对于年轻人来说，AI消除了信息差红利，让其能与行业专家站在同一起跑线；现阶段是有野心的年轻人成为软件工程思想领军人物的最佳窗口期，核心是获取一手信息、亲自实践并主动输出观点。

专家们提醒，不应将AI当作全知全能的神，而应让其批判性思考、挑战自身观点，避免强化认知偏见；AI的核心价值是成为既支持又挑战人类的协作对象。

以下内容基于直播速记整理，InfoQ在不改变原意基础上进行了删减。完整直播回放可查看：

1“回不去手工coding的时代了”

王一鹏：如果用一个词形容你过去一年的AI体验，你会选什么？

王一鹏：对比使用AI工具之前的情况，你的工作流程是否都变了？

松子：最显著的特点就是变化快、跨度大。过去做一个需求，通常是查文档、写PPT、画原型图，画完之后就等着技术去实现。现在则完全不同了，有想法就直接和AI进行头脑风暴，看着AI写代码，指挥AI去执行，拿到结果后再和技术团队一起评审，由他们来做加固和优化。

马工：工作流程上，我刻意把团队规模设计得非常小，通常只有两三个人，尽量避免大团队沟通，因为有些人跟不上节奏，反而会拖慢效率。另一方面是我个人的工作流，核心是我和AI的持续对话，由我来设计、引导它。

张汉东：以前我会非常关注代码细节，比如优雅性和精细化的质量控制。使用AI之后，我更多是站在更高的抽象层面思考问题，从架构层进行设计，甚至可以同时开多个分支并行推进开发流程。另外，在代码评审上也大量使用AI，先由AI生成一份review报告，再进行人工检查，实现并行评审。

王一鹏：你第一次感到“AI有点可怕或厉害”的瞬间是什么？

马工：5月份开始用Claude Code之后，我才真正意识到这东西“成了”。在此之前，我一直认为AI只是辅助工具，给一些建议，但每个回答都需要仔细核查。Claude Code不一样，它已经能够独立完成一些颗粒度较小的任务，而且不需要人在旁边全程跟着。这一点在我看来是革命性的。有了这种基础能力，再叠加我们的工程经验，就可以做很多以前做不了的事情。

松子：害怕我还真没有，更多的是兴奋，甚至有一种自己年轻了二十多岁的感觉。那种感觉就是，终于可以自己动手了，不再需要依赖技术团队帮我实现想法。尤其是在面对模糊需求时，AI不仅能帮我纠正表达，还能帮我梳理边界条件，直接把代码写出来，把我的思路整理得非常清晰、有条理。

张汉东：我最早是从Claude Code 3.7版本开始用的，那时体验还不算好。等到4.0出来之后，我明显感觉到它变得非常强。再到最近，大家在网上讨论Claude的Skill能力，我也试了一下，最终的效果是我在20分钟内就做出了一个不算复杂、但支持跨平台的AI应用。

王一鹏：你现在写的代码，有多少比例是：在没有AI的情况下，你依然确信自己能完整写出来的？

张汉东：可以的，毕竟我有接近20年的项目和编程经验，手写代码本身没有问题。但最大的问题在于，我已经不想手写了。现在基本是AI First，AI已经在很大程度上接管了我的主观能动性，这是我感受到的最大变化。

松子：如果没有AI，我几乎一行代码都写不出来。但我认为我的价值并不在于是否能逐行写代码，而在于：第一，我清楚自己要做什么；第二，我能够判断AI给出的方案是否可靠；第三，我能把需求描述清楚。这三种能力，是AI目前无法替代的。

马工：从理论上讲，我当然也可以手写所有代码，但从工程角度来看，这并不现实。AI写代码的速度是我的十几倍甚至二十倍。比如我在圣诞节和新年假期完成的那个项目，如果没有AI，可能需要一年时间才能做完。从工程管理角度来说，老板也不可能批准这样的周期，所以在现实中几乎不具备可行性。

王一鹏：过去一年里，有没有一个瞬间你意识到：“我已经回不去不用AI的状态了。”那一刻发生了什么？

马工：我从来没有想过要回到过去。就好比以前是科举制度，后来进了新学堂，你让我再回去参加科举？不可能的。我现在玩得很开心，也非常适应这种状态。

松子：跨年的那几天，大家都在干什么？我那几天连续使用的Token量都破亿，别人在倒计时，我却在给AI写代码。那一刻我非常清楚地意识到，我已经和AI形成了一种共生关系。后来有一天几乎完全没用AI，但那一天我是真的很累，想给自己放一天假。结果第二天开始工作时，我发现自己竟然不知道该如何开始了。打开编辑器的第一反应，还是想先让AI帮我做点什么。回头再看这两个对比，我很确定自己已经回不到没有AI的时代了。

松子的token用量统计

张汉东：我意识到自己回不去，是在某一天突然发现自己写代码时已经不再使用编辑器了。我写了十几年代码，从来离不开编辑器。但在使用Claude Code四五个月之后，我发现很多时候根本不需要编辑器了。那一刻我意识到，自己已经彻底颠覆了过去的工作方式，也不可能再回到原来的状态了。

2把AI当成一个同事，结果为王

王一鹏：从去年开始，我们就关注AI给不同技术岗位带来的影响和变化，今年是更深入的一年。那先请各位根据自己的使用体验，锐评下现在的国内外的AI Coding工具，在使用中各有什么优缺点？有哪些看起来很先进，但在实践中很快暴露出问题？

马工：我并不把AI当作一个工具，而是把它当作一个同事。我和朋友一起探索出了一套理论，叫作AI管理学。传统管理里有人力资源管理，而现在我认为还需要一套面向AI的管理体系。管理的核心从来不在于工具本身，而在于流程和思路，也不存在所谓“最优解”。对我来说，更重要的是探索出一套适合自己的AI管理方法，并与我的工具组合在一起，形成最适合产品的方式。

也正因为如此，我现在比较反感一些大厂的做法，声称做出了一整套方案，要求别人直接照着用。但我仔细看过之后发现，他们自己甚至没有用这些工具真正做出一个在生产环境中运行、处理真实业务的系统。所以我现在评估工具，只看一件事：有没有在真实生产系统中、处理过真金白银的案例。如果没有，我基本不相信。在这一点上，我甚至更相信自己，因为我是实实在在把公司的业务跑在这些系统上的，是真正经过实战检验的。

张汉东：从产品经理背景转过来的用户，使用Vibe Coding时，往往并不太关心底层代码质量，更关注功能是否完整、是否可用。像我这种程序员出身的人，会不可避免地带着一些工程习惯，更在意代码质量、可维护性。因此在使用这种对话式代码生成工具时，我需要对整体生成逻辑进行把控。

即便我可能不会逐行检查代码细节，但必须在脑中建立一个清晰的心智模型，并通过对话与Claude Code建立稳定的协作关系。即便如此，它生成的代码质量也未必如想象中那么高，仍然需要人类进行验证和review。通常还要结合一些skill、prompt以及自动检查和优化工具来兜底，才能保证整体质量。所以我认为，Vibe Coding和相关工具的使用，至少可以分成两类人、两种路径来理解。

王一鹏：如果我并不是特别在意代码是否优雅、质量是否很高，只要能跑、能用，这种情况下不去review代码也没问题吗？还是说如果完全不review，代码在运行层面本身就可能会出问题？

张汉东：一般来说，一个产品上线之后，后续一定涉及维护。如果形成的是一个“AI生成代码、AI修bug”的闭环，短期内是可以工作的。但随着用户规模和代码规模不断扩大，很容易陷入不可控状态，最终变成一次性应用，用完即弃。对于一些关键领域，比如基础设施或操作系统，使用Vibe Coding时，你需要的是钢铁般稳定的结构；而在一些不那么关键的上层应用场景中，可以接受“用完即弃”，我更愿意把这种代码形态比作海绵结构，内部存在不少空隙和不确定性。最终可能呈现的是一种“海绵包裹钢铁”的混合结构。

松子：就我个人而言，评价工具的标准很简单，尤其是对非科班出身的人来说，真正能交付成果的，才是好工具。我用过不少国内和国外的工具，主要集中在应用层，而不是系统层。像汇编、C或C++这种底层语言，大模型目前显然还胜任不了。我更多使用的是Python加后端相关的应用开发。对我来说，谷歌的模型配合Claude Code，已经足以覆盖日常工作需求。国内工具并不是不努力，但整体来看，底层模型能力仍然存在一定差距。面对复杂需求时，它们虽然很认真地写代码，但错误率偏高，往往需要我花大量时间去做复杂调整。

实际使用中，我在企业内部更多是用AI生成demo和高保真原型，而对外项目则是一个纯交付过程。做demo时，两三天就能完成一个高保真版本；但如果是用Claude Code写一个可交付的应用级项目，通常需要三到四周的时间。

以去年为例，从9月、10月开始，我每个月新增的代码量在10万到14万行之间，12月我做了一次大规模重构，直接删掉了90%以上的代码。到了今年1月份才正式进入交付阶段。那时我加了很多自己整理的Skill和规则，按照以往的工程习惯去做可用性检查、漏洞检查、代码复用检查等，再交给AI进行修复和优化。

王一鹏：是不是存在某些编程语言天生更适合AI Coding？

马工：我相信语言、工具，甚至整个软件栈都需要被重新设计，变得对AI更友好。Rust在我看来就是一种非常AI友好的语言，因为它可以在编译阶段完成大量验证，只要能通过编译，代码质量就已经明显高于很多语言，这对AI非常有利，可以极大降低迭代成本。除此之外，我认为linker、compiler，甚至操作系统，未来都可能需要重构为AI友好的形态。因为现有工具几乎都是为人类设计的，而AI的思维方式与人类差异很大，这里面我反而看到了很多潜在的创业机会。

张汉东：Rust对AI友好，很大程度上源于它强大的编译器体系，这为AI提供了一个清晰的验证反馈回路。更关键的是，Rust是以类型系统为核心的语言，而类型系统本质上可以理解为一种逻辑证明。当Rust程序编译通过时，意味着它在逻辑层面已经被“证明”过了。

我之前有一个实践案例，让Claude Code帮我排查一个运行时才会暴露的问题，编译阶段是发现不了的。这个bug我自己没找到，但它大概花了五分钟就精准定位出来了。事后我反思，可能正是因为Rust的类型系统和强逻辑性，使得AI在推理时能够发现这些潜在问题。

当然，Rust也有不足，比如缺乏像Lua这样的动态语言能力。我们团队也在思考，为Rust引入一种可以无缝交互的动态语言，语法接近GS这类大模型更擅长的语言形式。安全、稳定的核心部分由Rust承担，而快速迭代的业务逻辑则交给动态语言来实现，这也是我们正在探索的一种方向。

3编程老手们，都怎么用AI工具？

王一鹏：大家有没有自己的“AI工具栈”，几个工具协作使用？实际中，有没有遇到过AI工具让你“返工成本比人工更高”的情况？程序员是否需要刻意训练自己更好地与AI协作？

松子：我确实有一套自己长期使用的AI技术栈，包括多AI协同写作，我甚至为此给自己设计并实现了几个协作型智能体。回顾2025年3月到5月那段时间，我刚开始深入大模型编程，可能也受到当时模型基础能力的限制，踩了非常多的坑。几乎每天只有10%的时间在生成代码，剩下90%都花在调bug上。那段时期反而是我从非技术背景跨入技术领域、学习速度最快的阶段。8月之后，尤其是Claude Code 3.5版本出来以后，返工成本高于人工成本的情况基本就很少再出现了。

马工：我实际上是在搭建一个团队，为不同的AI赋予不同的人格和职责，有的负责头脑风暴，有的负责架构设计，有的负责编码，有的做测试，有的做质量控制，最后还有一个负责部署。我用Claude Code的sub-agents来实现这些角色，同时又设计了一个项目经理角色，负责协调整个流程，形成完整的工作流。

这套工作流目前相对固定，但我正在尝试把它做成更具弹性的形态，尽量用AI去模拟一个真实的人类团队。整体使用下来我已经非常熟练，也并不觉得返工成本是问题，因为返工本身也是由AI来完成，而不是我亲自返工。这套流程我在公司内部的生产环境中已经跑得很顺。

同时，在个人项目中，我还有另一套流程和角色，用于写文章，比如公众号内容创作。我的主要工作，其实就是组织这些“AI同事”完成任务。

至于具体用哪个模型、哪个工具，在我的理论体系里并不是关键问题。我可以随时切换到其他大模型，最多只是质量稍差一些，或者返工次数多一些。这也是我和很多朋友共同追求的目标：构建一套尽量与具体大模型解耦、依赖度很低的AI团队体系。

如果打个比方，就像开一家真实的公司，能招到清华毕业生当然最好，招不到就招985，再不行还有其他学校，但公司依然可以运转。你不能因为招不到最顶尖的人，就干脆不开公司了，那这个思路本身就是有问题的。

张汉东：通常我会用Claude Code做规划，用Codex做review，完成后再回到Claude Code去实现。我的工作并不只有开发，还包括代码评审、社区工作，以及与出版社相关的写作任务，因此我也为自己打造了一套完整的workflow。

这套workflow的灵感部分来自Shopify开源的一套工具，是用Ruby写的。我用Vibe Coding把它改成了Rust版本，并加入了一些结合我自身工作经验的流程设计。比如出版社给我一份大约178页的英文翻译稿，我基于Claude Code SDK，把任务拆分成五个部分并行处理，大概一个小时就完成了包含格式、内部链接在内的完整中文版。

除此之外，我也用这套workflow来做代码review，以及其他流程固定、但相对琐碎的工作，统一交给AI处理。还有一个例子是现在比较流行的上下文MCP项目，它是开源的，我同样用Vibe Coding把它改成了Rust实现，并整合了Rust的工具链。这样在做Rust代码review时，就可以把编辑器之外的各种工具一起纳入进来。

整体来看，这些已经构成了我个人的AI工具体系。最近我还在尝试把团队过去两年的经验沉淀成Skill，正好赶上Skill这个概念流行，就把我们在Rust UI方向的经验整理成一个Skill，作为团队共用的AI编程基础设施，形成一个共享的工具库。

张汉东制作的nana banana workflow

王一鹏：Vibe Coding圈有两种玩法：Lovable/Bolt那种快速出Demo给客户看，和Claude Code直接交付生产代码（即Lovable模式vs Coding模式）。你们公司是哪种？有没有两种混用出问题的？

松子：Lovable是我去年刚开始用大模型编程时常用的工具，现在回头看，那其实就是当时的阶段性选择。去年4月我做了第一个demo，到8月和客户沟通时，我尝试用一种“边喝咖啡边聊需求、现场出demo”的方式交流。这种模式下原型生成速度非常快，客户可以迅速看到大概的形态。

但我当时犯了一个很大的错误，就是在live demo之后，直接尝试把demo代码演进成生产级代码，结果掉进了一个非常深的坑。后来我逐渐形成了一种方法：live demo结束后，先进入“包头”状态，对代码做一次完整重构。把demo代码直接拿去改成生产级，几乎就是一场灾难。demo能跑、能看，但架构往往一塌糊涂，在其基础上继续加功能，重构成本甚至比重写还高。所以我的原则是，demo用完即弃，属于日抛型产物，只用于表达和验证想法。

马工：过去和客户的交互往往需要研发团队支持，现在有了这些非专业编程工具，销售可以自己完成，整体效率提升非常明显。所以我并不完全同意“Lovable不能用于生产”这种说法。比如销售做一个demo，本身就是生产，它在业务上的价值，可能比我写一个非常复杂、可扩展的系统还要高。它能够直接促成订单，那为什么不能算生产呢？

当然，它是日抛型的，但依然是生产的一部分，关键是要把这两类场景区分开。你不能一边期望低门槛快速出成果，一边又要求给你一个完美架构。这本质上是期望管理的问题。很多人之所以对AI失望，往往是因为在错误的场景里，期待了错误的结果。

张汉东：在做AI工具选型时，确实要明确边界。像Lovable，从名字就能看出来，更偏向于“让人喜欢”的demo型工具，适合给非技术决策者或客户展示，比如销售场景下让客户点头认可。它并不关注代码质量，而关注是否能促成决策。如果目标是专业开发，那就需要像Claude Code这样的工具，这是两个不同的领域。我虽然没有深度使用过Lovable，但研究过他们官网开源的prompt，写得非常好。它解决的正是非技术用户的痛点。就像我前面说的，即便是“海绵式”的代码，它依然能很好地表达意图，在和客户沟通时，往往比文字、图片甚至视频更有效，因为它是可交互的。

王一鹏：几位老师现在是用AI帮你们写prompt，还是主要自己来写？

王一鹏：为什么不用AI写呢？

松子：我试过，但总觉得AI写出来的prompt太机械，不如自己写得有感情，更有韵味。

马工：我是大量用AI写，而且还专门设置了一个角色，把它当作公司的人力资源负责人。当项目遇到困难，或者到了关键里程碑时，我会让这个“人力资源专员”回顾我们的聊天记录，总结可以吸取的经验和教训，并把这些经验嵌入到各个角色的cloud MD中。这样每完成一个项目，我的各个AI角色都会在能力上有所提升，这是我对人类组织运作方式的一种模拟。

现实中的公司都会在项目结束后做复盘，决定哪些经验要保留，哪些问题下次要避免。在传统组织中，这些通常通过邮件或会议传递。而在AI场景里，我是通过固定的prompt把这些经验沉淀下来。

王一鹏：听起来马工已经触及到AI的本质了，本质上还是仿生学。

马工：对，本质就是模仿人类。很多AI技术上的难题，人类其实早就通过管理学和工程学的方法解决过了，我只是把这些方法原样迁移过来，用在AI身上。

张汉东：我也是偏向AI写prompt，我的原则是尽量AI First。但我会对prompt做把控，判断哪些是好的、哪些是无效的。如果需要比较专业的prompt，我会先去网上找成熟案例，再结合AI一起改造成适合自己场景的版本。如果效果不好，就当成一次debug，不断迭代，直到形成一个真正有用的prompt。

王一鹏：Karpathy说AI在“可验证任务”（如代码、数学）上可能超越人类专家，但在“不可验证任务”（如架构设计、战略决策）上进展缓慢。你们觉得AI什么时候能真正理解什么是“优雅的架构”？还是永远不能？

马工：作为工程师，我的核心目标只有一个，就是把问题解决掉。这个问题是用AI来解决，还是让同事解决，或者交给软件系统解决，对我来说本质上都只是工具选择而已。我不会为了用AI而用AI，更不会执着于“一定要用AI把问题做到世界第一”。如果某个问题AI解决不了，那我就直接插入人工。我也认为，去预测三年后的AI会发展成什么样并没有太大意义，因为三年内会发生太多变化。更重要的是用好当下的工具和模型，尽快把问题解决，交付一个能够在生产环境中稳定运行的系统，这是我目前最关注的事情。

松子：以我自己为例，技术团队写完代码后，我再用AI或反编译工具去做review，确实可以发现并修复大量bug，很多时候甚至重写代码的效果会更好。但在架构设计和战略决策层面，AI可以给你一百种“正确”的方案，却无法告诉你哪一种才是最合适、最优的选择。这种取舍判断，我认为仍然是人类最后的护城河。所谓“优雅”，在我看来并不是一个技术问题，而更像是一个审美问题。就像“情人眼里出西施”，我看这些大模型，各有各的美感，但在审美判断上，AI目前确实还不行，它还需要更多训练。

张汉东：首先是AI能否理解“优雅的架构”。我以前在编程时，会直接要求Claude Code把代码写得更优雅、架构更清晰，它给我的回复基本是：抱歉，我理解不了“优雅”，我只能进行模式匹配，本质上是在模仿人类。也就是说，它并不真正理解人类的审美。

其次，我们本身就不应该指望AI去理解什么是“优雅架构”，这本来就应该由人来把控。就像Anthropic去年在官网推出的一套课程，其中有一门叫“4D人机协作”，属于AI素养教育，核心是教人如何更优雅地进行人机协作。其中第一个“D”叫Description，强调在向AI描述需求时，要明确哪些事情由人来做，哪些交给AI。我认为这一点非常重要，有些问题本身就不该交给AI去理解。

4用AI编程，到底贵不贵？

王一鹏：去年，以Claude Code为代表，AI编程工具的计费逻辑发生调整：从独立API计费，到订阅制+使用量控制。这些调整背后的动机是什么？另外，这些变化对开发者来说，使用成本是更高还是更低了？支付高额的费用，值不值呢？你用这些工具的时候，会主动关注Token、调用量或费用上限吗？

马工：我并不认同“Claude Code很贵”这种说法，这完全取决于你的参照系。我是把它当作一个“人”来看待的。你花200美元，根本不可能在任何地方请到一个能稳定写代码的人。从这个角度看，它便宜得不可思议。

目前Anthropic的问题在于，Max Plan在法律上不能用于公司场景，我们公司只能使用Team Plan，而Team Plan的额度又低于Max Plan，超出部分只能走API计费，价格大概贵十倍，这确实带来了一些挑战，只能通过一些变通方式解决。但总体来看，这笔账其实不用算，只要你用得上，它能替代好几个员工。

松子：我个人一直更偏好订阅制。以我自己的真实数据来看，从元旦往前推的一个月内，我大概用了接近28亿个token。如果按API计费，那成本会非常夸张；但用100美元的Pro订阅，对我来说反而是极其划算的。

如果按API算，这个工作量可能要几万美元。实际上，这相当于一个五人团队的产出，比如两个前端、两个后端，再加一个产品经理。按月薪3万计算，三个月就是45万的人力成本，而我用Claude只花了100美元。

张汉东：在Code订阅模式出来之前，我也只能用API，确实非常贵，有时候只是打开项目又关掉，也会被计费，感觉很不可思议。后来转向订阅模式，哪怕有周限额，只要不是同时推进太多项目，其实是完全够用的。我有一段时间同时做了好几个项目，每天熬到两三点，一个月几乎没怎么睡，甚至还注册了多个账号并行使用，多少有点“薅羊毛”和数据蒸馏的嫌疑，后来我自己也意识到这样不太对，就收敛了，只把精力放在真正重要的项目上。我的建议是，要用就用最好的模型，无论是工作还是学习，否则你用一些中转服务，甚至都无法确认模型是真是假，很容易被掺假。

5全自动AI程序员，目前行不通

王一鹏：你们如何看待去年Devin这种全自动AI程序员的出现？与Cursor等人机协作工具相比，各位认为哪一个才是未来企业级开发的主流？你觉得现在的Agent Coding，是在制造“可演进系统”，还是在制造“未来无人能接手的黑箱”？

马工：关于“无人软件工厂”或“软件黑灯工厂”，我几个月前在公司内部亲自尝试过，结果是非常惨痛的失败。除了Devin，还有OpenSWE、NonSmith等一系列类似的全自动方案，基本没有真正成功的商业案例，更多是自我宣传，没有客户愿意用真金白银为其背书。在我看来，这条路线至少在现阶段没有必要：既然我已经用AI替代了90%的成本，剩下10%插入人工又有什么问题？我们的目标是解决问题，而不是证明“AI无人工厂”的学术可行性。

王一鹏：当时这个“工厂”失败的具体原因是什么？

马工：第一，AI在需求理解上极易产生偏差，无论需求文档写得多详细，都无法完全避免。第二，在系统架构上缺乏一致性，不同任务往往采用不同实现方式，即便用规则或promise约束，也仍然会出现不遵从的情况。第三，在最终交付质量上，人类能够理解质量是一个光谱，而不是0或1，知道什么时候可以放松、什么时候必须严格，但AI缺乏这种上下文感知，表现非常不稳定，难以真正满足客户需求。

这些问题叠加后，你会发现交付结果始终达不到预期。相比之下，在工作流中插入少量人工控制节点，问题就能有效解决，而且成本并不会大幅上升，因为人只负责把控关键节点，而不需要亲自完成大量工作。

松子：我认为全自动Agent Coding目前存在下面几个致命问题。第一是没人review，Agent自己写、自己测、自己合并，最终谁来负责？第二是上下文严重丢失，十个月后再看代码，可能连Agent自己都解释不清楚，黑箱叠加黑箱，已经不是“屎山”，而是“黑洞”。屎山还能慢慢重构，黑洞则只能推倒重来。人写的代码再烂，至少还有责任人；Agent堆出来的代码，一旦出问题，根本不知道该找谁。

像Devin这样的产品，发布时非常惊艳，但真正用起来却是一地鸡毛。简单任务尚可，稍微复杂就开始跑偏，上下文理解和调试能力甚至不如人类工程师，更像是一个需要人时刻盯着的AI实习生。从ToB企业的角度看，真正合理的形态一定是人机协作：关键节点可控、可维护、可追溯。AI应该是副驾驶，而不是司机，方向盘必须掌握在人手里。

张汉东：未来三到五年内，人机协作一定是主流，但长期来看，Agent会成为主流。我之所以这样判断，是因为Anthropic推出了系统化的4D人机协作课程，这说明在短期内，他们并不认为模型本身会出现足以彻底替代人的突破，否则没必要投入如此多精力去教人如何协作。

但从长期看，Agent的方向依然非常明确。以Claude推出的Skill为例，它并不仅仅是Prompt，而是把人类的能力和经验更精准地沉淀并交给AI。随着Skill的积累和热加载能力的增强，Agent在特定团队和场景中，已经具备成为主流生产力的潜力，未来甚至可能走向跨行业的通用化。

此外，Anthropic收购了前端打包工具Bun，也明确提出“下一代软件基础设施”的概念。结合谷歌、马斯克等公司的动向，可以看到未来的软件形态，很可能是面向Agent而非人类UI的。这些信号都在指向一个结论：短期内要解决黑箱问题、强调人机协作，但长期演进方向，仍然是Agent。

王一鹏：有个比较极端的问题，你现在交付的东西，如果有一天AI不在了：你自己还接得住吗？还是你已经默认“反正以后也会有更强的AI”？

松子：如果AI突然不在了，我确实接不住，但我也没打算硬接，我一定会去找下一个AI。与其担心AI会不会消失，不如担心自己是否跟得上AI的进化速度。对我来说，一个很明显的状态就是每天都在学习新词、新玩法。每天至少两次浏览不同的AI网站和论坛，看看大家在讨论什么，从而不断更新自己的认知。

张汉东：首先，我认为AI不可能“不在”。从能源、算力以及各国的投入来看，无论是美国、日本还是中国，未来电力和算力只会越来越充沛，因此我并不太担心AI会整体消失。更重要的其实是你如何看待AI，以及你对AI的依赖程度。在使用AI时，我们必须保留自己的判断能力，同时具备对AI输出结果的验证能力。如果AI不在了，大不了重新学习，但关键在于：你之前用AI写出来的系统和架构，你自己能不能hold住？你是否知道该从哪里重新接手？这取决于你在使用AI的过程中，是否建立起清晰的心智模型。如果你只是把AI当成一个黑箱，那一旦AI不可用，你肯定是接不住的。

而且现实中，AI不可用的情况并不少见，比如账号被封。Claude封号并不罕见，如果在一周内你的账号被封，而你手头的工作又有deadline，这时该怎么办？找不到替代AI，就只能自己顶上。因此，在日常与AI交互时，就必须提前做好这种心理和能力上的准备。

马工：AI本身不会消失，但AI在你所在国家或地区的可用性，确实可能成为问题。比如Anthropic目前就不向中国提供服务，未来随着地缘政治变化，也不排除出现更极端的情况，你所依赖的某个服务突然完全不可用。

从企业供应链安全的角度来看，通常有两个对策。第一是准备Plan B，比如智谱目前就主打作为Claude或Anthropic的替代方案，性能可能只有80%，但价格只有十分之一。第二是在使用过程中，尽量降低对单一模型的强依赖，让工作流具备足够的韧性，即便切换模型也能完成任务，只是效率略低一些当然，在条件允许的情况下，比如我现在能用Anthropic，我还是会直接用它，而不愿意花时间去适应那些便宜但体验不佳的模型。

王一鹏：有人说和AI多花时间头脑风暴是被严重低估的技巧，“简单功能少聊，复杂功能多聊”。但这不就是产品经理的老本行吗？程序员写代码的时间是不是正在被“和AI聊天”取代？另外，当AI工具成为习惯后，个人的思维方式需要跟着发生什么变化？顺便给大家一些使用AI编程的建议？

松子：简单功能少聊，复杂功能多聊，这本来也是产品经理的基本功。现在的模式是，产品经理先和AI深度讨论需求，再与技术团队协作，用AI写代码，最后由产品和技术一起审核，协作方式从“沟通产出”变成了“协作产出”。

在技术实现能力上，AI确实在拉平差距，很多工程师的实现能力被AI显著拉近了。但需求表达能力反而成了一种稀缺资源。我们合作的一家央企，原来的“技术团队”已经改名为“需求经理”，他们大约50%的时间在和AI对话，30%的时间审查AI生成的代码，剩下20%用于调试。这并不是降级，而是一种升级，从写代码转向架构和产品思维。

从“怎么写”转向“写什么”，从一次性完成转向迭代逼近。过去关注的是语法、API和实现细节，现在关注的是业务逻辑、边界条件和异常处理。以前追求完美，现在更强调先让AI跑起来，再逐步修正。同时，还有一个明显变化：以前自己想明白就够了，现在必须让AI也想明白，这反而倒逼自己的思考更加清晰。在我看来，AI时代最核心的能力不是写代码，而是把需求说清楚；说不清楚，AI就会用一堆bug来“教育你”。

王一鹏：很像数学学习的过程。早期更多是学习计算方法，比如三角函数，而真正进入数学研究后，重点变成了提出问题、证明定理，并把推理过程表达得清晰、可验证、可被他人理解。现在的开发工作也类似，基础计算可以交给AI，人只需要关注更高层次的问题。

马工：和AI聊天本身并不难，任何人都可以做到，但真正的挑战在于能否形成习惯。你只要有问题就去找AI聊，几乎只会有收益，不会有坏处。

我有个朋友，任何事情看到一句话，都会第一时间丢给AI。我认为这会显著提升你的知识密度和深度，因为AI本身就是最“博学”的存在。我也在刻意培养这个习惯。前几天我修洗碗机，就是在AI的指导下完成的。我现在也还在思考，AI在我生活中究竟扮演什么角色：有时是员工，有时是秘书，有时是导师。它并非上帝，但如果你养成这种与AI持续互动的习惯，你能从中获得的价值会非常巨大。关键在于，你要主动去找它，把它当作自己的“贵人”。

王一鹏：这其实和大家对AI的期望有关。有些人只进行几轮对话，得到不满意的结果就放弃了；有些人愿意聊二三十轮，得到一个60分的结果，再自己补到80分。但马工对AI的期望显然更高，是希望通过多轮对话，最终交付一个接近90分的结果。

马工：我在ChatGPT里做了定制化设置，明确要求它进行批判性思考、挑战我的观点、不清楚就不要回答，所有结论都必须有来源。我甚至在“塑造”AI的性格，因为AI很容易顺着用户说话，而我刻意要求它不要强化我的偏见，而是帮助我识别并修正偏见。你不能把AI当成一个全知全能的神来崇拜，否则一旦结果不符合预期，就会迅速失望并转而寻找“下一个神”。

你之所以向AI求助，本身就说明你的认知是有限的，如果AI只是顺着你说，只会加固你的局限。你真正需要的是一个既支持你、又挑战你的对象，让你意识到自己可能是错的，甚至从根本上重新审视需求或架构。这也是为什么产品经理往往更适合使用AI，因为他们从职业生涯一开始就习惯被挑战，而程序员往往不习惯被质疑设计。

张汉东：至于“程序员是否会被AI聊天取代”，我并不认同这种说法。实际上，即便在没有AI的时代，程序员在写代码前也要先对需求进行内化、建模，这是一个与自己对话的过程，现在只是把这个过程外化为与AI对话。过去当我把方案完全想清楚时，往往已经不太想写代码了，因为后面更多是体力劳动；现在有了AI，我只需要把思路说清楚，代码就可以交给它完成，反而节省了大量时间。

松子：Claude Code有一个全局配置文档，我在去年10月对它做过一次升级。配置中，我为它设定了明确的用户关系和协作角色，并且根据不同关键词加载不同的档案，与Skill结合完成不同类型的工作。效果在于，不同工作场景下可以快速切换不同角色和协作模式，比如写书、写文章、处理工作问题或生活问题，都能调用不同的“人格”和配置，提高整体效率。

张汉东：我觉得人格设定本身是有价值的，至少能提醒自己把AI当作伙伴。如果我也这么设定，可能就不会动不动骂AI了。

马工：我有个朋友正好反过来，给AI设定了一个“暴躁老哥”的人格，每次写完代码就让它来骂一遍，效果反而很好。有些场景下并不需要所有人都温和友善，有时确实需要一个“坏人”来提高整体质量。所以这完全取决于你自己真正需要什么。与其照搬别人的设定，不如把你在现实生活中渴望的那种角色，直接写成prompt，交给AI。

6“只招会用AI的实习生”

王一鹏：AI生成的代码通常'能跑'，但鉴别它是否'优雅'或'可维护'，反而需要更高的能力。这是不是说明AI编程其实提高了门槛而不是降低？导致现在用AI coding最爽的是更资深的开发者？

张汉东：我觉得和年龄没有关系，即便把AI交给一个三岁小孩，只要他具备语言能力、能够表达自己，就同样可以使用AI。小孩子的一个显著特点是不断追问“为什么”，本质上就是能够提出真实的问题、表达真实的困惑。这在我看来，是使用AI最核心、甚至唯一的重要能力。无论是在个人成长、工作还是职场中，关键都在于你能否觉察到自己真正遇到了什么问题，并把它清晰地表达出来。这听起来或许有些鸡汤，但所谓“活在当下”，本质就是对自身处境保持觉察，并将问题说清楚。

马工：以我个人的经验来看，我们公司已经不再招聘初级工程师，只需要资深工程师。原因其实很简单：从企业角度看，我不再需要能力处在“及格线”的工程师，因为他的水平可能与AI相当，甚至低于AI，而AI在编程语言上的覆盖面远远超过个人。企业为此还需要支付较高的薪酬，自然缺乏招聘初级工程师的动力。

之所以我们这些“老登”还能处在第二层，是因为我们的能力确实比AI略高，至少可以指导AI工作。对企业而言，这种能力是有价值的，而且这种价值会被AI成倍放大。但如果每个企业都基于同样的逻辑做决策，就会有大量年轻人长期找不到工作，这将是一个非常严重的社会问题。

松子：入门门槛确实被大幅降低了，同时精通的门槛也被拉低，但天花板却被抬得更高了。现在入门可能只需要十分钟，就能做出一个看起来不错的Demo网站，但从“能跑”到“能用”之间仍然存在明显差距，无论是安全性、性能还是可维护性，都还有大量提升空间。

另一个重要变化是中间层的塌陷。过去依靠手速和熟练度生存的那一层工程师，正在被AI快速替代。入门者可以借助AI很快学会写代码，而中间层却被压缩消失。反而是依靠架构能力和判断力的资深工程师，在AI时代变得更加稀缺。AI拉平了“会写代码”的价值，却显著放大了“判断代码好坏”的价值。因此，我认为AI时代最危险的并不是不懂代码，而是以为自己已经懂了。

王一鹏：有人说AI不但不会让架构师变多，反而会让架构师更稀缺：不是因为更难，而是“成长路径和回报同时塌陷”，你们同意吗？如果新人都用AI跳过基础训练，10年后谁来当架构师？

松子：AI并不是让架构师或产品架构、业务架构变得更多，而是让真正具备架构能力的人更加稀缺。这种稀缺性非常反直觉，并非因为事情变难了，而是因为成长路径发生了塌陷。一个行业中专家的数量，往往取决于两个因素：是否存在清晰的成长路径，以及是否有明确且足够的经济回报。像医生、律师这些职业虽然门槛高，但路径清晰、回报明确，因此仍然吸引大量人才。

而AI的出现，在一定程度上削弱了这两个条件。新人练手的机会变少了，如果直接依赖AI生成代码，就会跳过“如何设计才是最优”的思考过程。这就像计算器普及后，心算能力逐渐退化一样。未来十年，也许并不缺会使用AI的人，真正稀缺的是懂得如何教AI正确工作的那类人。

马工：现有的职务和头衔体系，可能在未来几年内会被重构，取而代之的是一套新的角色和职称体系。我加入公司时是leader engineer，但后来我和老板沟通，直接把头衔改成了“AI orchestrator”，工作内容也从传统工程转向管理AI agents。我相信未来几年会不断涌现新的头衔，而年轻人反而可能更有优势，因为他们没有历史包袱，可以用更AI原生的方式去思考。

但在新的体系真正成型之前，会有一个相当艰难的过渡期。年轻人确实会在这几年里大规模地面临就业困难，看不到清晰的上升路径，企业也缺乏培养他们的意愿。以我现在的团队为例，三个人就能完成过去几十人团队的工作，而且效率更高。这实际上意味着，我们无意中减少了大量岗位。如果没有经济层面的重大增长，这种压力在短期内很难缓解。

王一鹏：现在写代码变得简单，难点在于理解代码的现有内容、意义以及修改后可能导致的问题。这会对初级开发者的成长路径产生什么致命影响？AI是不是正在直接“掐断”初级开发者本该经历的那条成长路径？如果公司都在裁高级工程师、只留应届生+AI，谁来教新人识别AI的坑？"

马工：年轻人探索新路径几乎是必然的，历史上也反复出现过类似情况。比如传统零售行业，过去需要从管理培训生、门店员工一步步做到店长、区域经理。电商兴起后，很多毕业生直接进入平台做“店小二”，反而成长为行业核心力量，并没有走传统路径。我相信软件行业中也一定会出现类似的新路径，只是目前还在探索阶段。

张汉东：从趋势判断上看，短期内人机协作仍然会是主流。在这一阶段，经验丰富的人依然是被需要的。同时，也会有一些年轻人抓住机会创业，他们往往会雇佣具备经验的老工程师。但从更长期来看，如果三到五年后以Agent为主流的模式真正成熟，职业结构可能会发生更根本的变化。

今天的架构师主要面向代码，参与人机协作；但未来的架构师，可能不再直接面向代码，而是面向多Agent、多模态系统，负责整体调度和协同。这种能力并不一定依赖写代码，而更多依赖行业理解、领域知识和一线经验。架构本身并不局限于技术领域，任何行业只要具备架构能力的人，都有可能胜任Agent架构的工作。

王一鹏：现在张老师和松子老师所在的团队，还在招聘初级工程师吗？

张汉东：之前我们确实还在招聘初级工程师和实习生，但今年开始，团队的负责人已经明确要求全面推进AI coding。如果现在还有新人岗位，也必须具备使用AI的能力。因为我们的AI工作流已经在团队中全面铺开，如果你进来却不会用AI，基本无法融入工作。现在大家都是AI在干活，没有精力再进行传统意义上的手把手教学，有问题直接去问AI。通过workflow和技能体系，整个团队已经高度AI化，新人必须跟上这个节奏。

松子：过去新人进来还会有人带，现在几乎没人再教，都是直接跟着AI学。另一方面，以前一个项目需要两名技术人员协作完成，现在往往是一个人加AI就能独立完成，形成一种“超级个体”的工作模式。新人需要自己负责一个完整方向的产品，并借助AI实现。

当前很多年轻人选择创业，背后有几个原因。首先，信息差红利基本消失了。过去创业需要长期积累和信息优势，而现在通过AI工具，几乎可以瞬间获得大量信息。其次，创业门槛被大幅拉低。大模型出现后的这两三年，低代码、AI工具和云服务显著降低了MVP的实现成本，使得创业的技术门槛几乎被拉平。在这种背景下，真正的关键反而转向商业模式、业务理解和业务架构。

7“一人公司”成批出现，年轻人最好的时代

王一鹏：展望2026，各位认为，今年最确定会发生的三个变化是什么？程序员的哪些能力会进一步被AI重塑？技术人未来最应该开始学习或加强的能力是什么？

张汉东：过去这一年带来的变化，几乎相当于以往十年的迭代速度，很多事情已经无法预测，任何可能性都有可能发生。不过我仍然坚持一个判断：在未来三到五年内，人机协作依然会存在明确的窗口期。

在这段时间里，我对学生的建议是，首先一定要跟上AI的发展，最基本的是你得会用AI。更重要的是，你要获取第一手信息，必须持续关注AI最前沿的动态，并基于这些信息去判断趋势。

其次，你一定要尽量掌握当前最好的AI工具，同时建立属于自己的AI工作流和学习路径。只有这样，才能顺利衔接后续以Agent为主流的发展阶段，知道如何指挥Agent工作，并在过程中持续积累行业经验。

马工：我的态度既乐观也悲观。悲观的一面在于，我认为AI取代大部分劳动力、引发大规模失业几乎是不可避免的，这一点个人无法改变，社会是否能够适应，这是政治和制度层面的问题。但从乐观的角度看，如果有一些年轻人足够有野心，想真正做出点东西，现在反而是最好的时代。以AI coding为例，我并不认为现阶段的工具已经达到了“世界一流”，它们只是暂时领先了半圈，而这是一场马拉松，领先优势随时可能被反超。在这个行业里，我不认为存在真正的权威。年轻人与所谓的世界一流专家，本质上站在同一起跑线上。

我现在特别想做的一件事，是重新构建一套话语体系。比如，为什么一定要有“架构师”这个角色？也许我们会创造出新的头衔和新的定义，年轻人同样可以参与其中。我甚至会认为自己是世界一流的AI coding专家，并不是因为我一定最强，而是因为我没有看到明显比我强很多的人。

如果一个年轻人有足够的胆量，想成为新时代的软件工程思想领军人物，现在就是最合适的窗口期，可能只有一到两年，必须立刻行动。一定要获取一手信息，不要只看公众号，不要只接受别人咀嚼过的结论。亲自动手的成本其实很低，只要你自己去实践，就会获得与他人完全不同的体验，通过不断对比，你才能逐渐和别人站在同一水平线上。如果你只是跟着某位名人说什么就做什么，那永远都会慢一步。更何况，很多观点本身也带有立场和商业目的。

另外，如果你真的想探索这个方向，不要只输入、不停地听，还要输出、去表达。讲对讲错并不重要，也不存在标准答案。只要你的观点足够有逻辑，就能吸引到志同道合的人，甚至走向创业。我认为，对于真正有目标、有野心的年轻人来说，这是一个极好的时代。

松子：AI编程正在成为标配，已经不再是加分项，而是基础能力。中间层开发者正在大规模转行或被淘汰，“一人公司”会成批出现，这种趋势已经在现实中开始显现。在这样的背景下，最大的挑战在于学会如何与AI协作，并把更多时间投入到业务理解上。真正理解业务的人，才能告诉AI应该做什么。

归结为一句话，就是要放下对手工写代码的执念，从“敲键盘”转向“拿指挥棒”。在2026年，真正具备竞争力的，不是单纯写代码的人，而是能够指挥AI写代码、并把握方向的人。

。

责任编辑：

文章来源：http://www.jingmeijuzi.com/2026/0201/2155.shtml