内容概要
在本次演讲中,Chip Huyen 深入探讨了在 AI 技术飞速发展、能够轻易复制甚至自动生成软件的当下,开发者所面临的焦虑与意义危机。她指出,尽管代码的生成门槛正在急剧降低,但世界上的长尾问题永远存在,而人类的偏好、文化差异、全新的人机交互范式以及不可逆环境下的 AI 护栏建设,都为未来的构建者留下了广阔的探索空间。最终她强调,回归纯粹的乐趣,把构建当作一种创造力的表达,才是驱使我们在 AI 时代继续前行的核心动力。
目录
* 面对 AI 自动化的焦虑与重塑目标的意义 * 寻找长尾问题与差异化价值 * 文化差异与 AI 产品的本地化 * 人机交互方式与人类协作的演进 * AI 与真实环境的交互及护栏建设 * 为什么我们依然要坚持构建
面对 AI 自动化的焦虑与重塑目标的意义
现场有谁认为自己的工作在未来 5 年内不会被 AI 自动化?哇,你们是做什么的?我该怎么得到那份工作?那么,又有谁认为自己的工作会在未来 5 年内被自动化?好的。剩下的人呢?你们是没工作还是怎么回事?[现场笑声]
昨天我刚好抛出了这个问题,只是好奇网友们会怎么想。似乎很多人都觉得工作将会被自动化。所以不要绝望,我原本是想在一个非常振奋人心的氛围中结束这次演讲的。最近我发布了一个小型的业余项目,我自己挺满意的,也吸引了一些关注。大概一周的时间就获得了 300,000 次浏览量。但就在发布的一天内,我收到了一封邮件,对方说:「嘿,我非常喜欢你做的东西。所以我用 Clico 完美复刻了它,这是链接。」我当时的反应是,虽然感到受宠若惊,但也有些不知所措。
这件事让我意识到,任何已经存在的东西都可以被复制。这让我感觉很奇妙,因为我总是在兴奋和绝望之间反复横跳。一方面,我觉得现在我可以构建任何我想要的东西;但另一方面,任何人也都可以构建出我想要的东西。那么,我继续做这些事情的动机究竟是什么呢?
我已经停止使用很多我称之为「轻量级 SaaS」的产品了。有些产品只是解决了一个非常小的问题,却向我收取高昂的费用。比如每个席位每月要 50 美元。我觉得既然我可以用 AI 完美复刻这些功能,为什么还要继续付费呢?当然,有人会反驳说情况不完全一样,有些东西是很难构建的。你不可能指望 AI 在一天之内就建出一个 Google。这当然需要更长的时间。
但我同时也注意到,AI 正在随着时间的推移变得越来越强大。也许它今天无法在一天内复刻 Google,但随着时间的推移,也许它就能做到。有研究表明,AI 能够完成的复杂任务正在呈指数级增长。今天 AI 能做的事情,已经远远超出了我一年前,甚至 3 年前对它的想象。所以,也许这只是个时间问题。
过去人们常对我说,商业世界里存在着不同的护城河,比如数据就是一种护城河。但事实证明,数据并不是护城河,它只是一种昂贵的资源。大家已经看到,人们复刻类似的产品有多么容易。如果有人只要砸钱获取数据就能构建出同样的东西,那这到底算什么护城河?我为什么还要继续构建呢?
有时候,我把这称为软件行业的「吉卜力时刻」。几年前,当大家发现可以用 AI 生成任意风格的图片时,吉卜力工作室的风格突然成为了大家的最爱。就在那个时候我意识到,只要你能描述出一种风格,AI 就能把它生成出来。软件领域也是同理,只要你能描述出一个软件的形态,AI 就能为你把它构建出来。你在外面发布的东西越多,就越不需要人们去发挥想象力。你可以直接说:「我喜欢那个网站,给我照着做一个。」
这是一种非常奇妙的体验。所以我想和大家探讨的问题是:如果我们在极短的时间内构建的任何东西都可以被轻易复制,我们为什么还要继续构建?我很想听听大家的想法。
[现场观众回答指出是因为学习的过程]
学习过程,这很好。还有吗?
[现场观众回答说有使命感并且感觉很棒]
使命感,即使我不做也会有别人去做,这会不会让你觉得自己的工作不再被需要了?感觉很棒,对吧?你抢了我的台词,这原本应该是我演讲结尾要说的话。[现场笑声]
但我确实认为,让我想要继续构建的一个重要原因,是我想要解决问题。你创造一个产品,它并不是存在于真空中的。你构建的产品就是你在解决问题。你这样做练得越多,解决问题的能力就越强。而且我坚信有一点永远不会改变:世界上永远都会有需要解决的问题。我不认为 AI 会瞬间让我变成一个快乐的人,也不认为它会神奇地让我不再对客户支持人员感到恼火。这些问题不会凭空消失。
寻找长尾问题与差异化价值
当我审视这个充满问题的世界时,我相信问题是符合长尾分布的。根据 AI 的训练方式,它会非常擅长处理它见过很多次的事情。我把这些看作是长尾分布头部的问题,也就是很多人都会经历的常见问题,AI 会在这些方面变得非常出色。随着时间的推移,AI 会覆盖越来越多的边缘情况,但这些边缘情况永远不会完全消失。有很多事情我都认为属于长尾问题。
顺便问一下,这里有谁对预测市场感兴趣?比如博彩,这种事情永远不会消失。
我之前写过一个用于交易的机器人程序。我的一些朋友甚至惊讶于我直到人生的这个阶段才开始涉足交易领域。他们觉得如果你喜欢工程和数学,在 20 多岁的某个阶段你肯定会接触交易。当我深入交易领域后我发现,市场越大、交易量越高,它就越有效率。如果你进入体育预测领域,你几乎不可能竞争过所有的体育交易公司。你也不能去跟对冲基金竞争。因为当一个市场变得足够大时,那些拥有巨额资金和顶尖投资人的机构就会涌入。
所以我发现,甜蜜点在于那些足够大、能带来一些利润,但又没有大到吸引那些大鳄的市场。我认为这与我想要解决的问题是一样的逻辑。如果这是一个所有人都能看到的巨大问题,那么只有大公司才会涉足。但世界上存在着大量更小的问题,也许 OpenAI 并没有动力去解决它们,但我可以,很多人都可以。
这些问题到底长什么样呢?我认为人类的偏好就是其中之一。我不认为人类偏好只是一个可以被完美打包的方程式。你不可能简单地问别人:「这两个答案你更喜欢哪一个?」这完全是非常个人化、受文化、地理位置和年龄影响的。
文化差异与 AI 产品的本地化
我来自越南。最近我回了一趟越南,和当地一些做 AI 的人交流,我发现了一个非常有趣的现象。在美国,当很多公司部署客户支持聊天机器人或智能体时,他们通常会优先选择文本路线。文本相对容易,之后他们才会开发语音机器人,因为语音的复杂度要高得多。你不能仅仅是文本输入和输出,你首先需要将语音转写成文本,然后将用户的文本问题输入到 LLM 中,获取答案后再合成语音反馈给用户。这复杂得多,所以在这里大家先做文本是很自然的。
但在越南以及很多其他亚洲国家,人们经常处于移动状态。他们经常骑着摩托车,所以真的不喜欢打字。因此,很多越南公司在推出文本聊天机器人之前,实际上已经先部署了语音机器人。我和他们交流后发现,这里面有很多文化上的细微差别,比如响应时间。
我有一个年纪很小的侄子和侄女,我在这里也有年纪大得多的教父母。有一次我把他们拉到了同一个通话里。当你让一个 60 岁的美国老人和 10 岁的越南小孩通电话时,那简直是一场灾难。我的教母为了避免尴尬,就不停地说话。当她问了一个问题而对方没有回答时,她就会继续问很多问题,试图让对话进行下去。
事后我告诉她,有研究表明,在美国,人们期望得到即时回应。当你说完一句话时,人们只给对方 80 毫秒的时间来回应,否则你就会继续说。但在亚洲文化中,出于尊重,我们实际上会等待更长的时间,大概是 200 到 300 毫秒,以确保对方真的说完了。所以如果你为了消除尴尬而不停地抛出问题,只会让场面变得更加尴尬,因为对方会觉得根本插不上话。
语音机器人也是同样的道理。在语音交互中,你需要平衡延迟和人性化的体验。你需要等待人类说完,但如果等得太久,反应就会显得太慢。因为你还需要进行解析和生成的处理过程。要解决这些问题非常困难,你必须理解所有这些细微的差别。我举的这些例子只是一些非常明显的文化差异,但只有当我们深入到特定的应用场景和我们所针对的特定人群时,我们才能理解更多深层次的东西。
人机交互方式与人类协作的演进
我认为另一个非常重要的事情是人类与 AI 的交互方式。我们仍在试图想象一个由 AI 驱动的世界到底是什么样子。人们似乎正试图改造现有的工具,以适应他们想象中的新工作流。
以 IDE 和终端为例。这里有多少人写代码时经常使用终端?有多少人是因为需要写代码才开始使用终端的?我想你们大多数都是工程师。我有很多做产品经理的朋友,他们以前从未用过终端。但现在因为 AI 的出现,他们突然发现自己必须要学着用这个了。这其实很糟糕,因为在终端里你没法随意复制粘贴,也不能直接上传文件,使用体验非常烦人。但人们还是在用,因为这是我们目前仅有的工具。
于是大家开始思考:我们能有一个不同的终端吗?为什么终端和 VS Code 之间会有这么明显的界限?当它们都在接收指令并生成代码或产品时,两者在本质上到底有什么区别?我认为这些都是我们仍在不断探索的问题。
另一件非常重要的事情是人与人之间的协作。AI 在为个体解决问题方面变得越来越强大,但为了构建真正有意义的东西,我们依然需要合作。而现在,有了 AI 的介入,人与人之间的协作变得非常复杂。
举个例子,大家都经常使用 GitHub,并通过 PR 与团队协作。那么,现在还有谁会逐行审查每一个 PR 吗?
原本,PR 的机制旨在为人与人之间的协作设定护栏——让同事审查你的工作,确保其符合标准后才进行合并。最近我和一个团队交流,团队里一位非常资深的成员告诉我,他仍然在逐行审查代码。他不是在逐行审查自己 AI 生成的代码,而是在逐行审查他的团队成员用 AI 生成的代码。他说这不仅仅是为了控制代码质量,更是为了教育。他是在指导团队,提供反馈以便他们能不断进步。
然后我问他的团队成员是否会看他的反馈。他们说不看。原因是这些反馈缺乏可操作性。因为写代码的并不是这些初级成员。如果你对他们说「不要这样写代码,要那样写」,他们会觉得很无奈,因为代码根本不是他们写的,他们也不知道该如何把这个反馈提供给 AI,让它以后按要求写。
我认为目前审查代码的工作流已经非常过时了。资深成员不应该把时间花在对代码本身提供反馈上,而应该去指导团队成员如何向 AI 下达更准确的指令,从而产出更好的结果。这只是一个例子,说明人与人之间的协作方式将会发生多么巨大的改变。
AI 与真实环境的交互及护栏建设
同样令人兴奋的是 AI 与环境的交互。目前,我们主要是在电脑上与 AI 互动。我们正在赋予 AI 越来越高的权限去接触不同的事物。首先是在 IDE 里的代码,然后是终端。
终端权限已经开始变得有些危险了。就在两天前,AI 删除了我本地的 PostgreSQL 数据库。原因是它试图创建一个新的应用,而我本地已经跑着另一个数据库实例了。它发现端口被占用,就自作主张把它给删了。这真的很可怕。幸运的是,我有个本地备份,所以最后没事。
这件事让我开始思考,目前 AI 运行的很多环境都是可逆的,是可以回滚的。比如代码写错了,你可以回退到上一个提交记录。数据库出错了,你可以恢复到之前的备份。但是,世界上存在着大量无法由我们撤销的操作环境。假设我们有一个智能体,它去一个网站帮我们填写表单并点击了提交。作为用户,我们无法撤销这个操作,因为数据已经到了别人的服务器上。如果我们赋予 AI 更多在数字世界之外、在真实世界中的权限呢?比如一辆车撞到了行人,你是无法撤销这种行为的。所以我坚信,我们需要为不可逆的操作建立起一套完整的护栏,因为那才是事情真正变得可怕的地方。
AI 与环境的交互是一条双向车道。一方面,有很多基础模型实验室正在努力让模型更好地与真实世界互动;但另一方面,又有谁在努力让这个世界变得对智能体更加友好呢?
比如,即使我写书,并且多希望书籍这种格式能永远存续,但我必须承认,人们读书的方式已经变了。如果有人告诉我他原封不动地看完了我的书,我肯定觉得他在撒谎,读者多半是跳着看的。世界在改变,我们需要创造出对智能体更友好的内容格式。
再比如,现在的很多网站和数字世界都是受到速率限制控制的。在很多情况下这很合理,因为人类的处理速度没有那么快。但现在,AI 与 AI 之间的交互速度可以极快。因此,速率限制这个概念对于 AI 来说变得有些无关紧要,甚至成为了瓶颈。
还有关于搜索的概念。最近我花了很多时间研究 AI 是如何进行网页搜索的,结果让我很困惑。我对 Groq、Gemini、Claude 和 GPT 等模型进行了网页搜索的基准测试。输入一个查询请求后,我发现其中一些模型竟然访问了 900 到 1000 个 URL,这简直是在疯狂燃烧我的账户额度。
然后我仔细看了一下,这 1000 个 URL 中到底有多少是独立的?结果发现只有 20 个。AI 只是在不断地重复访问这些链接。我觉得这太蠢了。后来我明白了原因:它先访问一个链接,提取出相关的引用部分,然后进行下一次查询,再寻找相关的部分。这其实是一种非常「人类」的网页搜索方式。因为我们在 Google 输入搜索词后,也会看各种引用和片段。
但是,我们为什么要以此来限制 AI 呢?如果 AI 访问了一个页面,为什么不直接把整个页面的内容全部拉取出来?为什么要一遍又一遍地重复这个过程?我觉得这对我来说有点蠢,当然,开发这些系统的人肯定比我聪明,但我依然觉得这种心智模型似乎有些不对劲。肯定有比这种「以人类为中心」的方式更高效的「以 AI 为中心」的方法,我希望有人能去实现它。
为什么我们依然要坚持构建
现在的问题已经不再是「如何构建」了。只要你能描述出你想解决的问题和你想要的方案,AI 通常都能帮你实现。也许今天还不行,但两三年后肯定没问题。现在真正的问题变成了「构建什么」。
我们一直在说,只要是已经存在的东西,AI 就能复制。但对于那些还不存在的东西,谁去构建呢?谁去想象它们?我们是希望 AI 直接创造解决方案、规划人类未来的生活方式,还是由我们自己来提出构想,决定我们到底想要构建什么?
回到我们之前讨论的话题:既然一切都能被复制,我为什么还要继续构建?我认为归根结底,是因为我享受构建的过程,它能给我带来纯粹的快乐。我希望我们能把「为了乐趣而构建」变成一种常态。以前,我会把大量的精力花在准备工作上,只是为了能够开始构建。但现在,这一切变得太有趣、太简单了,我可以做的事情比以前多得多。
如果你回顾一下人类工业发展的历史,早期的衣服都是手工制作的。后来有了大规模生产的服装,这很棒,因为人们可以买到便宜的衣服,快时尚开始普及。但当人们拥有了更多的可支配收入时,他们就开始想:「其实我不想要大规模生产的东西,我想要专门为我定制的。」
我不确定在软件领域是否也会出现类似「手工艺人」的未来。我不知道人们是否会因为某个 App 是纯手工打造的,就比其他 App 更喜欢它。我们可能不会走到那一步,但至少目前,我非常享受为朋友构建 App 并将其作为礼物的过程。比如,我不会买传统的生日礼物,而是会花一个周末给他们写个专属的 App。如果他们喜欢喝茶,我就给他们写一个喝茶打卡的 App。这非常简单,但也充满了乐趣。
所以我依然享受构建的乐趣。至少在目前,AI 确实让我的生活变得更快乐了——除了偶尔我感到非常沮丧、不知道为什么还要继续构建的时候。但我想,我们终究会弄明白这个问题的。
非常感谢大家,这就是我的演讲。