从一场“意外诞生”的聊天机器人,到一场席卷全球的人工智能(AI)革命,OpenAI 的每一步都踩在技术与商业的锋刃之上。
近日,在与科技分析师、作家 Ben Thompson 进行的深度对话中,OpenAI 首席执行官 Sam Altman 罕见地袒露了公司的野心与困惑 :
为何一家以研究为初衷的非营利实验室,最终成为拥有亿级用户的消费科技巨头?当 ChatGPT 的疯狂传播超出所有人预期,OpenAI 如何在技术理想与商业现实中找到平衡?
从 GPT-5 的免费开放计划,到对开源战略的暧昧暗示,再到与微软的竞合博弈,Altman 的每一个回答都“暗藏玄机” 。
“Deepseek 的模型能力并不是他们疯狂传播的关键……这让我重新思考免费层级的内容设置,届时免费用户将能使用 GPT-5。”
Altman 认为, DeepSeek 等竞争对手的出现,部分原因是 OpenAI (主动)隐藏了一些功能,为其他产品留下了市场空间 。OpenAI 从中吸取教训,重新思考免费层级提供的内容。
此外,他希望未来 ChatGPT 能够成为少数几个拥有数 「十亿用户」 的产品,用户可以使用 OpenAI 账户登录其他集成 API 的服务,形成一个强大的平台生态系统。
他还认为,AI 将逐步向智能体(agent)方向发展,成为未来 AI 应用的关键 。
学术头条在不改变原文大意的情况下,对整体内容做了精编,节选了关于「竞赛」、「人工智能的展望」、「通往 OpenAI 的道路」、「ChatGPT 的起源故事」等内容。
来自对手的竞赛
不久前,Deepseek 迅速传播,引发了 Altman 对 OpenAI 的重新思考。
“Deepseek 推出了免费前沿模型,并展示了思维链(CoT),人们会觉得‘哇,AI 真的在试图帮助我!’”
有人认为,人们之所以不为美国公司狂欢,其背后可能隐藏着对 OpenAI 的反感情绪,但 Altman 并不这么认为。他认为 Deepseek 的成功归功于两件事——免费提供前沿模型,以及他们展示了思维链。
面对 DeepSeek 这样的竞争者,OpenAI 也开始重新思考是否应该让自己的模型免费开放。 “我认为我们应该这么做” ,Altman 说。
早期,OpenAI 对 AI 发布持相对保守的态度,担心潜在风险。但如今,AI 的发展势不可挡,Altman 意识到 AI 无论如何都会扩散, 过度控制已无太大意义 。
另一个值得关注的竞争对手是 Grok。一些用户表示他们更喜欢 Grok,因为它不会随机“教训”用户,而是更加自由化。Altman 也承认,ChatGPT 过去在内容审查上可能有些过度,但他们已经改善很久了。
关于 AI 的未来
“个人电脑的第一波浪潮是那些真正想使用个人电脑的人”,主持人 Ben 谈道,要让诸如电脑这类新科技成为大众生活的默认工具,需要一代人的转变,慢慢渗透到各个领域。
Altman 认为,这种早期局限性其实是其他科技发展的常态,虽然目前 AI 的应用可能也仅限于那些迫切需要或有能力尝试新技术的人,但 这只是阶段性现象 。
现在的 AI 发展让 AGI(通用人工智能)的定义变得模糊,“ 我认为 AGI 这个术语已经完全贬值了 。”但他并没有明确区分 AGI 和 ASI,而是认为 AGI 本身可能是一个渐进的过程,并不一定是某个清晰的单一目标。
“我认为模型还不够智能。”Altman 认为,基于 transformer 架构难以创造出新的事物,它仅仅能输出互联网上的中等水平的内容。
目前 AI 在许多公司已经能够自动完成 50% 以上的代码编写工作,但“代理编码(Agentic Coding)”尚未实现。在 Altman 看来,主要问题在于模型能力,而非产品设计。
agent 是能够自主运行,为你完成实际工作内容的程序。Altman 认为 AI 将逐步向 agent 方向发展,成为未来 AI 应用的关键, agent 将逐步承担更多任务,影响社会和经济结构,人们可能需要重新定义“智能”与“自动化”的界限 。
“我的基本假设是,每个软件工程师在一段时间内会做更多的事情。然后到了某个时候,也许我们确实需要更少的软件工程师。”
再谈早期 OpenAI
在创立 OpenAI 之前,Altman 经过了 从一名技术爱好者,到创业者、投资人、科研人的多重身份转变 ,最终推动 OpenAI 迈向全球领先的 AI 公司。
“我一直是个疯狂的极客。” Altman 很小便对计算机产生浓厚兴趣,热衷于编程、数学和科幻小说。
从斯坦福大学辍学后,他在 19 岁时创办了 Loopt,一家社交定位的初创公司。运行七年后,Loopt 被以 4340 万美元的价格收购,而这个出售价格几乎接近于 Loopt 的累计融资额,可以说 这并不是一个成功的创业经历,但为 Altman 积累了创业经验 。
此后,他接管了知名创业孵化公司 YC Combinator(YC)。在担任 YC 总裁期间,Altman 帮助孵化了许多知名的科技公司,比如 Airbnb、Reddit。
早期的 OpenAI 仅是 YC 旗下多个研究项目之一,并未设想其商业化潜力,目标是推动“对人类有益的、广泛分布的 AI”,建立一个非营利的 AI 研究实验室。
“ 现在回想起来,我完全后悔发布 GPT-2 时,我们使用的一些言辞 。”2019 年对 OpenAI 而言意义重大,这一年,OpenAI 发布了GPT-2,但却未立即开源,引发了外界的质疑和猜测。Altman 强调这并非他们的本意,做出那些决策的人出发点是好的,只是现在理解了为什么会被误解。
他还创建营利结构并接受微软投资,这些举动似乎与 OpenAI 最初强调的非营利、开放的愿景相悖。
对于从微软等进行融资这件事,他解释是因为发现确实需要扩大规模,而且已经弄清楚了 scaling laws,所以必须找到一个合适的结构来实现大规模发展。
“如果最初我能预见到现在的情况,我会在是否做非营利组织上,做出不一样的选择。”
把名字改成「ChatGPT」
“这听起来现在很荒谬,但 GPT-3 最成功的应用居然是文案写作,只有这一类用户真正建立了可行的商业模式。”
最初,OpenAI 只是推出了 GPT-3 的 API,发现它在文案写作领域找到了市场契合点,但整体表现并不算特别惊艳。当时,AI 主要是开发者在使用,普通用户接触较少。
在 GPT-3 时代,团队内部曾多次讨论过打造聊天机器人 ,但一直觉得技术还不够强大,无法提供真正自然的对话体验。“我们很早就在考虑做一个聊天机器人,甚至在 API 之前就有这个想法,只是当时觉得模型还不够好。”
“我们在(当年)8 月完成了 GPT-4 的训练,我们知道这是一项奇迹。” GPT-4 的出现让他们看到 AI 在日常对话中的巨大潜力,推动了 ChatGPT 计划的加速实施。
但是团队内部对发布时机存在分歧,有人认为 GPT-3.5 的效果可能无法吸引用户,但最终 Altman 还是决定先用 GPT-3.5 进行测试,推迟 GPT-4 的发布。 “他们本来要叫‘Chat with GPT-3.5’,我当时立刻说:‘绝对不行!’”于是临时决定将名字改为“ChatGPT”。
产品发布后,ChatGPT 迅速引爆市场。由于 ChatGPT-3.5 已经引发病毒式传播,Altman 认为,如果当时直接发布 GPT-4,可能会导致更难以控制的爆炸性增长。
“6 个月内,我们从几乎不存在的公司,变成了一家真正的大公司。”
One more thing
此外,Altman 还对即将毕业的高中生给出了一些职业建议。
他表示, 首先要做的事就是要熟练掌握 AI 工具 。“就像我高中毕业时,显而易见的建议是熟练掌握编程。而现在的 AI 是一个新的(必备技能)。”
他还建议,人们可以培养韧性和适应能力,以及弄清楚别人想要什么以及如何对他人有用。
“无论你学什么,细节可能并不那么重要......就像我在学校学到的最有价值的东西是学习能力,而不是任何具体的东西。所以...... 学习那些随着世界经历这种转变而显得重要的通用技能 。”
作者:锦鲤