ChatGPT 诞生内幕最新大曝光:
纳尼??原来 "ChatGPT" 这个名字,直到发布前一晚才确定下来。
而且当时 OpenAI 非常犹豫要不要发这个模型,因为据称 Ilya 十次测试该模型,但仅有约一半的回答被团队认可。
不过发布后,ChatGPT 简直一炮而红——
第 1 天数据出来后,团队开始怀疑 " 是不是搞错了 ";第 2 天,网上的讨论进一步扩大;才到了第 3 天,团队就意识到这个模型真 · 火了;并且进入第 4 天,他们意识到 ChatGPT 将改变世界。
以上消息均来自 OpenAI 最新播客,爆料人分别为 Mark Chen(中间,OpenAI 首席研究官)和 Nick Turley(左一,ChatGPT 负责人),都是在 OpenAI 工作多年的一线负责人。
除了大谈特谈 ChatGPT 崛起之路,他们还分享了 OpenAI 在图像生成以及代码方面的历史进程,并且还总结了 OpenAI 的产品开发哲学……
虽然节目整整有 1 小时,但正如网友所言,整个节奏恰到好处,他们以引人入胜的方式为大家展现了 ChatGPT 以及 OpenAI鲜为人知的一面。
一起来看看,这帮 " 书呆子 " 是如何改变世界的吧。
发布前一晚才确定用 "ChatGPT" 命名
ChatGPT 的命名过程相当戏剧性,最早它被叫做"Chat with GPT-3.5"。
对,没错,就是这个非常拗口的名字差点名扬天下。
还好发布前一晚,Nick Turley 他们冥思苦想,才改成了今天的——"ChatGPT"。
不过早期他们内部对 ChatGPT 也信心不足,毕竟底层模型 GPT-3.5 已经发布了几个月,能力上也只是增加了用户界面以及简化了交互。
Ilya还曾在 ChatGPT 发布前一晚向它提出了 10 个刁钻难题,但只有 5 个答案得以通过,所以其实他们连到底要不要发布都存在争议。
但没想到的是,它居然火了,还火得一塌糊涂……
据 Nick Turley 回忆,ChatGPT 刚发布的那段时间相当混乱,所有人都以为是不是出了故障,怀疑它的爆火只是昙花一现,奥特曼还曾私下调侃道:
虽然看着它走红很是令人兴奋,但互联网终归是互联网,总会降温下去。
结果这次真的不一样。后来的事相信大家也都清楚,媒体、社交平台,到处都被这场 ChatGPT 飓风席卷,直到今天也依旧火爆。
但估计很多朋友现在都还不知道 GPT 代表什么,Mark Chen 也是当场揭秘,表示是"Generative Pre-trained Transformer"(生成式预训练 Transformer)。
随着 ChatGPT 的一路走红,研究人员反而陷入困扰,面对 GPU 短缺、数据库连接耗尽、服务商速率限制导致的系统宕机,他们创建了 "fail whale" 页面,通过生成一首由 GPT-3 完成的诗歌自我调侃,提醒用户:我们宕机了!
经常宕机的情况并没有持续多久,OpenAI 开始积极根据用户反馈改进 ChatGPT,主要是通过RLHF(使用人类反馈的强化学习),当用户为对话提供积极反馈时,模型会训练自己生成更迎合用户的响应。
这导致模型早期为了取悦用户过于谄媚,OpenAI 也随即发现了这个问题并及时进行了处理。
Nick Turley 表示,ChatGPT 作为一个实用产品,长期的优化目标并不在用户的使用时长上,而是用户的长期留存率,这也是他们构建产品的核心机制。
此外他也观察到,越来越多人,尤其是 Z 世代在逐渐将 ChatGPT 视作 " 思想伙伴 ",因此未来 OpenAI 也将积极检测相关情况,确保模型行为得当。
在记忆用户大量信息的同时,OpenAI 也将会更注重提供" 临时聊天 "等隐私保护功能。
图像生成:另一个迷你 ChatGPT 时刻
而除了 ChatGPT,OpenAI 的图像生成技术(ImageGen)也曾一度走红。
Mark Chen 坦言,这又是一个出乎他意料的东西。
按他的说法,ImageGen 验证了团队之前的一个论点——当模型能一次性生成完美符合用户提示的图像时,所创造的价值将难以衡量。
因为从用户角度而言,人们不想从一堆图像中挑选最好的,而是需要出色的提示遵循能力和强大的上下文编辑等功能。
而从 2021 年 1 月起,OpenAI 就开始推出了一直以来大名鼎鼎的 "DALL · E" 系列:
2021 年 1 月,发布图像生成模型初始版本 DALL · E;
2022 年 4 月,DALL-E 2 问世;
2023 年 10 月,DALL-E 3 推出,并直接集成到了 ChatGPT 当中。
在 Nick Turley 的描述中,这些关于 ImageGen 的体验就像另一个迷你 ChatGPT 时刻。
尽管内部已经觉得它很酷,但只有发布后才真正感受到了世界如何为之疯狂。
他举例说,仅在一个周末,就有 5% 的印度网民尝试了 ImageGen 工具," 这让我们接触到了此前从未预料会使用 ChatGPT 的新用户 "。
并且他还预测,其他模态(如语音和视频)也会有类似的魔法时刻——当它们达到用户预期时,不仅会改变人们的生活,而且会进一步扩大 ChatGPT 的影响力。
有意思的是,他们还透露了一个非常 " 反直觉 " 的现象。
比如对于 ChatGPT,团队预期它会是一个纯粹的实用产品,但实际上人们经常拿来娱乐;而对于 ImageGen,本来以为人们会拿来搞搞表情包娱乐一下,结果大部分都是用于实际工作生活,如制作 ppt 插图或家居设计。
与此同时,他们还聊到了 DALL-E 一开始对生成人物肖像的限制。
Nick Turley 回忆自己刚加入 OpenAI 时,团队其实对于应该向用户提供哪些功能相对保守,毕竟当时这项技术还比较新。
但随着时间推移,他们认识到,当对模型施加武断的限制时,实际上会阻碍许多效果比较好的用法。
就拿生成人物肖像来说,当他们首次在 ChatGPT 推出图像上传功能时,还曾考虑要不要对图片进行模糊处理,从而避免人们基于肖像进行推断或说一些刻薄之言。
不过为了追求自由,他们逐渐摒弃了默认禁止这一做法。
总之,Nick Turley 认为,有原则地审视不同类型、时间尺度和风险等级的安全问题是十分必要的。
而且在某些涉及 AI 安全的场景下,从最坏的结果出发进行考虑是非常恰当的。
OpenAI 鼓励员工使用编程工具
谈及 AI 近几年在代码生成领域的发展,从 GPT-3 生成 React 组件,到专门训练的模型如 Codex 和 Code Interpreter,再到与 Copilot 等工具的整合。
Mark Chen 认为," 编码 " 其实相当广泛,包括 IDE 中的实时代码补全以及 "Agentic" 风格的代码生成等不同类型,OpenAI 目前在后者投入了许多。
ChatGPT 是实时响应模型,输入提示,就立马给出答案,而Agentic 编码是指模型接受一个复杂的任务后,将在后台长时间处理,最终返回一个接近最佳答案的结果。
Codex 就反映了这种范式,相比快速回答,他们更希望模型会花时间思考推理,这也将是代码领域的未来发展趋势。
此外面对代码领域激烈的市场竞争,Nick Turley 则相当欢迎,他表示开发者将会在星罗棋布的产品中获得最佳助力。
不过写代码容易,写好代码,却并不容易。
如何保障代码的正确性,如何构建组织内部的软件、编写好的测试和文档,如何处理代码分歧等,这些都是 AI 模型未来需要集中学习的 " 品位 " 和 " 风格 " 元素。
此外,OpenAI 专注构建通用技术,像 Codex,虽然当前定位是专业的软件工程师,但考虑到其他用户的使用需求,未来他们将继续迭代优化,希望能降低编程门槛,让人人得以软件开发。
关于 OpenAI 内部如何使用这些工具,Nick Turley 表示,他们的工程师使用 Codex 分担测试任务,分析师会使用它来自动标记日志错误,也有员工用它来规划未来的待办事项。
OpenAI 鼓励员工使用编程工具,帮助提高生产力的同时,可以预测产品的未来走向。他们不会将自己不认可的产品推向市场,内部使用是一个预先检验,能让他们及时了解到人们适应新工作流程所需的时间。
OpenAI 内部:好奇心比博士学历更重要
节目最后,他们还谈到了 OpenAI 的内部文化以及一些个人预测。
原来在 OpenAI 招聘时,相比是否拥有 AI 博士学位,他们更看重候选人是否拥有强烈好奇心。
Nick Turley 强调,在这样一个快速变化的世界中,不断学习和探索新知至关重要。
尤其对 OpenAI 产品团队而言,好奇心是判断最终能否成功的最佳指标。
AI 领域有太多未知的东西。员工需要保持谦逊,因为在真正深入研究和尝试理解之前,你无法得知什么是有价值的,什么又是存在风险的,唯有强烈的好奇心能驱使人们不断学习和探索。
并且他还提醒,真正的瓶颈在于能够提出正确的问题,而不是简单地获取答案。
说到这里,Mark Chen 还补充了行动力和适应能力的重要性。
前者意味着员工能主动发现并解决问题(而不是被告知要做什么),后者意味着员工需要快速判断什么重要并调整方向。
总之在 Nick Turley 看来,OpenAI 之所以能快速推出产品,正是因为公司里有如此多具备行动力、能够真正 " 交付 "(ship)产品的人,并且公司内部的繁文缛节很少。
与此同时,随着 OpenAI 的规模从最初的 150-200 人增长至约 2000 人,他们还通过独立项目精简人员配置、定期举办黑客马拉松保持文化和精神。
聊完招聘,接下来他们二人还对未来进行了一波预测 ~
Mark Chen 表示,在未来 12~18 个月内,最大的惊喜无疑是 AI 所展现出的 " 推理能力 ",这种能力符合他们之前讨论的 "Agentic 范式 ",且目前已经能看到它在数学、科学和编程领域取得了巨大进展。
而 Nick Turley 则认为,下一步重点在于解决 " 智力受限 " 的问题。
任何 " 描述清晰且受限于智力 " 的问题都将通过产品得到解决。
举个例子,对企业来说,目前模型还无法解决一些本质上很难的问题(如软件工程、数据分析、卓越的客户支持),但实际上这些问题很容易描述和评估。
对消费者也同样,许多个人生活中相对麻烦的事情(如报税、旅行规划、购买高价值商品),所有这些问题都需要 " 多一点智能 " 和 " 合适的表现形式 "。
并且 Nick Turley 预测,在未来一年半内,AI 将出现新的 " 交互形式 "。
聊天模式仍将非常有用,但会越来越多地出现" 异步工作流 "(asynchronous workflows)。
所谓 " 异步工作流 " 是指,用户只需将任务发送给 AI,让其在后台长时间处理即可。
他认为,这将改变人们对 AI 的看法,使其不再仅仅是一个聊天机器人。
最后的最后,对于我们普通人该如何应对正在狂飙突进的 AI,二位的观点倒是不谋而合——多用。
Mark Chen 认为,最重要的是人们必须积极投入并使用这项技术;Nick Turley 也强调,亲自使用 AI 是消除恐惧和误解的最佳方式。
One More Thing
就在以上节目播出后,OpenAI 推文底下最高赞却是:
啥时候发布 GPT-5?(催更虽迟但到)
网友们也不是空穴来风,毕竟 CEO 奥特曼几天前还在公开场合透露:
OpenAI 计划发布一个非常强大的开源模型。
它能够让人们在本地运行极其强大的模型,重新认识 " 本地部署 " 的可能性。
而且此前他也多次表示,OpenAI 将在今年夏天推出新模型(虽然一推再推)。
不过有一说一,虽然 Flag 已经立好了,但 OpenAI 最近的日子恐怕不太好过。
这不,面对 Meta 小扎疯狂挖人(几周内连挖 8 名关键研究员),OpenAI 内部目前实际上处于短暂停摆状态——
最近一周基本停工,员工放假一周(高管继续工作)。
所以这 GPT-5 怕是又难咯 ~
参考链接:
[ 1 ] https://www.youtube.com/watch?v=atXyXP3yYZ4
[ 2 ] https://x.com/OpenAI/status/1940063220456464880
[ 3 ] https://transcripted.ai/episode/insidechatgptaiassistantsandbuildingatopenaitheopenaipodcastep2
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题 扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~
进群后,你将直接获得:
最新最专业的 AI 产品信息及分析
不定期发放的热门产品内测码
内部专属内容与专业讨论
点亮星标
科技前沿进展每日见
登录后才可以发布评论哦
打开小程序可以发布评论哦