在 Reddit AMA中,OpenAI 首席执行官萨姆·奥特曼承认,计算能力不足是阻碍公司频繁推出产品的一个主要因素。
“所有这些模型变得相当复杂,”他在回应关于为什么 OpenAI 的下一个 AI 模型需要这么长时间的问题时写道。“我们还面临许多限制和艰难的决定,关于我们如何将计算资源分配给许多伟大的想法。”
部分原因是产能紧张,奥特曼表示,OpenAI 的 ChatGPT 的逼真对话功能高级语音模式,不会很快获得在四月首次透露的视觉能力。在四月的新闻发布会上,OpenAI 展示 了在智能手机上运行的 ChatGPT 应用,并根据手机摄像头视野内的视觉线索(例如某人穿着的衣服)作出回应。
报告来自《财富》的消息后来透露,演示是匆忙进行的,以转移人们对谷歌 I/O 开发者大会的注意,该大会在同一周举行。OpenAI 内部的许多人认为 GPT-4o 还没有准备好被揭示——值得注意的是,先进语音模式的仅语音版本被推迟了几个月。
在 AMA 中,奥特曼表示,OpenAI 的图像生成器DALL-E的下一个重大版本没有发布时间表。(“我们还没有发布计划,”他说。)与此同时,OpenAI 的视频生成工具Sora因“需要完善模型、确保安全/防止冒充/其他事项,以及扩展计算能力”而被推迟,OpenAI 的首席产品官凯文·韦尔在参与 AMA 时写道。
Sora reportedly 遭遇了技术上的挫折,使其在与 Luma、Runway 等竞争系统的对比中处于劣势。根据《信息》报道,原始系统在 2 月份揭示,制作一个 1 分钟的视频剪辑需要超过 10 分钟的处理时间。
在十月,Sora 的联合负责人之一,Tim Brooks,离开了谷歌。
在 AMA 的后期,奥特曼表示,OpenAI 仍在考虑在 ChatGPT 中“某天”允许“NSFW”内容(“我们完全相信以成人的方式对待成年用户,”他写道),并且公司的首要任务是改进其o1系列“推理”模型及其后续版本。OpenAI 预览了本周在伦敦的 DevDay 会议上即将推出的多个 o1 功能,包括图像理解。
“我们今年晚些时候会有一些非常好的发布,”奥特曼写道。“不过我们不会称之为 GPT-5。”
本文翻译自:https://techcrunch.com/2024/10/31/openai-ceo-sam-altman-says-lack-of-compute-is-delaying-the-companys-products/
编译:ChatGPT