滚动资讯

当前位置：财经 > 信息流 > 正文内容

OpenAI o3推理模型面世，能否打破“画饼”质疑领跑AI赛道？

时间：2024-12-23 12:13:59 来源：蓝鲸新闻作者：ITBEAR编辑：快讯团队 发表评论无障碍通道

在科技界万众瞩目的“双十二”尾声，OpenAI于12月20日悄然发布了其最新的o3推理模型，此举紧随谷歌前一天发布的推理模型，似乎是在向业界宣告其技术领先地位依旧稳固。o3作为9月推出的o1模型的升级版，命名上巧妙地避开了与英国电信运营商O2的潜在版权或商标冲突，直接跳跃至o3。

OpenAI介绍称，o3模型在复杂任务推理方面表现出色，尤其在科学、编码和数学等领域，相较于前代o1模型有了显著提升，尽管这伴随着处理时间的延长。以高级数学推理测试EpochAI Frontier Math为例，o3模型创造了25%的准确率纪录，而此前所有模型的准确率均未达到2%。

在迈向通用人工智能（AGI）的征途中，o3模型为OpenAI增添了一份底气。在ARC-AGI基准测试中，o3模型在高配版和低计算设置下分别获得了87.5%和75.7%的得分，是o1模型得分的三倍。然而，高计算模式下的成本高昂，每个任务可能耗资数千美元，相比之下，低计算模式则仅需约20美元。

尽管如此，ARC-AGI测试的创建者François Chollet对o3模型持谨慎态度，他认为o3在一些简单任务上的失败表明其与人类智能仍存在根本差异。他强调，只有当设计出对普通人容易但对AI难的任务变得不可能时，才标志着AGI的真正到来。

OpenAI透露，o3模型的迷你版o3-mini将于明年1月底推出，随后将发布完整的o3模型。为了安全起见，OpenAI正邀请安全研究人员申请体验o3模型，以补充现有的测试流程。

回顾OpenAI的“双十二”活动，虽然连续12个工作日的直播吸引了众多关注，但部分AI从业者却表示失望。他们认为，OpenAI此次活动更多地是在填补过去的空白，o3模型的发布更像是一个“预告”，其实际表现还需等待实际应用后才能确定。与以往快节奏、高密度的新品发布会相比，此次活动的直播时长较短，缺乏震撼感。

活动期间，OpenAI发布了多项期货产品，包括完整版o1模型、视频生成模型Sora以及在苹果设备中正式接入ChatGPT等。然而，这些产品的发布并未如预期般引起轰动。尤其是Sora模型，在沉寂298天后终于上线，却因服务器压力一度被迫关闭。与此同时，国内外多家公司也发布了视频模型，使得Sora在性价比和生成质量上并未占据明显优势。

OpenAI还推出了七个月前演示过的实时视频功能和向所有ChatGPT用户开放的搜索服务。然而，这些功能并非OpenAI首创，其最大竞争对手Anthropic早已推出类似功能。有AI从业者指出，从用户体验和交互设计上看，Anthropic的AI助手Claude呈现出更积极的创新姿态，OpenAI似乎是在参照竞争对手来完善ChatGPT。

面对外界的质疑，OpenAI通过发布o3模型再次表明其正转向新的推理范式，以应对Scaling Law收益递减、预训练数据短缺等挑战。同时，谷歌作为科技巨头，也在积极布局AI领域，与OpenAI展开了正面竞争。谷歌先后发布了量子芯片Willow、新一代大模型Gemini 2.0、推理模型以及视频和图像模型等，试图在AI智能体、视频生成和搜索等领域抢占先机。

谷歌推出的Gemini 2.0 Flash实验版本在多项基准测试中表现领先，并支持多模态输入和输出。谷歌还探索了一系列智能体项目，包括支持高级视觉和语音交互的Project Astra、能像人类一样使用网站的智能体Project Mariner以及编码智能体Jules。这些项目旨在打造全新的AI智能体，更接近通用助手的愿景。

在视频生成领域，谷歌发布了新一代视频模型Veo 2和升级后的图像生成模型Imagen 3。虽然Veo 2在理论上可以生成分辨率达4K、两分钟或以上的视频，但目前仅支持生成720P、时长8秒的视频。相比之下，ChatGPT Pro付费用户可通过Sora生成1080P、最长20秒的视频。

在搜索领域，谷歌也推出了“AI Overviews”概率功能来应对ChatGPT Search的挑战。然而，该功能因生成低质量结果而频频翻车。据最新报道，谷歌正计划为其数十亿搜索用户提供切换到AI模式的选项，以应对ChatGPT等竞争对手的冲击。

随着AI战局的瞬息万变，抢先入局者并不一定能始终保持领先。在国内，字节跳动凭借雄厚财力和顶尖人才，已呈现出赶超的趋势。而在国外，谷歌作为科技巨头，也在积极布局AI领域，试图赶超OpenAI。未来，AI领域的竞争将更加激烈和精彩。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

雅戈尔接盘银泰百货，多元化回归主业能否擦出新火花？

12-23

胖东来线上转型进行时，电商之路能否再续线下传奇？

12-23

百时美施贵宝换帅后大动作频出，合作管线遭遇“清洗”风波？

12-23

山东科嘉电气：让出口智利设备轻松适配50Hz电源，大功率变频技术解析

12-23

安图生物AutoLumo A6000登顶！高端医疗装备创新实力获官方点赞

12-23

彭加木罗布泊神秘失踪四十余载，搜寻为何至今无果？

12-23

丽江观星季：流星雨与雪山共舞，探索璀璨星空文化

12-23

腾讯胜诉代练公司，全国首例“防沉迷”案判赔98.5万

这也是全国首例基于未成年人“防沉迷”的商业代练行为作出的案件判决。其主要判定因素有两点：一是代练帮App的代练交易行为影响了游戏公平竞技机制，损害了消费者的游戏体验以及合法利益；二是商业代练平台破坏了未…

12-23

嫦娥六号新突破！月背古磁场信息首揭秘，月球磁场发电机有新解

12-23

日照魅力无限！摄影爱好者齐聚，共盼海上火箭震撼升空

12-23

微信小店“送礼物”功能，能否成为电商新曲线？

12-23

古偶长剧迎短剧风，能否改写内娱命运？

12-23

蔚来李斌谈造车：技术与体验领先，不做赢者通吃的游戏

12-23

恒瑞医药步入微利时代，孙飘扬如何续写创新篇章？

12-23

巴西社交应用风靡，真人交友短剧推广成新宠？

12-23

点击查看更多 +

全站最新

彭加木罗布泊神秘失踪四十余载，搜寻为何至今无果？

丽江观星季：流星雨与雪山共舞，探索璀璨星空文化

江苏12城闪耀全国消费百强榜，上海问鼎榜首引领消费潮流

海优新材布局成都，新材料技术公司正式成立！

广立微携手伙伴，新成立杭州聚芯智算科技有限公司

南芯科技等联手成立安徽晨晖种子创投企业，注册资本达3亿

热门内容

本栏最新

山东科嘉电气：让出口智利设备轻松适配50Hz电源，大功率变频技术解析

安图生物AutoLumo A6000登顶！高端医疗装备创新实力获官方点赞

彭加木罗布泊神秘失踪四十余载，搜寻为何至今无果？

丽江观星季：流星雨与雪山共舞，探索璀璨星空文化

腾讯胜诉代练公司，全国首例“防沉迷”案判赔98.5万

嫦娥六号新突破！月背古磁场信息首揭秘，月球磁场发电机有新解

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.