在AI领域,一场激烈的竞赛正悄然上演。就在OpenAI推出GPT-5模型不久,DeepSeek公司宣布其最新成果——DeepSeek-V3.1模型正式面世,这一消息由DeepSeek官方公众号在近日发布。
据悉,DeepSeek-V3.1此次升级带来了诸多亮点。该模型引入了混合推理架构,使得用户可以在思考模式与非思考模式之间自由切换。相较于之前的版本,DeepSeek-V3.1在思考效率上有了显著提升,能够在更短的时间内提供答案。通过Post-Training优化,新模型在工具使用与智能体任务中的表现也有了大幅提高。
为了让用户能够尽快体验到新版本带来的改变,DeepSeek已经同步更新了官方App与网页端的模型。用户只需通过“深度思考”按钮,即可轻松切换不同的思考模式。
在DeepSeek-V3.1发布之前,市场曾传出DeepSeek即将推出新大模型的消息,但随后被DeepSeek内部人士否认。虽然DeepSeek R2未能如期而至,但DeepSeek-V3.1的发布无疑给市场带来了新的期待。
受DeepSeek-V3.1发布消息的影响,A股市场也迎来了波动。DeepSeek概念股中的每日互动在消息传出后,股价直线拉升,全天成交超过39亿元,涨幅高达13.66%。国产芯片龙头寒武纪的股价也在此期间一路飙升,成为继贵州茅台之后A股第二只千元股。
DeepSeek小助手在官方群发布的信息显示,DeepSeek线上模型版本已升级至V3.1,上下文长度拓展至128k。这一改变无疑将进一步提升模型的性能,为用户提供更好的使用体验。
DeepSeek此次继续延续了其“AI界的拼多多”路线,将性价比发挥到了极致。在编程测试中,DeepSeek V3.1凭借71.6%的高分击败了多个竞争对手,成为非推理模型中的佼佼者。而其成本仅为1美元,这一价格优势无疑将使其在市场竞争中占据有利地位。
值得注意的是,DeepSeek在官宣中还提到了新模型使用了UE8M0FP8Scale的参数精度,并对分词器及chat template进行了较大调整。DeepSeek官微表示,UE8M0FP8是针对即将发布的下一代国产芯片设计,这无疑为DeepSeek未来的发展埋下了伏笔。
回顾DeepSeek的发展历程,自今年年初推出大模型R1以来,凭借其超强的性能和极低的训练成本,DeepSeek在全球科技圈迅速崛起。其应用甚至一度登顶苹果美国地区应用商店免费APP下载排行榜,超越了ChatGPT。这一系列成就无疑为DeepSeek赢得了广泛的关注和认可。
然而,尽管DeepSeek取得了诸多成就,但DeepSeek-R2模型的发布却一再推迟。尽管如此,DeepSeek-V3.1的发布仍然给市场带来了新的活力和期待。随着DeepSeek在AI领域的不断探索和创新,相信其未来将继续为用户带来更多惊喜和改变。