ITBear旗下自媒体矩阵：

滚动资讯

当前位置：财经 > 信息流 > 正文内容

英伟达开源新大模型Nemotron，仅次于GPT-4？

时间：2024-10-17 09:01:11 来源：ITBEAR作者：陈丽编辑：瑞雪 发表评论无障碍通道

英伟达，全球AI技术的领头羊，近期宣布开源其最新研发的超强模型——Llama-3.1-Nemotron-70B-Instruct。据测试数据揭示，此模型在性能上已成功超越GPT-4o、GPT-4turbo、Gemma-2等140多个开源及闭源模型，其表现仅次于OpenAI最新发布的o1模型。

Nemotron的基础架构源自Llama-3.1-70B，但其独特之处在于采用了一种创新的混合训练方法，该方法融合了Bradley-Terry与Regression两种策略，用于训练奖励模型，显著提升了模型效果。

业界观察家指出，英伟达频繁开源先进模型，不仅得益于其雄厚的科研资金支持，更深层次的目的在于推动GPU销售与开发生态的繁荣。相比之下，meta凭借其社交帝国的商业化和资金优势，亦在AI领域占据一席之地。然而，这一趋势对于大模型初创企业而言，无疑构成了巨大挑战，它们在资金、商业化及知名度方面均面临严峻考验。

Nemotron的成功，部分归功于其创新的混合训练方法。该方法旨在优化奖励模型，使其更精准地理解并执行用户指令，无论是翻译、文本生成还是问答任务。Bradley-Terry与Regression的结合，既考虑了用户偏好，又兼顾了响应质量的细致评估，从而克服了单一方法的局限性。

为了实施这一混合方法，英伟达开发了包含评分和偏好注释的HELPSTEER2-PREFERENCE数据集，通过严格的注释和预处理步骤，确保了数据的质量和一致性。测试结果显示，使用该数据集训练的模型在RewardBench评测中取得了94.1的高分，表现出色。

一位高级AI用户分享了使用Nemotron模型的心得，表示在商业写作方面，该模型相较于Claude3和ChatGPT展现出更高的智能水平，尽管仍会犯一些错误，但整体表现更为出色。

英伟达的创新混合训练方法不仅体现在技术层面的突破，更在数据集的构建上展现了独到之处。HELPSTEER2-PREFERENCE数据集的多元化注释过程，不仅增强了数据的透明度，也为后续分析提供了丰富的背景信息。

英伟达以极低的成本实现了这一技术飞跃，若其愿意，将难以有竞争对手匹敌。这一创新不仅推动了AI技术的进步，也为行业树立了新的标杆。

总体而言，AI领域的竞争正以惊人的速度推动着行业的进步，而英伟达的这一开源举措无疑为这一进程注入了新的活力。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

“筷子夹火箭”一小步，背后科技进步一大步？

首先，从重型火箭回收技术上说，“筷子夹火箭”只能说明SpaceX拥有了双保险，支撑腿落地和当空被夹，这两种技术路线还需要一个验证和筛选过程，以便找到降低成本和维持可靠性的最佳方案。可NASA几乎都是个空壳了…

10-17

“千帆星座”再添新星！我国在轨卫星数量增至36颗

就在今年8月6日，我国成功发射了千帆极轨01组卫星，成功将18颗卫星送入预定轨道，这是我国低轨互联网星座“千帆星座”的首批组网星。 “千帆星座”由低轨互联网卫星组网随着此次千帆极轨02组卫星成功发射，“千帆…

10-17

新董事长实控企业悄悄买入？神秘举牌背后的真相！

当月，全新好第十二届董事会第十一次（临时）会议全票通过了选举邹林为公司第十二届董事会董事候选人的议案，并同意自股东大会选举其为公司董事之日起选举其担任公司第十二届董事会战略委员会委员、提名委员会委员。公告…

10-17

阿里京东物流“拆墙”，末端快递员忧收入，商家已换快递？

有淘宝商家及快递从业者也向时代财经透露，为了通过平台审核，一直以来部分淘系商家会“套马甲”，即上传类似“平安达腾飞”“京广快递”等快递马甲单号，但实际上发货承运商是京东快递，但即便如此，仍会出现物流轨迹不同…

10-17

中越跨境互市升温，东兴奶茶越南咖啡如何实现双向“出圈”？

在百余米的北仑河大桥上，边民往来搬运着日用品等互市贸易货物，频繁的人员往来和贸易交流中，越南的咖啡凭借其独特的风味深受中国消费者的欢迎，这也为中越之间的咖啡贸易带来了新的机遇。中国消费者对越南咖啡爱不释手…

10-17

广交会再现“客从八方来”，客流增量如何变经济增量？

顺德边检站边防检查处副处长曹文佳：在顺德区4个货运码头，对载运驻地企业成交订单的出入境船舶，实行船舶边检查验“零待时”，一次办妥出境手续就近出海，保障每天3000多个满载“顺德智造”电器产品的集装箱，从走…

10-17

“直播间儿女”如何精准拿捏老年人心理？

充斥各类直播间、靠“剧情”带货的“儿女”，更是刷新我们的三观。不可否认，各类网络平台为社交、娱乐、消费、就业创造了广阔空间，但平台在带动广大内容生产者不断创新的同时，也要提防层出不穷的新问题。尤其是对于打“擦…

10-17

印度航班频收虚假威胁，一天至少7架次中招，咋回事？

△资料图总台记者获悉，当地时间10月16日，印度至少又新增7架次航班收到虚假威胁信息，过去3天内印度已有近20架次航班受到虚假威胁信息干扰。据悉，印度内政部与航空部加强了安保力度，并加大力度追踪肇事者，…

10-17

道指收盘再创新高，热门中概股多数上扬！

热门中概股多数上涨，纳斯达克中国金龙指数涨0.93%，世纪互联涨超9%，叮咚买菜涨逾6%，再鼎医药涨超5%，贝壳涨逾4%，中通快递、爱奇艺、携程集团涨超2%；跌幅方面，名创优品、晶科能源跌超2%，蔚来、腾讯…

10-17

高空抛物、恶犬伤人，遭遇这些怎么办？维权裁判规则来了！

承办法官表示，根据《解释》，当高空抛物找不到侵权人时，诉讼中无须等待具体侵权人查明，被侵权人可要求未尽安全保障义务的物业服务企业等建筑物管理人承担与其过错相应的责任，其余部分损害则由可能加害的建筑物使用人给…

10-17

特斯拉陶琳发声：合规经营，企业底线不容破！

国家安全机关工作发现，某境外企业A公司通过与我国具有测绘资质的B公司合作，以开展汽车智能驾驶研究为掩护，在我国非法开展地理信息测绘活动。为尽可能直接获取原始测绘数据，A公司越过项目转包的层层节点，全程主导测绘…

10-17

楼市松绑进行时：仅剩京沪深及海南部分城市坚守限购？

随着天津市此次官宣取消新建商品住房和二手住房购买、转让等方面的限制性措施，这也意味着，天津全面取消限购，市内六区购房不再限购；同时，外地购房者亦取消限购，非本市户籍居民购房无需提供纳税或社保证明等购房资格证…

10-17

2024年度最大满月将至，17日晚别错过满月时刻！

10月17日19时26分将迎来满月时刻，而在当天的8时51分，月球又恰逢经过近地点。据悉，这是今年满月时刻与月球近地点时刻最接近的一次，将成为年度最大满月。…

10-17

双11遇冷？头部主播带货“翻车”，诚信基石待夯实！

对产品的不信任最终也将伤害直播带货的商业主体，连累平台经济。消费者往往无法在直播带货中获得产品的实际情况，这就给一些不合规产品留下了漏洞，对生产企业的抽查与检验也要加强。早日发现并积极处理直播电商领域的不规范…

10-17

婚礼消费新趋势：理性简约成主流，新中式为何圈粉无数？

如今，备婚新人可以通过网络获取更多信息和参照，对婚纱照的拍摄要求也越来越高。化上精致的妆容，穿上漂亮的婚纱，摆几个造型已经不能满足年轻人的需求，市场上主题婚纱照拍摄风格不断丰富，比如仅一个汉服类，就可以细分出…

10-17

点击查看更多 +

全站最新

“筷子夹火箭”一小步，背后科技进步一大步？

“千帆星座”再添新星！我国在轨卫星数量增至36颗

新董事长实控企业悄悄买入？神秘举牌背后的真相！

阿里京东物流“拆墙”，末端快递员忧收入，商家已换快递？

中越跨境互市升温，东兴奶茶越南咖啡如何实现双向“出圈”？