【ITBEAR科技资讯】6月7日消息,阿里云今日公布了一项重要消息,他们已成功研发出Qwen2,这是一款全新的开源模型,其性能超越了美国的开源Llama3以及中国的其他闭源模型,并且现已提供免费下载。
阿里云在公告中表示,经过数月的持续努力,Qwen系列模型已从Qwen1.5升级至Qwen2,实现了显著的进步。在此次升级中,阿里云推出了五个不同尺寸的预训练和指令微调模型,分别是Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B。这些模型不仅在中文和英语上进行了训练,还涵盖了其他27种语言的高质量数据,大大增强了其多语言能力。
据ITBEAR科技资讯了解,Qwen2在各种评测基准上都展现出了领先的表现,其代码理解和数学能力也有了显著的提升。此外,新款模型还增大了对上下文长度的支持,最高可处理达128K tokens的信息。具体来说,Qwen2-72B-Instruct能够出色地处理128k上下文长度内的信息抽取任务,Qwen2-7B-Instruct在处理长达128k的上下文时表现近乎完美,而Qwen2-57B-A14B-Instruct则能处理64k的上下文长度。对于系列中的两个较小模型,它们也支持高达32k的上下文长度。
目前,Qwen2系列模型已经在Hugging Face和ModelScope平台上同步开源,供全球开发者和研究人员免费下载和使用。阿里云还特意强调了此次模型许可的多样性,除了Qwen2-72B仍采用之前的Qianwen License外,其余模型均采用了Apache 2.0的许可。这一举措旨在推动Qwen2模型在全球范围内的广泛应用和商业落地,从而进一步促进人工智能技术的发展。