阿里巴巴最新开源的推理模型通义千问QwQ – 32B在国际权威大模型评测榜单LiveBench中的优异表现,还阐述了该榜单的权威性,以及通义千问QwQ – 32B在其他方面的突出成绩和阿里通义团队在模型开源上的成果。
在3月17日,备受瞩目的国际权威大模型评测榜单LiveBench公布了最新排名。阿里巴巴新开源的推理模型通义千问QwQ – 32B可谓是一鸣惊人,成功冲入全球前五的位置。这一成绩的含金量极高,它超过了OpenAI – GPT – 4.5 preview、Google – Gemini2.0、DeepSeek – R1等来自国内外的顶尖模型。凭借这样的出色表现,通义千问QwQ – 32B当之无愧地成为了全球性能最强的开源模型。
那么,LiveBench这个榜单究竟有着怎样的权威性呢?它是由图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun)领衔发起的大模型评测榜。该榜单会对大模型的多项能力进行综合全面评估,涵盖推理、编程、数学、数据分析、语言理解和指令遵循等多个方面。而且,它采用不断更新的实时题库及数据,这就从根本上杜绝了模型提前针对性训练及微调的可能性。也正因如此,LiveBench成为了业界公认的最权威、最公正的大模型榜单之一。在最新一期的LiveBench榜单中,全球排名前十的模型里仅有两款是开源模型,并且这两款都来自中国,彰显了中国在大模型领域的强大实力。
通义千问QwQ – 32B的优秀远不止于此。在开源当天,它就一举登顶全球最大的AI社区HuggingFace模型榜榜首,成为当下全球最受欢迎的开源大模型。它不仅刷新了开源推理模型的性能纪录,还在成本控制方面有着出色表现,大幅降低了部署使用成本。这使得全球先进的中国推理大模型首次能够在学术界和产业界广泛落地。目前,国家超算互联网平台、广州人工智能公共算力中心,以及东南大学、天津大学、山东大学等国内多所985、211高校都已经接入了千问QwQ – 32B模型。同时,壁仞科技、摩尔线程、硅基流动、CAMEL – AI、OpenRouter、SambaNova Cloud等海内外企业和平台也都推出了部署QwQ – 32B的算力产品或API服务。
从2023年至今,阿里通义团队在模型开源方面一直积极投入,成果丰硕。他们已经开源了200多款模型,这些模型涵盖了文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等“全模态”,并且覆盖了从0.5B到110B等参数的“全尺寸”。截至目前,在海内外AI开源社区中,千问Qwen的衍生模型数量已经突破10万个,超越了美国Meta公司的Llama系列模型,成为全球第一开源模型。
附链接:https://livebench.ai/#/
本文介绍了阿里巴巴通义千问QwQ – 32B在国际权威榜单中的优异成绩,体现了其作为全球最强开源模型的实力。同时,还提及该模型在其他方面的影响力以及阿里通义团队在模型开源上的广泛布局和突出成果,展示了中国在大模型领域的强大竞争力和创新能力。
原创文章,作者:行云乐易,如若转载,请注明出处:https://www.xiaoyaoxin.com/archives/586.html