3月21日深夜，腾讯自研混元T1正式版震撼发布！，腾讯混元T1正式版上线，推理成绩业界领先！

甜雅mio • 2025年3月22日 08:07 • 国际动态 • 阅读 10

腾讯在大模型领域的最新进展，包括3月21日深夜正式推出自研深度思考模型混元T1正式版，介绍了其在推理模型基础能力测试中的成绩，还回顾了腾讯混元大模型此前的表现、过往产品发布情况以及近期相关应用中的模型搭载情况。

在3月21日的深夜，科技圈迎来一则重磅消息。腾讯混元对外宣布，其自研的深度思考模型——混元T1正式版已正式推出。这一消息犹如一颗投入平静湖面的巨石，在人工智能领域激起层层涟漪。

衡量推理模型基础能力，常见的benchmark是重要参考。在大语言模型评估增强数据集MMLU – PRO中，混元T1展现出强大实力，取得了87.2分的优异成绩，仅落后于o1。而在CEval、AIME、Zebra Logic等涉及中英文知识以及竞赛级数学、逻辑推理的公开基准测试里，混元T1同样毫不逊色，其成绩达到了业界领先推理模型的水平。这充分证明了混元T1在复杂知识处理和逻辑推理方面的卓越能力。

其实，腾讯混元大模型此前就有亮眼表现。此前，腾讯宣布混元大模型首次登上Chatbot Arena榜单，成功跻身全球Top 15。在这个平台上，用户以匿名方式与多个模型互动，并通过投票决定哪个模型更优，最终根据分数生成排行榜。这种测评方式简单直接，被看作是大模型直接PK的竞技场，混元大模型能在其中脱颖而出，足见其竞争力。

回顾腾讯在大模型领域的发展历程，去年9月5日，腾讯发布了新一代大模型混元Turbo。它采用MoE架构，相比上一代产品，推理效率大幅提升100%，推理成本降低50%。这一改进不仅提高了模型的性能，还降低了使用成本，为其广泛应用奠定了基础。

而在本月1日发布的腾讯元宝电脑版App中，内置了混元和DeepSeek两种模型，并且支持双模切换。这为用户提供了更多的选择，满足了不同用户在不同场景下的需求。