本文围绕DeepSeek上线后国产算力领域的变化展开,深入探讨了其对算力资源采购、芯片适配、部署模式以及智算中心建设等方面的影响,分析了国产算力发展面临的挑战与机遇。
自DeepSeek上线以来,市场对国产算力资源的采购意愿呈现出显著的提升态势。这一变化,宛如一颗投入平静湖面的石子,在国产算力领域激起了层层涟漪。
3月24日,《每日经济新闻》的记者走进上海电信的“算力超市”,在这里发现了一个有趣的现象:那些对数据安全较为敏感的企业,在选择算力服务时,更倾向于专属化部署方案。相较于传统的IDC(互联网数据中心)服务,如今的云端专属算力服务已经支持通过专线接入DeepSeek大模型。这一举措犹如一把钥匙,进一步解决了本地一体机成本过高的痛点。而且,结合智云网络,政务、金融、医疗等行业的企业还可以选择边缘计算方案,从而为数据安全加上了一层坚实的保障。
当算力资源的灵活调度逐渐成为行业新趋势时,国产算力芯片的全面普及之路并非一帆风顺,它还面临着诸多挑战。记者走访临港智算谷了解到,AI算力的运行需要消耗大量的电力,这就如同一个巨大的“电老虎”。为了降低运营成本,算力中心探索出了一系列路径,比如引入光伏发电、购买绿电等。同时,算力中心还会向客户提供柴发、储能、光伏等虚拟机组资源,以此来优化能源利用和成本控制,就像一位精打细算的管家,努力让每一度电都发挥出最大的价值。
图片来源:每经记者张韵摄
然而,不可否认的是,这场由技术驱动、政策支持以及市场需求共同推动的算力革命,正在悄然改变着国产算力的命运。对于芯片厂商来说,这是一个从技术适配迈向商业落地的关键阶段,就像一场充满挑战与机遇的赛跑,谁能率先冲过终点,谁就能在市场中占据一席之地。
厂商抢滩DeepSeek适配
“刚刚周末退出来两台设备,如果客户想要,可以马上续上。”3月24日,星期一,在中国电信上海分公司的天翼云能力运营中心,电话铃声此起彼伏,不时有企业咨询不同芯片算力卡的服务费用。
放下电话,解决方案中心经理宋蒙向记者表示,在满足性能要求的基础上如何降低成本,是客户最为关心的问题。今年DeepSeek大模型的问世,无疑是给AI算法领域的竞争添了一把火,加剧了开源竞争的同时,也推动了国产芯片的适配进程。可以说,今年是国产算力发展的一个重要机遇期,就像一扇打开的窗户,让国产算力看到了更广阔的发展空间。
自2022年起,从A100、H100到“降级版”A800、H800,美国对高端芯片对华出口的限制背后,是基于AI训练“大力出奇迹”的认知,即认为更大的AI模型、更多的算力资源就意味着更智能的AI。然而,这一认知似乎正在被新的算法范式打破。
今年1月,DeepSeek通过Transformer架构优化、混合精度训练、计算并行优化以及分布式存储管理等一系列技术创新,大幅降低了AI训练和推理的计算需求。这个小而美且开源的模型,不仅让全球开始反思“堆卡烧钱”的OpenAI路线是否走偏,也为国产算力芯片和云服务商打开了通往AGI(通用人工智能)的另一扇窗。
在宋蒙看来,中国AI应用落地面临着两大瓶颈。首先,英伟达构建的CUDA生态就像一道难以跨越的护城河,让AI大模型向国产算力芯片的迁移变得困难重重;其次,在国产大模型如雨后春笋般涌现、国产芯片厂商不断增加的背景下,多对多的算法和算力适配更是难上加难。
“但DeepSeek很好地解决了第二个问题。”宋蒙告诉记者,它让原本分散的模型侧有了一次收敛。现在,华为、沐曦、天数、壁仞、寒武纪、昆仑芯等在内的算力芯片厂商,都与DeepSeek完成了模型适配。“将算子调优后,有的可以跑671B满血版,有的能跑蒸馏版,或多或少都能跑起来了”,宋蒙兴奋地说道。
此外,三大运营商全面接入DeepSeek后,其GPU利用率及IDC上架率也有所提升。电信天翼云自主研发的“息壤”智算平台,也在今年2月完成了国产算力芯片与DeepSeek – R1/V3系列大模型的深度适配优化,这无疑为国产算力的发展注入了一剂强心针。
实探算力超市:本地化部署需求激增
3月24日,《每日经济新闻》记者走进上海电信“算力超市”,只见运维人员正全神贯注地坐在电脑前,监控着算力调度的实时数据。宋蒙介绍说,DeepSeek改变了国产算力的命运,企业对本地化部署的需求进一步跃升。
图片来源:每经记者张韵摄
谈及DeepSeek带来的业务变化,3月25日,中国电信董事长兼首席执行官柯瑞文在2024年度业绩说明会上表示,息壤DeepSeek一体机推出后签约额已达6亿元。从内部资源使用情况来看,自有算力售卖率已超过90%,相比DeepSeek上线前实现了翻倍。
此外,天翼云官网访问量也在两周内增加了5.7万人次,达到了DeepSeek上线前的16至17倍。与此同时,模型服务和token调用量都呈现出了指数级的增长,这充分显示出DeepSeek的受欢迎程度。
火爆的需求背后,是企业对部署方式的多样化选择。宋蒙告诉记者,企业使用DeepSeek目前有四种模式。最开始是公有云SaaS(软件即服务)部署,这种方式具有便捷、价格低的优点,但数据存储在云端,使用API(应用程序编程接口)接口进行应用级对接时,存在一定的隐私和安全风险。
为了避免数据泄露,一些企业开始采取本地化部署。“他们会在自己的机房单独购买GPU服务器,将开源大模型DeepSeek装在服务器上,连到企业自己的内网就可以使用了。这种方式保证了数据安全,但最大的问题就是成本太高了。”宋蒙坦言。
记者在走访中发现,金融类企业通常会采用自建机房的方式进行算力的本地化部署。但这需要一次性支付百万元的三年结算价及后期一定比例的维保费用,才能以租赁的形式长期使用机柜服务。这对于只想短期部署或是对价格敏感的企业而言,无疑是一个沉重的负担。
宋蒙告诉记者,市场之所以如此定价,是为了拉平硬件投资回报,避免回款风险。目前,部署一套DeepSeek满血版软硬件的价格非常高昂,订购GPU服务器后,还需要进行硬件的集成、机房的改造、专线的部署等一系列工作。
于是,为了满足企业对数据安全和成本节约的需求,“公共算力服务平台”应运而生。上海电信将其形象地称为“算力超市”,企业可以通过产品订购,享受到运营商级的机房环境、独立的硬件资源以及专属的DeepSeek模型,就像在超市里挑选商品一样方便。
企业可实现算力服务“拎包入住”
为了进一步降低用户的使用门槛,《每日经济新闻》记者了解到,电信运营商正不断探索降低成本的销售模式,向市场推出云端专属算力服务,用1%的月租成本就能撬动同性能算力供应。
那么,相比于传统的IDC服务,公共算力服务在商业模式上有怎样的范式创新呢?
“在模型收费的时代,企业用户一般会向模型厂商自行采购软件,由模型供应商负责安装部署。现在,开源模型本身是免费的,算力超市可以提供安装部署服务。对企业而言,把模型下载下来,安装到服务器上,并能正常跑起来,也是一个技术活。”宋蒙打了一个比方,如果把传统IDC机柜服务看作是一套“毛坯房”,那么算力超市就是“精装修”,热门模型与算力芯片都已打包,企业可以实现“拎包入住”,轻松开启算力之旅。
而面对中小企业的“临时性算力需求”,更低的成本、更简化的模型需求催生了更为灵活的解决方案。上海电信进一步将一台物理服务器切成了单卡与多卡,以小时计费,企业只要支付3元/卡时的价格,就可以进行AI的开发调测及训练推理,这有效提升了公共算力服务的普惠性,让更多的中小企业能够享受到算力带来的便利。
业界对模型算力的认知也在快速迭代。近日,蚂蚁集团Ling团队发表论文称,实验表明,MoE(混合专家)大模型可在国产芯片上训练出与英伟达H800芯片相当的效果,且训练成本降低20%。
中国正在经历一场低调的算力革命,这无疑点燃了“去英伟达化”的希望。从华为910B撑起千亿参数模型训练,到DeepSeek带动国产芯片厂商完成软硬件协同适配,国产算力正试图通过算法创新与硬件迭代实现弯道超车。
随着国产芯片借势崛起,未来,普惠型“算力超市”又该如何保证优质算力资源上架,降低硬件迭代的采购风险?3月24日,《每日经济新闻》记者进一步走访中国电信临港智算中心园区寻求答案。
实探智算中心:国产GPU测试基本完成
来到园区,一栋栋5层高的数据机楼正在加紧建设。记者看到,1.1期项目已全面投产,两路市电经220KV变电站向智算集群输送稳定电力,并配备一栋柴发机楼应对突发事件的用电需求,就像给智算中心加上了一层双重保险。
走进临港智算谷,现场物业部经理向记者介绍,1.2期的主体结构已经基本建造完毕,正在进行二次结构及内部装修施工。整个项目一期工程占地119亩,将于12月份正式投入使用。二期项目计划分四批开发,计划2026 – 2029每年交付两栋机楼。
“随着DeepSeek的火爆出圈,我们针对本地化部署需求推出了标准化、模块化、定制化的算力基础服务。”临港算力项目部项目经理时云松告诉记者,面对算力行业迅速发展和需求多样化趋势,客户对交付周期提出了更高的要求,临港智算谷的建设难点在于如何快速且有效满足客户需求。
目前,已有企业对建设中的数据机楼订购了包楼服务。对此,项目部需要在园区建设上进行超前考量,结合客户对机楼层高以及实际荷载要求,以“两弹一优”的高标准提高供电、散热、制冷、承重等基础设施能力,从而实现快速响应和定制化的基础服务。
行至数据机楼3层,记者跟随时云松步入冷板式液冷核心机房,耳边传来背板风冷设备高速运转的呼呼声。走进液冷DC舱内,体感温度相比机房室温明显下降。时云松告诉记者,国产万卡池使用了3∶7的风冷液冷配比达到供冷最优,使PUE(评价数据中心能源效率的指标)保持在低于1.25的水平。另外,规模化智算机架还规划配备了32台浸没式液冷设备。
时云松称,临港智算中心的国产万卡算力池,使用的算力卡主要集中在华为910B,另有壁仞、沐曦等国产算力卡也已基本完成性能测试,目前应用于国产混训项目中。
图片来源:每经记者张韵摄
宋蒙补充道,目前,国产算力厂商不断推出新型GPU芯片,如果能够以更低的成本给客户使用,公司也愿意引入此类产品,但需经过国产GPU创新联合基地的测评,只有性能符合要求、价格为市场所接受的算力资源才会最终上架。
“长久运营好算力超市,要做好质量与服务两件事。”在谈及未来的长期规划时,宋蒙认为,向客户提供高质量的算力服务,不仅体现在拥有琳琅满目的算力产品,还要提供满足客户需求的使用服务,围绕客户的真实使用场景,推出模型调优、AI应用等进阶服务。
宋蒙观察发现,如今越来越多的客户不仅需要算力和模型,更想要能直接上手的AI应用。中国电信正准备上架一系列AI应用,涉及专属智能问答、AI企业法务、智能公文写作等细分领域。
本文详细阐述了DeepSeek上线后对国产算力领域的多方面影响。它推动了国产算力资源采购,加速了芯片适配进程,改变了企业的部署模式,也为智算中心的建设带来了新的机遇和挑战。尽管国产算力发展面临着一些困难,如能源消耗、适配难题等,但通过技术创新、商业模式优化等方式,正逐步实现弯道超车。未来,国产算力有望在算法和硬件的双重推动下,在全球市场中占据更重要的地位。
原创文章,作者:东京迎荷,如若转载,请注明出处:https://www.xiaoyaoxin.com/archives/8385.html