本文聚焦京东在具身智能领域的布局与发展,介绍了京东在该领域的技术成果、业务方向,以及近几年在技术转型方面的投入与成效。同时提及国内多家科技大厂也在布局具身智能技术,预示着未来相关领域竞争将更加激烈。
近日,一则重磅消息引发了广泛关注——京东已正式切入“具身智能”领域,集团迅速成立了相关业务部门并展开了全面的技术布局。早在3月初,京东探索研究院就发布了相关文章。文章显示,该团队成功开发了一套具有高扩展性的具身智能系统架构。这一架构可不简单,它包含了面向双臂灵巧手的一体式高频率遥操技术,以及基于末端模仿的泛化操作方法。更为值得一提的是,团队还打造了国内首个双臂移动机器人操作的开源数据集JD ManiData。这些技术成果已经全面应用于咖啡机器人等家庭场景之中。其中,这套具身智能系统架构更是突破了以往简单结构化的实验室场景局限,操作成功率达到了80%,展现出了强大的实用性和稳定性。针对近期火热的“具身智能”相关话题,3月25日,京东科技人工智能(AI)相关负责人在接受采访时向钛媒体AGI表示,京东云一直以来都在持续深耕大模型技术,并大力推进其在产业应用方面的落地。在该团队看来,发展通用人工智能(AGI)主要有三个重要方向:第一是大语言模型,它是实现智能交互的基础;第二是多模态,大模型不仅要具备视觉能力,未来甚至还可以进一步延伸至嗅觉、触觉等领域,以实现更加真实的感知;第三是走向“具身智能”,涵盖机器人、机械臂、无人车等,让AGI从虚拟的数字世界真正走向现实的物理世界。该负责人进一步表示:“数字人是多模态的典型代表,我们也一直在积极推动其在物理世界的研究与应用。随着硬件制造技术的日益成熟,软件即智能模型将成为机器人领域越来越重要的差异化和竞争能力。在智能机器人领域,京东主要聚焦于机器人和大模型的深度结合,以及新应用场景的探索,包括世界模型、深度推理模型等。最终的目标是将机器人打造成为可执行、可操作的‘具身智能’载体,无论是机器人、车,还是机器狗,都遵循这一发展方向。”据悉,京东探索研究院成立于2020年10月25日。它是以京东集团各事业群与业务单元的技术发展为基础,集合了全集团的资源和能力而成立的专注于前沿科技探索的研发部门。这里是一个实现研究和协同创新的生态平台,主要深耕人工智能、数据科学工程与管理、去中心化计算等数智技术领域。其致力于从基础理论层面实现颠覆式创新,助力数智化产业的发展与变革,以原创性科技为京东的零售、物流、健康、科技等全产业链场景赋能。近几年,京东加速且全面地向技术转型。从财报数据中可以清晰地看到,2017年 – 2024年,京东集团累计研发投入超过1400亿元人民币。其中,2024财年,京东集团的研发支出更是达到了创纪录的170.31亿元。如此巨大的投入,也换来了丰硕的成果。得益于京东近几年持续加码AI与机器人技术,截至2024年底,京东AI技术已经深度应用于物流、零售场景。并且成功推出了多款应用于仓储、分拣、配送等环节的智能机器人。京东集团CEO许冉近期也表示:“AI在京东整体业务中发挥着越来越重要的价值。”在2024年底举行的京东云峰会上,京东云发布了企业大模型服务、言犀智能体平台、智能编程助手JoyCoder、言犀数字人3.0等三大智能平台和五大技术产品。其中,言犀数字人作为最能体现京东云技术能力之一的产品持续发力。在DeepSeek热潮下,言犀数字人全面接入DeepSeek,目前已经有200余家品牌正在使用DeepSeek辅助生成数字人直播脚本,文案参考率高达90%。而且言犀数字人能够24小时在线不停播,成本仅为真人的1/10,平均还能带来30%的转化提升。数据显示,目前已经有超过9000家品牌选择言犀数字人进行入驻带货,GMV增量超140亿。同时,数字人直播商家数已同比增加200%以上。这一系列数据充分表明,京东言犀数字人已经率先完成了规模化产业应用。近日,中国人工智能学会发布了2024年度“吴文俊人工智能科学技术奖”,京东科技人工智能团队凭借“多模态交互式数字人关键技术及产业应用”项目荣获了中国智能科学技术最高奖——吴文俊人工智能科学技术奖的特等奖,也是本年度唯一的特等奖。此次获奖信息中,京东言犀数字人主要在三方面实现了技术突破:一是提出了低成本、高保真人体建模技术,成功解决了人体建模成本高、观感差的难题;二是提出了语义一致多模态应答技术,解决了多模态语义难对齐、应答弱的难题;三是提出了多模态自然化行为生成技术,解决了多样化行为难协调、交互假的难题。如今,京东言犀数字人技术再度进化。该团队打造的数字人通用的基座大模型,通过语音合成大模型LiveTTS及通用数字人大模型LiveHuman,仅需输入自然语言或1秒视频/照片,即可生成4K超高清、100%口型匹配、98%声纹还原度的数字人。这一技术彻底告别了数字人制作依赖于线下拍摄、建模以及成本过高等因素,实现了中小企业、个人可“开箱即用”。据相关负责人透露,京东言犀数字人正积极布局“千人千面”功能。该功能一旦上线,每个商家和用户都会拥有一个栩栩如生的个性化直播助手,同时主播数字人还能精细化地服务于每位消费者,产品体验将得到更大一步的提升。该功能最快将在今年4月上线。该负责人还表示:“现在数字人技术,特别是AI技术,不是纯算法问题,也不是纯数据问题,而是需要在算法工程优化方面突破挑战。”事实上,除了京东,近期腾讯、蚂蚁、小米、华为等多家国内科技大厂都在积极布局“具身智能”技术。近期,腾讯领投了智元机器人B轮融资;蚂蚁集团注册成立了蚂蚁灵波科技有限公司,聚焦具身智能技术和产品研发;华为则在深圳成立了全球具身智能产业创新中心。国泰君安证券研究所认为,华为在人形机器人产业的定位可能更像英伟达,将以“卖铲人”的角色存在。可以预见,接下来,国内科技大厂通过布局具身智能,抢占垂直市场的激烈程度将更上一层楼,尤其是在具身智能拥有巨大潜力的制造业、医疗、家庭服务等领域。展望未来,京东也明确表示,其将持续优化具身智能技术,以快速应用于新场景。通过整合“视觉 – 语言 – 动作”大模型与预训练和强化学习方法,提高机器人的操作成功率和泛化能力,将技术扩展到更广泛的业务领域,加速具身智能技术探索与产业应用。相关负责人形象地表示:“最终,人类需要造的机器人,是要服务于人的。比如,你想让机器人倒杯咖啡,所以需要机器人识别咖啡类别、识别杯子大小。如果用端到端的具身智能技术就可以真正实现机器人全自动化。所以从某种意义上来说,世界都是为人而生的。”
本文详细介绍了京东在具身智能领域的布局和技术成果,包括具身智能系统架构、数字人技术等,还提及京东近几年在技术转型上的投入及成效。同时指出国内多家科技大厂也在布局具身智能,未来竞争将更激烈,而京东将持续优化技术以拓展应用场景。
原创文章,作者:六合柯慧,如若转载,请注明出处:https://www.xiaoyaoxin.com/archives/8494.html