两年前,第一届鲲鹏开发者峰会正式召开,会上鲲鹏的一体化解决方案和鲲鹏社区3.0
正式发布;
去年,第一块
面向开发者的
Kunpeng Pro
开发板正式发布,该开发板帮助开发者更快速、便捷的进行各种实践和创新
,
同时发布了“
鲲鹏流水线”
的应用实践,很多场景和应用平均开发效率提升30%
,客户和伙伴的应用软件性能提升27%
。
今年 , 鲲鹏昇腾开发者大会2025—— 鲲鹏开发者峰会现场,华为鲲鹏计算业务总裁李义表示,鲲鹏计算产业历经六年发展,鲲鹏生态 已 汇聚6300 余家合作伙伴,孵化超 18000 个行业解决方案,通过硬件开放与软件开源战略 , 构建了覆盖数据中心到边缘场景的完整生态,正式发布面向AI 时代的 " 鲲鹏 AI+ 解决方案 " 。
李义指出,AI时代,AI Core、AI Infra和AI应用是构成AI生态的三大核心要素。其中AI core作为底层基础设施,包含算力(鲲鹏处理器)与算法(如Transformer、MoE大模型)等方面,为整个AI体系提供基础支撑。AI Infra则主要负责数据的处理工作,即数据向量化、存储、管理和快速检索的能力,对AI运行效率起关键作用。AI应用就是把AI技术和行业的实际情况相结合,帮助企业解决问题,真正实现价值落地。
AI Core:开放 软 硬件+开源 社区 ,打破算力 “黑盒”
未来的算力必须兼具灵活性与经济性。鲲鹏的硬件开放战略,通过 “模组化设计+异构兼容” 来 降低企业算力部署门槛。
在 硬件层 , 模组化设计让算力 “按需拼装” ,具体来说 鲲鹏提供全系列主板与模组,兼容昇腾、天数智芯、沐曦等6类主流GPU。目前,已有7家OEM厂商基于鲲鹏模组开发10余款推理服务器,20余家KPN伙伴推出边缘推理一体机,覆盖1.5B到671B参数模型。
同时鲲鹏与openEuler 协 同,实现内存融合和算力融合,通过GMEM做到xPU和CPU内存统一编址,提升xPU利用率;通过sysHAX将部分推理任务精准分配给CPU处理,实现CPU和xPU算力协同,能够覆盖MoE模型和稠密模型。
众所周知,集 群管理的复杂度是阻碍企业规模化使用算力的障碍 之一 。为此,鲲鹏 正式 开源集群调度平台openFuyao,发布五大集群调度能力,解决异构算力协同难题,实现分钟级部署与小时级升级,支持1.6万节点超大规模集群管理,较业界方案规模提升3.2倍 , 加速算力释放与智能创新。
AI Infra:数据工程与安全 防护 ,跨越落地的 “最后一公里”
AI的瓶颈不仅是算力,更在于数据效率与安全。鲲鹏从数据工程到安全防护,构建端到端解决方案。
在数据工程层面,鲲鹏的解法是全生命周期垂直优化。以电商场景为例,实时订单处理需要毫秒级响应,传统Java算子的性能瓶颈导致数据处理延迟。鲲鹏AI+数据工程组件通过代码自动翻译工具,将Java算子无缝转化为C++原生代码,使处理效率提升1倍 以上 ;面对文本、视频等多模态数据混合处理的复杂场景,则通过 多模态 算子调度优化与硬件资源动态分配,实现75%的性能跃升 和算力利用率的两倍提升 。
而在推理环节,openGauss DataVec向量数据库的非首token时延下降25%,结合KV Cache透明压缩技术,吞吐量提升20%-30%。“某头部电商采用这套方案后,推荐模型的迭代周期从30天压缩至20天。”刘林超用数据佐证技术突破的商业价值。
安全防护的挑战更为隐蔽且致命。 “我们渴望AI能力,但绝不能以数据泄露为代价。”一位金融科技公司 开发者 在峰会间隙向记者坦言。这种矛盾心理恰恰指向AI规模化的核心痛点——如何平衡效率与安全?
鲲鹏的答案是鲲鹏AI+安全使能套件:纵深防御,端到端保护AI模型和私域数据安全的三重防线:
系统可信任:基于鲲鹏可信计算 , 从硬件到系统 软件 逐层度量,构建免疫篡改的运行环境,非授权应用连加载的机会都被彻底封堵;
攻击可检测:在openGauss向量数据库中内置攻击检测插件,实时拦截SQL注入等恶意命令,将安全策略从“被动响应”升级为“事前阻断”;
数据防窃取 :通过鲲鹏virtCCA+PCIPC技术,将安全域从CPU扩展至xPU,实现异构算力间的物理隔离,确保敏感数据“可用不可见”。
AI应用:从“开箱即用”到行业深度适配
“中小企业无需从头造轮子,也能构建专业AI应用。” 这是记者在与 AI 应用一线中小客户沟通后听到最多的需求反馈。正是基于此, 鲲鹏RAG解决方案1.0基于鲲鹏CPU和昇腾NPU、第三方GPU卡,打造包含RAG业务编排、AI+微服务、部署调度、安全和存储的开源开放体系,已被70余家ISV预集成,降低了企业构建AI应用的门槛。
具体来说, 基于开源生态,鲲鹏提供了业务编排组件,适配了Dify、RAGflow等主流开源的RAG业务应用开发平台,并提供了容器镜像下载链接,方便开发者快速开展RAG应用的编排与开发。
资源调度组件基于开源的K8S和Ray构建,支持一键完成RAG解决方案的安装部署,并能根据业务压力灵活调整微服务的硬件资源,实现资源的弹性扩展和高效利用。
鲲鹏搜广推解决方案围绕召回和排序极致优化,助力企业打造新一代智能推荐引擎,通过适配ScaNN、faiss等框架,显著提升召回和排序性能,在电商等场景中表现出色。
此外, 结合行业特点,鲲鹏与合作伙伴共同打造定制化的行业模型,实现AI技术与行业需求的深度融合。
来自用户的反馈更具说服力,润 和软件AI研究院总工程师朱凯表示,基于openGauss构建的多维度知识库系统通过知识增强技术和实时检索能力,实现了行业知识覆盖率超92%、文本一致性超90%的突破性进展。
他强调,公司正着力打造自主智能体生态体系,通过鲲鹏算力协同、边云融合部署及开源框架共建,已在政务、金融、能源领域形成"行业模型+平台+算力"的解决方案,推动可信AI发展。
生态协同,让算力 “精准滴灌”
未来的竞争不仅是技术,更是生态。华为鲲鹏计算业务副总裁陈超强调 , 通过 “一码多芯、同辕开发”计划,鲲鹏已助力600家伙伴实现开发效率提升30%,性能提升27%。2025年,鲲鹏 持续 投入30亿 (三年) 生态基金,覆盖开发者迁移、样机支持与营销激励,并启动奖金池700万的创新大赛,推动行业级解决方案落地。
从趋境科技的异构推理方案,到美团的互联网核心业务验证,再到润和软件的垂直行业突破,鲲鹏正以 “AI Core + AI Infra + AI应用”的AI生态的三大核心要素,重新定义AI算力底座。当算力不再是稀缺资源,而是像水电一样可灵活调用时,中小企业的创新门槛将被彻底打破——这才是AI普惠化的真正意义。