信创 | 龙芯处理器,100%自研,突破技术壁垒,领航国产芯片新纪元!

点击蓝字“程序员Style”关注,并置顶公众号

每日技术干货,第一时间送达!

 一、充分考虑兼容需求的自主指令系统——龙架构(LoongArch™)


2020年,龙芯中科基于二十年的CPU研制和生态建设积累推出了龙架构(LoongArch™),包括基础架构部分和向量指令、虚拟化、二进制翻译等扩展部分,近2000条指令

龙架构具有较好的自主性、先进性与兼容性

龙架构从整个架构的顶层规划,到各部分的功能定义,再到细节上每条指令的编码、名称、含义,在架构上进行自主重新设计,具有充分的自主性

龙架构摒弃了传统指令系统中部分不适应当前软硬件设计技术发展趋势的陈旧内容,吸纳了近年来指令系统设计领域诸多先进的技术发展成果。同原有兼容指令系统相比,不仅在硬件方面更易于高性能低功耗设计,而且在软件方面更易于编译优化和操作系统、虚拟机的开发

龙架构在设计时充分考虑兼容生态需求,融合了各国际主流指令系统的主要功能特性,同时依托龙芯团队在二进制翻译方面十余年的技术积累创新,能够实现多种国际主流指令系统的高效二进制翻译。龙芯中科从 2020 年起新研的 CPU 均支持LoongArch™。


优点: 

    先进性:吸收近年来指令集发展的先进技术成果,提高代码效率  

    兼容性:融合X86、ARM等的主要特点,高效支持二进制翻译

    模块化:基础部分、二进制翻译、虚拟化、向量化

    扩展性:指令槽留有余地,利于今后的持续演进

龙架构已得到国际开源软件界广泛认可与支持,正成为与X86/ARM并列的顶层开源生态系统。已向GNU组织申请到ELF Machine编号(258号),并获得Linux、Binutils、GDB、.NET、GCC、LLVM、Go、Chromium/V8、Mozilla / SpiderMonkey、FFmpeg、libyuv、libvpx、OpenH264、SRS等音视频类软件社区、UEFI(UEFI规范、ACPI规范)以及国内龙蜥开源社区、欧拉openEuler开源社区的支持。

二、龙芯产品及应用场景

“龙芯”系列芯片是由中国科学院中科技术有限公司设计研制的,采用LoongArch架构,具有自主知识产权,产品现包括龙芯1号小CPU、龙芯2号中CPU和龙芯3号大CPU三个系列,此外还包括龙芯7A1000桥片。龙芯1号系列32/64位处理器专为嵌入式领域设计,主要应用于云终端、工业控制、数据采集、手持终端、网络安全、消费电子等领域,具有低功耗、高集成度及高性价比等特点。

龙芯3A6000

龙芯3A6000是龙芯第四代微架构首款处理器,面向高端嵌入式计算机、桌面、服务器等应用。采用自主龙芯指令集(LoongArch™),基于全新研制的LA664处理器核,龙芯3A6000处理器性能在龙芯3A5000处理器基础上实现大幅提升,单核定/浮点性能分别提升60%和90%,多核定/浮点性能分别提升100%和90%。龙芯3A6000处理器 SPEC CPU 2006 Base单线程定/浮点分值分别达到43.1/54.6分,达到国际市场主流水平。


 

龙芯3A5000

龙芯3A5000/3B5000是面向个人计算机、服务器等信息化领域的通用处理器,基于龙芯自主指令系统(LoongArch®)的LA464微结构,并进一步提升频率,降低功耗,优化性能。在与龙芯3A4000处理器保持引脚兼容的基础上,频率提升至2.5GHz,功耗降低30%以上,性能提升50%以上。龙芯3B5000在龙芯3A5000的基础上支持多路互连。

 

龙芯3C5000

面向服务器领域的通用处理器片上集成16个高性能LA464处理器核,采用全新的龙芯自主指令系统(LoongArch ®),在兼容龙芯3C5000L主板设计的基础上,调整优化了封装形式,保持了系统和应用软件的兼容性。

 

龙芯3C5000L

龙芯3C5000L是龙芯中科专门面向服务器领域的通用处理器基于龙芯3A5000处理器,片上集成共16个高性能LA464处理器核,采用全新的龙芯自主指令系统(LoongArch®),在提高集成度的同时保持系统和软件与龙芯3A5000完全兼容。

 

龙芯3D5000

龙芯3D5000是一款面向服务器市场的32核CPU产品由两个3C5000的硅片封装在一起。龙芯3D5000集成了32个LA464处理器核和64MB片上共享缓存,支持8个满足DDR4-3200规格的访存通道,可以通过5个高速HyperTransport接口连接I/O扩展桥片和构建单路/双路/四路服务器系统,单机系统最多可支持四路128核。龙芯3D5000片内还集成了安全可信模块功能。龙芯3D5000采用LGA-4129封装形式,芯片尺寸为75.4mm×58.5mm×6.5mm,频率支持2.0GHz以上,典型功耗160W,TDP功耗不超过300W。单路和双路服务器的SPEC CPU2006 Base实测分值分别超过400分和800分,四路服务器的SPEC CPU2006 Base分值可以达到1600分。


龙芯2K2000

龙芯2K2000是一款通用SOC芯片芯片中集成两个LA364处理器核,2MB共享二级缓存,典型工作频率1.4GHz。SPEC2006(base)单核定点及浮点分值分别为9/GHz及9.9/GHz。该芯片集成龙芯自主研发的3D GPU核,集成了丰富的接口,同时还集成了安全可信模块,CAN等特色接口。龙芯2K2000在高性能/平衡模式下的功耗约为9/4W,可满足多种应用场景的需求。

 

龙芯2K1500

龙芯2K1500内部集成2个LA264核,主频1.0GHz,在接口与功能方面,龙芯2K1500集成了DDR3、PCIE 3.0和SATA 3.0接口,PCIE接口具备RC/EP模式和DMA功能,提供数量丰富的SPI、CAN、I2C、PWM等小接口和USB接口,支持eMMC功能。龙芯2K1500塑封版本采用FC-BGA封装,由于制程工艺的提升和低功耗设计方法的运用,其典型工作场景下功耗低于2.8W,可有效满足低功耗场景下的工控需求。

 

龙芯2K0500

龙芯2K0500是一款高集成度处理器芯片主要面向工控互联网应用、打印终端、BMC等应用场景。片内集成64位LA264处理器核、32位DDR3控制器、2D GPU、DVO显示接口、两路PCIe2.0、两路SATA2.0、四路USB2.0、一路USB3.0、两路GMAC、PCI总线、彩色黑白打印接口、HDA及其他常用接口。此外,芯片实现ACPI、DVFS/DPM动态电源功耗管理等低功耗技术,支持多种电源级别和唤醒方式,可根据具体应用场景对芯片部分功能和高速接口进行动态时钟、电源开关控制,满足工控、网络安全等应用领域低功耗应用需求。

 

龙芯2P0500

龙芯2P0500是一款适用于单/多功能打印机主控SoC芯片,是打印/扫描整机中核心控制部件。龙芯2P0500芯片采用异构大小核结构,内置龙芯LA364、LA132处理器核以及512KB共享二级缓存,集成DDR3、GMAC、USB、打印接口、扫描接口、eMMC、PWM等多种功能模块,并实现功耗管理控制模块,单芯片可满足打印、扫描、复印等多种典型应用需求。

 

龙芯1C103

芯片集成片上Flash、ATIM、GTIM、ADC、SPI、I2C、UART、RTC等功能模块,可输出带有死区的互补PWM信号,具备驱动舵机、有刷电机、无刷电机的原生支持,同时具备常见的通讯模块。龙芯1C103采用QFN32封装形式,芯片尺寸4.0mm*4.0mm。芯片尺寸小,各引脚可根据需求进行复用,应用场景灵活,可以满足高性价比的常见电机应用。产品主要应用于筋膜枪、修枝机、电锯、电扳手、跳绳机、风扇、汽车电子等。

 

龙芯1D100

龙芯1D100是超声波水表、热表和气表测量专用MCU芯片,集成CPU、FLASH、时间测量单元(TDC)、超声波脉冲发生器、温度测量单元(THSENS)、SPI、I2C、UART、MBUS、段式LCD控制器、ADC、RTC、空管检测、断线检测等功能模块。采用QFP80封装,休眠电流低于10μA,具备时差测量精度高、外设功能丰富、低功耗等特点,配合完善的编程、仿真、调试环境,大幅简化超声波流量测量系统的软硬件设计。

 

龙芯7A2000

龙芯 7A2000 是面向服务器及个人计算机领域的第二代龙芯 3 号系列处理器配套桥片龙芯 7A2000 在第一代桥片7A1000 的基础上进行了优化升级。首先PCIE、USB 和 SATA 均升级为 3.0;其次显示接口升级为 2 路 HDMI 和1路 VGA,可直连显示器;另外内置一个网络 PHY,直接提供网络端口输出;此外片内首次集成了自研GPU,采用统一渲染架构,搭配32位DDR4显存接口,最大支持16GB显存容量。

 

龙芯7A1000

龙芯7A1000是面向服务器及个人计算机领域的龙芯3号系列处理器配套桥片。该桥片集成一路HT3.0用于连接龙芯3号系列处理器,其他的主要外围接口包括三路x8PCIE2.0、两路x4PCIE2.0、三路SATA2.0、六路USB2.0、两路DVO及其它各种小接口,可以满足部分服务器及个人计算机领域应用需求,并为其扩展应用提供相应的接口。

三、龙芯解决了几大技术难题

全球芯片行业都在探讨以成熟工艺生产性能先进的芯片,为此Intel、台积电等组建了chiplet联盟,拥有最先进工艺的台积电也加入这个联盟,就在于全球芯片行业越来越难以承受先进工艺的超高成本。

从7纳米工艺开始,芯片制造就需要采用EUV光刻机,而EUV光刻机的价格已是DUV光刻机的数倍以上,到了3纳米工艺需要采用第二代EUV光刻机,第二代EUV光刻机的价格更是第一代EUV光刻机的3倍。

成本的急剧上涨,让最有钱的苹果都吃不消,因此苹果仅是在售价近9000的iPhone15Pro系列采用了A17处理器,而iPhone15、iPhone15plus则继续采用了4纳米的A16处理器;也正是3纳米工艺的成本太高,高通、联发科等都已放弃了3纳米工艺。

台积电开发出的3D WOW封装技术就以7纳米工艺生产出性能接近5纳米的芯片,并以此技术为英国一家AI芯片企业生产了一款芯片,这证明以先进封装技术确实可以开发出性能更先进的芯片,而成本较低。
龙芯3A6000以12纳米工艺却能拥有接近7纳米的性能,证明中国芯片可以通过核心架构以及其他技术的突破来取得更先进的性能,这对中国芯片来说尤为重要。

四、龙芯为国产芯片开辟新道路

龙芯3A6000为完全自研的芯片架构,这说明芯片架构并非如想象中那么难,中国芯片完全可以开发出完全掌控的芯片架构,这将激励中国芯片摆脱当前由海外芯片控制的ARM、X86架构。
芯片工艺则因为海外限制芯片设备对中国的销售,导致中国开发先进芯片工艺面临诸多困难,而3A6000却以12纳米工艺达到接近7纳米的性能,这意味着中国完全可以芯片架构升级辅以其他芯片技术,取得先进的性能,芯片设备对中国芯片产业的限制就此被打破。
这还为中国芯片的发展提供了时间,业界预期达到7纳米的性能就能满足中国制造九成的芯片需求,将加速国产芯片的替代,芯片对中国制造的阻碍将大幅降低,就如当下美国阻止美国芯片对中国出售先进的AI芯片,国产AI芯片已有诸多可以替代。
从诸多方面来说,龙芯3A6000对中国芯片产业来说都具有划时代的意义,中国芯片将走出一条康庄大道,逐渐形成独立的芯片产业链,以及完全自主研发的芯片生态,西方依托于自己的芯片技术优势垄断芯片产业链的局面将就此破灭。

五、龙芯处理器在哪些具体应用领域表现出了显著的性能优势?

龙芯处理器在多个具体应用领域表现出了显著的性能优势。首先,龙芯处理器在高性能计算领域有着显著的应用,尤其是在科学计算、可视化处理和商业数据模型分析等方面。例如,3B系列芯片被广泛运用在航天、生物信息、气象等领域。此外,龙芯2号处理器在设计上采用了四发射超标量超流水结构,实现了高效的浮点运算速度,其性能已经达到PentiumⅢ的水平。
在军用电子系统中,龙芯3A多核处理器也显示出其优越性。该处理器能够支持图像处理、串口、SATA、网口、USB等多种接口和PMC接口扩展,满足军用电子系统的综合化、集成化、小型化、低功耗和国产化等要求。
云计算领域也是龙芯处理器的一个重要应用场景。基于龙芯多核处理器的云计算节点机展示了高密度、高性能功耗比的优点,为云计算系统提供了坚实的基础。
在网络安全领域,基于龙芯CPU的高性能防火墙转发性能研究表明,该技术能够提高转发性能,满足网络安全需求,同时符合国家自主创新政策。此外,龙芯处理器还被应用于安全互联设备中,通过恶意代码检测、可信行为检测和可信数据检测等技术,提高工业控制系统的安全性。
龙芯处理器在高性能计算、军用电子系统、云计算、网络安全和工业控制系统等多个领域展现出了显著的性能优势。

六、龙芯处理器的技术创新和自主研发过程中遇到的主要技术难题是什么?

龙芯处理器在技术创新和自主研发过程中遇到的主要技术难题主要包括以下几个方面:
  1. 功能部件设计的复杂性:龙芯2号处理器的功能部件设计涉及到从算法到物理设计的多个层次。例如,龙芯2号处理器实现了完整的MIPS定点和浮点指令集,以及类MMX自定义多媒体指令集。此外,还需要考虑数据通路复用等问题,这些都增加了设计的复杂性和难度。
  2. 性能优化:为了提高处理器的性能,需要对系统软件进行优化。例如,解决Cache别名问题、减小TLB失效的性能损失等。这些优化措施对于提升处理器与应用程序之间的接口效率至关重要。
  3. 安全性问题:在嵌入式系统中,安全性是一个重要的考虑因素。龙芯处理器在自主研发过程中,需要考虑如何构建基于虚拟技术的嵌入式可信平台。这包括使用SHA-1引擎增强可信引导程序和内核模块,以及设计信任链传递模型等。这些措施旨在提高系统的安全性,同时不增加额外硬件成本。
龙芯处理器在技术创新和自主研发过程中面临的主要技术难题包括功能部件设计的复杂性、性能优化以及安全性问题。

七、龙芯处理器与国际同类产品相比,在性能和成本方面的竞争力如何?

龙芯处理器在性能和成本方面的竞争力可以从几个不同的角度进行分析。

首先,从性能角度来看,龙芯处理器已经成功应用于多款智能终端产品和工业手持设备中,显示出其在特定应用场景下的高性能。此外,龙芯3A5000处理器内置硬件加密模块,支持商用密码SM2/3/4,其运算速度和吞吐量与其他市面上主流处理器进行了比较,表明其在安全性和处理能力方面具有竞争力。我搜索到的资料表明,龙芯处理器在特定领域和任务中能够提供强大的性能。

其次,从成本效益角度来看,龙芯处理器通过系统级功耗优化,如动态频率调整策略和CPU空闲机制,能够有效降低能耗,这对于移动智能终端等体积重量有限的设备尤为重要。此外,通过采用FPGA串联在龙芯CPU和即将适配的多组芯片组之间的架构,不仅提高了系统的灵活性,还节省了重复研发主板的成本,这有助于降低整体成本。

然而,也需要注意到,尽管龙芯处理器在某些方面表现出色,但在全球范围内与国际同类产品相比,其市场认知度和广泛应用可能仍有限。这可能会影响其在更广泛市场中的竞争力。

龙芯处理器在性能和成本方面具有一定的竞争力,特别是在特定的应用场景和任务中。

八、龙芯处理器的安全性特点和技术是如何实现的,特别是在抗辐照加固设计方面?

龙芯处理器的安全性特点和技术主要通过抗辐照加固设计来实现,尤其是在纳米工艺下,集成电路的可靠性问题变得更加严峻。随着半导体技术的发展,晶体管特征尺寸的不断缩小和供电电压的降低导致电路节点电容减小,从而使得电路节点的逻辑状态发生翻转所需的临界电荷降低,使得电路更容易受到辐射效应的影响。

在抗辐照加固设计方面,有几种主要的技术和方法被提出和应用。首先是三模冗余(TMR)锁存器,这是一种常见的抗单粒子翻转技术,它通过使用三个独立的存储单元来检测和纠正可能的错误,从而提高了系统的可靠性。例如,TMR-2D1R锁存器由一个RHM单元、两个D-latch单元和一个多数表决器组成,能够部分容忍双点翻转,而TMR-1D2R锁存器则能够完全容忍双点翻转。

此外,还有基于门控时钟技术的抗单粒子翻转加固锁存器结构,这种方案不仅具有较低的性能开销,而且具有快速的软错误自恢复能力。还有采用脉冲过滤技术和冗余采样技术的加固锁存器结构,这种结构能同时具有抗单粒子翻转和抗单粒子瞬态能力。

在材料和工艺方面,也有研究提出了使用高辐射耐受性的固态设备和在制造技术中使用放射性材料(如铀二氧化物)来提高电子设备的稳定性。此外,还有研究强调了在空间辐射环境中使用电子元器件的必要性,以及影响抗辐照加固性能的主要因素。

总之,龙芯处理器的安全性特点和技术通过综合运用各种抗辐照加固设计方法,如三模冗余锁存器、门控时钟技术、脉冲过滤技术等,以及采用特殊材料和工艺,有效地提高了集成电路在面对辐射效应时的可靠性和稳定性。

九、龙芯处理器未来的发展规划和目标是什么?

龙芯处理器的未来发展规划和目标主要集中在提升其在军用装备中的应用效率和产业化能力。龙芯处理器正在被用于开发一款国产化通用处理平台,这个平台将采用FPGA来桥接硬件架构,并适配国产实时操作系统和掉电保护文件系统。这表明龙芯处理器未来的发展重点是提高其与其他技术的兼容性和集成度,以支持更广泛的应用场景。
此外,龙芯处理器的研发还注重于实现多型号产品的一套解决方案,这包括使用统一的设计原理、印制板、配置项和检测设备,以实现快速批量生产。这种方法不仅可以降低成本,还能提高生产效率和产品质量,从而满足军用装备快速增长的需求。
获取信创相关资料,请关注公众号“程序员Style”回复“信创”免费领取!欢迎留言交流。

往期推荐

信创 | 什么是"信创"?如何规划信创建设?

信创 | 已支持信创的软件、硬件都有哪些?

信创 | 信创微服务平台建设指南!

信创 | 信创行业政策解读与影响评估!

信创 | 信创产业的未来发展前景如何?

信创 | 已支持信创化的数据库都有哪些?

信创 | 信创产品行业有哪些?已取得了哪些进展?



信创 | 信创云平台有哪些优势?该如何选择使用?

请使用浏览器的分享功能分享到微信等