点击蓝字“程序员Style”关注,并置顶公众号
每日技术干货,第一时间送达!
一、充分考虑兼容需求的自主指令系统——龙架构(LoongArch™)
2020年,龙芯中科基于二十年的CPU研制和生态建设积累推出了龙架构(LoongArch™),包括基础架构部分和向量指令、虚拟化、二进制翻译等扩展部分,近2000条指令。
龙架构具有较好的自主性、先进性与兼容性。
龙架构从整个架构的顶层规划,到各部分的功能定义,再到细节上每条指令的编码、名称、含义,在架构上进行自主重新设计,具有充分的自主性。
龙架构摒弃了传统指令系统中部分不适应当前软硬件设计技术发展趋势的陈旧内容,吸纳了近年来指令系统设计领域诸多先进的技术发展成果。同原有兼容指令系统相比,不仅在硬件方面更易于高性能低功耗设计,而且在软件方面更易于编译优化和操作系统、虚拟机的开发。
龙架构在设计时充分考虑兼容生态需求,融合了各国际主流指令系统的主要功能特性,同时依托龙芯团队在二进制翻译方面十余年的技术积累创新,能够实现多种国际主流指令系统的高效二进制翻译。龙芯中科从 2020 年起新研的 CPU 均支持LoongArch™。
先进性:吸收近年来指令集发展的先进技术成果,提高代码效率
兼容性:融合X86、ARM等的主要特点,高效支持二进制翻译
模块化:基础部分、二进制翻译、虚拟化、向量化
扩展性:指令槽留有余地,利于今后的持续演进
龙架构已得到国际开源软件界广泛认可与支持,正成为与X86/ARM并列的顶层开源生态系统。已向GNU组织申请到ELF Machine编号(258号),并获得Linux、Binutils、GDB、.NET、GCC、LLVM、Go、Chromium/V8、Mozilla / SpiderMonkey、FFmpeg、libyuv、libvpx、OpenH264、SRS等音视频类软件社区、UEFI(UEFI规范、ACPI规范)以及国内龙蜥开源社区、欧拉openEuler开源社区的支持。
二、龙芯产品及应用场景
“龙芯”系列芯片是由中国科学院中科技术有限公司设计研制的,采用LoongArch架构,具有自主知识产权,产品现包括龙芯1号小CPU、龙芯2号中CPU和龙芯3号大CPU三个系列,此外还包括龙芯7A1000桥片。龙芯1号系列32/64位处理器专为嵌入式领域设计,主要应用于云终端、工业控制、数据采集、手持终端、网络安全、消费电子等领域,具有低功耗、高集成度及高性价比等特点。
龙芯3A6000
龙芯3A5000
龙芯3A5000/3B5000是面向个人计算机、服务器等信息化领域的通用处理器,基于龙芯自主指令系统(LoongArch®)的LA464微结构,并进一步提升频率,降低功耗,优化性能。在与龙芯3A4000处理器保持引脚兼容的基础上,频率提升至2.5GHz,功耗降低30%以上,性能提升50%以上。龙芯3B5000在龙芯3A5000的基础上支持多路互连。
龙芯3C5000
面向服务器领域的通用处理器,片上集成16个高性能LA464处理器核,采用全新的龙芯自主指令系统(LoongArch ®),在兼容龙芯3C5000L主板设计的基础上,调整优化了封装形式,保持了系统和应用软件的兼容性。
龙芯3C5000L
龙芯3C5000L是龙芯中科专门面向服务器领域的通用处理器。基于龙芯3A5000处理器,片上集成共16个高性能LA464处理器核,采用全新的龙芯自主指令系统(LoongArch®),在提高集成度的同时保持系统和软件与龙芯3A5000完全兼容。
龙芯3D5000
龙芯3D5000是一款面向服务器市场的32核CPU产品,由两个3C5000的硅片封装在一起。龙芯3D5000集成了32个LA464处理器核和64MB片上共享缓存,支持8个满足DDR4-3200规格的访存通道,可以通过5个高速HyperTransport接口连接I/O扩展桥片和构建单路/双路/四路服务器系统,单机系统最多可支持四路128核。龙芯3D5000片内还集成了安全可信模块功能。龙芯3D5000采用LGA-4129封装形式,芯片尺寸为75.4mm×58.5mm×6.5mm,频率支持2.0GHz以上,典型功耗160W,TDP功耗不超过300W。单路和双路服务器的SPEC CPU2006 Base实测分值分别超过400分和800分,四路服务器的SPEC CPU2006 Base分值可以达到1600分。
龙芯2K2000

龙芯2K1500

龙芯2K0500
龙芯2K0500是一款高集成度处理器芯片,主要面向工控互联网应用、打印终端、BMC等应用场景。片内集成64位LA264处理器核、32位DDR3控制器、2D GPU、DVO显示接口、两路PCIe2.0、两路SATA2.0、四路USB2.0、一路USB3.0、两路GMAC、PCI总线、彩色黑白打印接口、HDA及其他常用接口。此外,芯片实现ACPI、DVFS/DPM动态电源功耗管理等低功耗技术,支持多种电源级别和唤醒方式,可根据具体应用场景对芯片部分功能和高速接口进行动态时钟、电源开关控制,满足工控、网络安全等应用领域低功耗应用需求。
龙芯2P0500

龙芯1C103
芯片集成片上Flash、ATIM、GTIM、ADC、SPI、I2C、UART、RTC等功能模块,可输出带有死区的互补PWM信号,具备驱动舵机、有刷电机、无刷电机的原生支持,同时具备常见的通讯模块。龙芯1C103采用QFN32封装形式,芯片尺寸4.0mm*4.0mm。芯片尺寸小,各引脚可根据需求进行复用,应用场景灵活,可以满足高性价比的常见电机应用。产品主要应用于筋膜枪、修枝机、电锯、电扳手、跳绳机、风扇、汽车电子等。
龙芯1D100
龙芯1D100是超声波水表、热表和气表测量专用MCU芯片,集成CPU、FLASH、时间测量单元(TDC)、超声波脉冲发生器、温度测量单元(THSENS)、SPI、I2C、UART、MBUS、段式LCD控制器、ADC、RTC、空管检测、断线检测等功能模块。采用QFP80封装,休眠电流低于10μA,具备时差测量精度高、外设功能丰富、低功耗等特点,配合完善的编程、仿真、调试环境,大幅简化超声波流量测量系统的软硬件设计。
龙芯7A2000
龙芯 7A2000 是面向服务器及个人计算机领域的第二代龙芯 3 号系列处理器配套桥片。龙芯 7A2000 在第一代桥片7A1000 的基础上进行了优化升级。首先PCIE、USB 和 SATA 均升级为 3.0;其次显示接口升级为 2 路 HDMI 和1路 VGA,可直连显示器;另外内置一个网络 PHY,直接提供网络端口输出;此外片内首次集成了自研GPU,采用统一渲染架构,搭配32位DDR4显存接口,最大支持16GB显存容量。
龙芯7A1000
龙芯7A1000是面向服务器及个人计算机领域的龙芯3号系列处理器配套桥片。该桥片集成一路HT3.0用于连接龙芯3号系列处理器,其他的主要外围接口包括三路x8PCIE2.0、两路x4PCIE2.0、三路SATA2.0、六路USB2.0、两路DVO及其它各种小接口,可以满足部分服务器及个人计算机领域应用需求,并为其扩展应用提供相应的接口。
三、龙芯解决了几大技术难题
全球芯片行业都在探讨以成熟工艺生产性能先进的芯片,为此Intel、台积电等组建了chiplet联盟,拥有最先进工艺的台积电也加入这个联盟,就在于全球芯片行业越来越难以承受先进工艺的超高成本。
从7纳米工艺开始,芯片制造就需要采用EUV光刻机,而EUV光刻机的价格已是DUV光刻机的数倍以上,到了3纳米工艺需要采用第二代EUV光刻机,第二代EUV光刻机的价格更是第一代EUV光刻机的3倍。
成本的急剧上涨,让最有钱的苹果都吃不消,因此苹果仅是在售价近9000的iPhone15Pro系列采用了A17处理器,而iPhone15、iPhone15plus则继续采用了4纳米的A16处理器;也正是3纳米工艺的成本太高,高通、联发科等都已放弃了3纳米工艺。
四、龙芯为国产芯片开辟新道路
五、龙芯处理器在哪些具体应用领域表现出了显著的性能优势?
六、龙芯处理器的技术创新和自主研发过程中遇到的主要技术难题是什么?
功能部件设计的复杂性:龙芯2号处理器的功能部件设计涉及到从算法到物理设计的多个层次。例如,龙芯2号处理器实现了完整的MIPS定点和浮点指令集,以及类MMX自定义多媒体指令集。此外,还需要考虑数据通路复用等问题,这些都增加了设计的复杂性和难度。 性能优化:为了提高处理器的性能,需要对系统软件进行优化。例如,解决Cache别名问题、减小TLB失效的性能损失等。这些优化措施对于提升处理器与应用程序之间的接口效率至关重要。 安全性问题:在嵌入式系统中,安全性是一个重要的考虑因素。龙芯处理器在自主研发过程中,需要考虑如何构建基于虚拟技术的嵌入式可信平台。这包括使用SHA-1引擎增强可信引导程序和内核模块,以及设计信任链传递模型等。这些措施旨在提高系统的安全性,同时不增加额外硬件成本。
七、龙芯处理器与国际同类产品相比,在性能和成本方面的竞争力如何?
龙芯处理器在性能和成本方面的竞争力可以从几个不同的角度进行分析。
首先,从性能角度来看,龙芯处理器已经成功应用于多款智能终端产品和工业手持设备中,显示出其在特定应用场景下的高性能。此外,龙芯3A5000处理器内置硬件加密模块,支持商用密码SM2/3/4,其运算速度和吞吐量与其他市面上主流处理器进行了比较,表明其在安全性和处理能力方面具有竞争力。我搜索到的资料表明,龙芯处理器在特定领域和任务中能够提供强大的性能。
其次,从成本效益角度来看,龙芯处理器通过系统级功耗优化,如动态频率调整策略和CPU空闲机制,能够有效降低能耗,这对于移动智能终端等体积重量有限的设备尤为重要。此外,通过采用FPGA串联在龙芯CPU和即将适配的多组芯片组之间的架构,不仅提高了系统的灵活性,还节省了重复研发主板的成本,这有助于降低整体成本。
然而,也需要注意到,尽管龙芯处理器在某些方面表现出色,但在全球范围内与国际同类产品相比,其市场认知度和广泛应用可能仍有限。这可能会影响其在更广泛市场中的竞争力。
龙芯处理器在性能和成本方面具有一定的竞争力,特别是在特定的应用场景和任务中。
八、龙芯处理器的安全性特点和技术是如何实现的,特别是在抗辐照加固设计方面?
龙芯处理器的安全性特点和技术主要通过抗辐照加固设计来实现,尤其是在纳米工艺下,集成电路的可靠性问题变得更加严峻。随着半导体技术的发展,晶体管特征尺寸的不断缩小和供电电压的降低导致电路节点电容减小,从而使得电路节点的逻辑状态发生翻转所需的临界电荷降低,使得电路更容易受到辐射效应的影响。
在抗辐照加固设计方面,有几种主要的技术和方法被提出和应用。首先是三模冗余(TMR)锁存器,这是一种常见的抗单粒子翻转技术,它通过使用三个独立的存储单元来检测和纠正可能的错误,从而提高了系统的可靠性。例如,TMR-2D1R锁存器由一个RHM单元、两个D-latch单元和一个多数表决器组成,能够部分容忍双点翻转,而TMR-1D2R锁存器则能够完全容忍双点翻转。
此外,还有基于门控时钟技术的抗单粒子翻转加固锁存器结构,这种方案不仅具有较低的性能开销,而且具有快速的软错误自恢复能力。还有采用脉冲过滤技术和冗余采样技术的加固锁存器结构,这种结构能同时具有抗单粒子翻转和抗单粒子瞬态能力。
在材料和工艺方面,也有研究提出了使用高辐射耐受性的固态设备和在制造技术中使用放射性材料(如铀二氧化物)来提高电子设备的稳定性。此外,还有研究强调了在空间辐射环境中使用电子元器件的必要性,以及影响抗辐照加固性能的主要因素。
总之,龙芯处理器的安全性特点和技术通过综合运用各种抗辐照加固设计方法,如三模冗余锁存器、门控时钟技术、脉冲过滤技术等,以及采用特殊材料和工艺,有效地提高了集成电路在面对辐射效应时的可靠性和稳定性。
九、龙芯处理器未来的发展规划和目标是什么?

往期推荐