搜索

中国航空工业集团公司北京长城航空测控技术研究所《测控技术》杂志社版权所有
地址:北京市亦庄经济技术开发区经海二路航空工业科技商务园9号楼 邮编:101111 
编辑部:010-65667497;
广告部:010-65667357;

发行部:010-65667497;
网管部:010-65667357;

扫码关注微信公众号

本网站为《测控技术》指定官方网站

Coypright◎2012-2018 北京长城航空测控技术研究所      京ICP备09097201号-2

按应用领域分类

按应用领域分类

按应用领域分类

测控技术

TE新款NanoRF模块及触点密度两倍于VITA 67射频模块
研华全新推出整机IP66防护等级集成控制工业平板电脑 SPC-800系列
Pico Technology 拓展基于 PC 的混合信号示波器产品系列
研华推出全新AIR系列边缘AI推理产品
Spectrum仪器推出用于智能道路雷达探测的数字化仪
NI携手孤波,助力韦尔半导体建立从实验室验证到量产的标准化测试流程
康泰克最新推出4种-20至60°C的宽动作范围的CONPROSYS™ nano系列I/O模块
西门子推出PSU8600单相主电源模块,易于诊断和系统配置

知识工程

微视频

威图集装箱数据中心 | 蒂森克虏伯数字化转型之路
云端之上光景无限—研华助力光伏扶贫破解运维难题
福禄克电动汽车驱动系统检测应用案例
德国威图自动化系统—布线装配工艺解决方案
贸泽与Molex联手推出定制电缆组装器开发量身定制的电缆解决方案
技术创新,美丽升级: 倍福 XTS 助力欧莱雅实现柔性制造
威图产品配置系统(RiCS)介绍
发布时间:
2020-05-22 10:38
德国威图自动化系统—线缆处理解决方案

测控技术

知识工程

微视频

威图集装箱数据中心 | 蒂森克虏伯数字化转型之路
云端之上光景无限—研华助力光伏扶贫破解运维难题
福禄克电动汽车驱动系统检测应用案例
德国威图自动化系统—布线装配工艺解决方案
贸泽与Molex联手推出定制电缆组装器开发量身定制的电缆解决方案
技术创新,美丽升级: 倍福 XTS 助力欧莱雅实现柔性制造
威图产品配置系统(RiCS)介绍
发布时间:
2020-05-22 10:38
德国威图自动化系统—线缆处理解决方案

测控技术

知识工程

微视频

中国航空工业集团公司   中航高科智能测控有限公司  北京瑞赛长城航空测控技术有限公司   中国航空工业技术装备工程协会  中国航空学会

中国航空工业集团公司北京长城航空测控技术研究所 《测控技术》杂志社版权所有
地址:北京市亦庄经济技术开发区经海二路航空工业科技商务园9号楼 邮编:101111 
编辑部:010-65667497;
广告部:010-65667357;

发行部:010-65667497;
网站管理部:010-65665345

基于异构多核人工智能芯片的低功耗架构设计

浏览量
【摘要】:
摘要:本文综述了欧比特公司面向宇航应用而设计的SPARC异构多核人工智能芯片(简称“欧比特AI芯片”),阐述了欧比特AI芯片异构实现方法及低功耗控制方法。欧比特AI芯片采用先进成熟的异构架构,通过AMBA3.0总线协议实现不同功能模块的互联互通;通过插入低功耗控制电路实现低功耗设计目的;欧比特AI芯片配置4个核高性能SPARC V8内核,具备二级缓存控制,数据吞吐能力巨大;同时该芯片还具备丰富的片

基于异构多核人工智能芯片的低功耗架构设计

张志国,唐芳福,韩俊

珠海欧比特宇航科技股份有限公司,珠海 519080

摘要:本文综述了欧比特公司面向宇航应用而设计的SPARC异构多核人工智能芯片(简称“欧比特AI芯片”),阐述了欧比特AI芯片异构实现方法及低功耗控制方法。欧比特AI芯片采用先进成熟的异构架构,通过AMBA3.0总线协议实现不同功能模块的互联互通;通过插入低功耗控制电路实现低功耗设计目的;欧比特AI芯片配置4个核高性能SPARC V8内核,具备二级缓存控制,数据吞吐能力巨大;同时该芯片还具备丰富的片上外设及实现人工智能算法的AI处理器单元;

关键词:SPARC V8 处理器;AI处理器单元;UPF低功耗设计;

中图分类号:文献标识码:

文章编号:

Design of Low-power architecture based on heterogeneous multi-core AI chip

Zhang ZhiGuoTang FangFuHanJun

Zhuhai Orbita Aerospace Science&Technology Co.,Ltd., Zhuhai 519080, China

Abstract:In this paper reviews the SPARC heterogeneous multi-core artificial intelligence chip (OBT AI CHIP) designed for aerospace applications, and describes the OBI AI chip heterogeneous implementation method and low power control method. The artificial intelligence OBT AI chip adopts advanced and mature heterogeneous architecture, realizes interconnection and intercommunication of different functional modules through AMBA3.0 bus protocol; achieves low-power design by inserting low-power control circuit; OBT AI chip is equipped with 4 core high-performance SPARC V8 cores With L2 cache control, the data throughput is huge; at the same time, the chip also has a rich on-chip peripherals and an AI processor unit that implements artificial intelligence algorithms;

Key wordsSPARC V8AIUPF

 

1.  概述

随着集成电路工艺技术的不断发展,工艺尺寸不断刷新更小的极限,导致采用大容量、异构多核处理器(Multi-core Processor)成为一种更加降低成本、更加有效的高性能嵌入式处理器系统设计途径。将多个具有相同或者不同功能、不同结构的微处理器核,以一种有效的方式集成在同一个芯片中,并以有效的划分方式将应用程序分配给不同的微处理器核或是协处理器进行并行处理,从而提高整个系统的并行处理事件的性能。

人工智能科学的发展,促进了AI芯片的需求量成倍增长;而人工智能AI处理单元作为异构多核芯片中的重要组成部分,主要负责通过不断的学习,运用各种神经网络卷积算法,在后台里帮助用户完成各种复杂情景的预判功能,提前预测客户的需求,并主动给出用户需求的互动信息。

由于异构多核人工智能芯片里包含4个高性能CPU,一个AI协处理器,JPEG2000处理单元,还有大量的外设工作模块,因此在保障整个系统数据吞吐量满足的要求下,控制整个芯片的功耗是芯片设计成功与否的关键。虽然芯片整体功能比较复杂,但针对不同的应用场景,部分模块在特定应用中不会用到,因此在芯片设计中考虑将部分模块进行关电控制处理,同时对相关交互信号进行隔离处理,达到了降低人工智能芯片的功耗数值,提高了芯片的可靠性和整体竞争力。

2.  欧比特AI芯片的主要优势

欧比特AI芯片是欧比特公司的新一代嵌入式人工智能处理器,其聚焦于前端图像处理和信号处理,具有支持深度学习,神经网路等算法的功能模块,整个芯片通过采用支持AMBA3.0总线协议的互联互通AXI总线,实现了CPU内核+AI处理器的异构多核总线架构。

◆主要性能指标:

Ÿ   主频不低于1GHz

Ÿ   芯片功耗:<3W

Ÿ   图像信号处理:最高每秒8亿像素;

Ÿ   支持OPENCL\OPENVX\OPENCV等常用软件;

◆处理单元:

Ÿ   4个高性能,高可靠的CPU核;

Ÿ   1个神经网路AI处理器单元;

◆外围接口:

Ÿ   影像设备接口,MIPI等;

Ÿ   高速传输接口, USB/DDR3/RapidIO/Camera_link

Ÿ   低速通信接口, CAN/I2C/I2S/SPI/UART

欧比特AI芯片是全球第一款量产化的对标国际SPARC V8标准内核版本的嵌入式异构多核人工智能芯片,支持各种神经网络卷积积分的算法,其在功能及性能等方面均领先了业界的同类型产品。

 

 

3-1  欧比特AI芯片的结构框图

 

3.  异构多核架构及低功耗设计

本章将从人工智能芯片的异构多核体系设计、AI协处理器设计、低功耗设计等方面入手,详细阐述欧比特AI芯片获得高性能、低功耗设计方法和途径。

3.1 异构多核体系的设计

欧比特AI芯片SPARC V8标准协议内核之间采用对称多处理器SMPSymmetric Multi-Processor)拓扑架构,片内集成四个同构的处理器核心,各处理器核心通过片内总线互联(如图3-1所示),是AXI总线上的主设备;而AI协处理单元也是AXI总线上的主设备,可以读写任何从设备的数据,但同时受CPU内核进行控制,进行各种神经网络的卷积计算。而总线上的其他从设备为各系统资源(含片内外设、片上存储器、片外存储器、片外IO等),这些资源统一编址,被各处理器核心所平等共享。总线控制器负责对总线访问进行仲裁和管理,仲裁管理逻辑和算法包括固定优先、总线锁定、定时释放等种类,用户可以通过对寄存器的设置来选择仲裁管理逻辑和算法。

下表3-1 模块接口列表:

序列

模块

接口(主设备/从设备)

1

SPARC V8内核

AXI()

2

AI单元

AXI(主)/AHB()

3

H264/265

AXI(从)

4

JPEG2000

AXI(从)

5

DDR3控制器

AXI(从)

6

其他外设

APB

 

根据上表3-1可知,SPARCV8内核之间互连、AISPARC V8内核之间互连,主设备与从设备之间互连,都需要考虑模块与模块之间的通信问题,仲裁问题,数据吞吐量大小问题,因此需要采用高效的互连总线结构才能解决上面所有问题,因此经过多次完善,比对后,欧比特AI芯片采用了以AXI BUS 总线为主,AHB/APB总线为辅,添加了AXI/AHB bridgeAHB/APB bridge转换桥实现了异构多核总线架构体系,如图3-1所示。

这种架构统一编址以及多处理器核心共享所有资源的设计使得每个处理器核心对系统资源具有同等的访问能力,为系统负载平衡提供了可能性。此外,这种设计对用户来说是透明的,用户只需要考虑应用程序的各个任务之间的协调关系,不需考虑处理器核心之间的底层数据交互,这样可极大降低系统设计的复杂度,减轻用户的工作量,提高芯片及计算机平台的可靠性。

3.2 AI协处理模块

欧比特公司人工智能协处理单元具有自主研发的

知识产权,可以灵活配置多个GPUNN加速器,可以方便移植到任意FPGA型号中去;主要的框架如下图3-2所示:

AI芯片内部配备了4GPU核、4NN加速器;

◆主要性能指标:

 

 

GPU

NN

Number of Cores

4

4

GFLOPS(32-bit)@1GHz

32

NA

GFLOPS(16-bit)@1GHz

128

NA

GFLOPS(64-bit)@1GHz

4

NA

GOPS(16-bit)@1GHz

128

1536

GOPS(8-bit)@1GHz

256

6144

◆支持的网络模型:

Ÿ   DenseNet

Ÿ   MobileNet

Ÿ   Yolo V1 and V2

Ÿ   GoogleNet

Ÿ   VGG 16/19

Ÿ   AlexNet

Ÿ   CaffeNet

Ÿ   NIN等常见网络模型;

3.3 低功耗设计

欧比特公司在降低人工智能芯片功耗的设计上,采用了成熟UPF标准设计方法,主要是采用不同电源给不同模块供电,插入电源开关控制,插入隔离器件,实现不同处理模块供电的单独控制等方法。

◆添加电源开关控制

create_power_switch PD_01_sw \

      -domain PD_01 \

      -output_supply_port {VDD_OUT VDD_01} \

      -input_supply_port {VDD_IN VDD} \

      -control_port {PSW_CTRL psw_en_01} \

      -on_state{PSW_ON VDD_IN {PSW_CTRL}}

          -off_state {PSW_OFF {!PSW_CTRL}}

◆插入隔离器件

set_isolation PD_07_ISO_IN -domain PD_07 -no_isolation -applies_to inputs

set_isolation PD_07_ISO_OUT_LOW -domain PD_07 -isolation_power_net VDD -isolation_ground_net VSS -clamp_value 0 -applies_to outputs

set_isolation_control PD_07_ISO_OUT_LOW -domain PD_07 -isolation_signal ios_en_07             -isolation_sense high -location parent

◆综合时导入UPF文件

Load_upf  top.upf

UPF标准的原理如下图3-2所示:

3-2:低功耗设计电路

4.  结束语

综上所述,欧比特AI芯片是一款高可靠、高性能、高集成度的SPARC V8 异构多核人工智能芯片,其设计合理,片上外设资源丰富,芯片对嵌入式操作系统支持有力,包括:VxWorksLinuxRTEMSeCos,可广泛应用于航空、航天领域,特别适合于需兼顾大量运算和复杂控制的宇航电子系统。

测试结果表明当主频配置到1000MHz时,人工智能芯片功耗控制在3W以下,满足芯片设计要求。因此,在核心宇航元器件的自主、可控、高性能国产化方面,欧比特AI芯片将为我国航空航天电子系统提供强有力的技术及产品保障。

 

参考文献

[1]   J.Gaisler.LEON SPARC Processor The past, present and future. Gaisler Research.

[2]   Aeroflex Microelectronic Solutions.UT699E LEON 3FT/SPARC V8 Microprocessor Functional Manual. Nov 2014.

[3]   Quad Core LEON4 SPARC V8 Processor LEON4-N2X Data Sheet and User's Manual . Aeroflex Gaisler AB. May 2013.

[4]   颜军. SPARC 嵌入式系统设计与开发-S698系列处理器实用教程[M].中国标准出版社, 2013.

[5]   珠海欧比特控制工程股份有限公司.S698-MIL用户手册[Z]. http://www.myorbita.net/宇航芯片/SOC

[6]   珠海欧比特控制工程股份有限公司.S698-T用户手册[Z]. http://www.myorbita.net/宇航芯片/SOC

[7]   颜军. 多核处理器S698P-SOC的数据一致性[J].航天控制, 2008,Vol.26,No.5: 82-86.

[8]   国内首款抗辐射型高性能32位四核并行处理器问市.电子工程世界,201311

 

 

知识工程

按照应用领域分类

按照技术领域分类

视频展示

相关文件