Kneron新一代终端人工智能处理器 效能提升3倍

2018-09-14 18:02:43来源: a&s智慧生活

[摘要] 运算效能大幅提升3倍,最高可达5.8 TOPS

  2018年9月14日,专注于终端人工智能解决方案的新创公司耐能 (Kneron) 参与在上海举行的 Arm 人工智能开发者全球峰会,以“可重构算法在AI芯片中的应用”为主题发表演说,会中同时发布 Kneron 新一代终端人工智能处理器系列 NPU IP - KDP Series。Kneron 第二代 NPU IP 包括三大产品,分别为超低功耗版 KDP 320、标准版 KDP 520、以及高效能版 KDP 720。全系列产品的功耗低于0.5瓦(W),采用新的架构设计让运算更具弹性,整体效能相较于上一代产品大幅提升达3倍,运算能力 (peak throughput) 最高可达5.8 TOPS(每秒万亿次运算)(註一)。

  Kneron 创始人兼 CEO 刘峻诚表示:“Kneron 推出为终端装置所设计的人工智能处理器 NPU IP 后,其超低功耗的优势受到市场高度关注。Kneron 新一代 NPU 产品在诸多方面取得显著的突破,基于第一代产品的优势,我们改善数据运算流程、提升整体运算效能与储存资源使用率,同时针对不同的神经网络模型进行优化,让 NPU 可以更广泛地应用在各种终端装置,并满足更复杂的运算需求。”

  Kneron NPU IP 可应用在智能手机、智能家居智能安防、以及各种物联网设备上,让终端装置在离线环境下就能运行各种神经网络。Kneron 第二代 NPU IP 采用新的交错式运算架构 (Interleaving computation architecture) 设计,缩短运算流程和提升效率。深度压缩 (Deep compression) 技术让压缩功能从模型层级深入至数据和参数层级,使压缩率再提升。动态储存资源分配功能提升储存资源利用率,却不影响运算效能。此外,支持更广泛的卷积神经网络 (Convolutional Neural Networks, CNN) 模型,并针对各种 CNN 模型分别进行优化,在不同神经网络模型下,可提升约1.5倍至3倍不等的效能。

  第二代 NPU IP-KDP Series 重点技术说明:

  交错式运算架构设计:透过交错式架构,让神经网络架构中主要的卷积 (convolution) 与池化 (pooling) 运算可平行进行,以提升整体运算效率。在新的卷积层中,还可同时支持 8bits 与 16bits 的定点运算 (fixed point),让运算更有弹性。

  深度压缩技术:不仅能执行模型压缩,还能对运行中的数据和参数 (coefficient) 进行压缩,减少内存使用。模型大小可压缩至50分之一以下,准确度的影响率小于1%。

  动态储存资源分配:让共享内存 (shared memory) 和运作内存 (operating memory) 之间可以进行更有效的资源分配,提升储存资源利用率的同时却不影响运算效能。

  CNN模型支持优化:支持更广泛的 CNN 模型,包括 Vgg16、Resnet、GoogleNet、YOLO、Tiny YOLO、Lenet、MobileNet、Densenet 等,而且针对不同 CNN 模型分别进行优化,在不同神经网络模型下,相較上一代產品提升约1.5倍至3倍效能。

  注一:运算效能会因纳米制程不同而异。5.8 TOPS 为 KDP720 在 28 纳米制程、600 MHz、8bit fixed points 下的效能表现,预测运行功耗在 300-500mW(估计每瓦效能为13.17 TOPS/W)


0
[责任编辑:黄文凤]

安全自动化 官方微信    as视界 服务号

不得转载声明: 凡文章来源标明“安防知识网”的文章著作权均为本站所有,禁止转载,除非取得了著作权人的书面同意且注明出处。违者本网保留追究相关法律责任的权利。

专栏
我要投稿
文章排行榜
杂志
  • 安全&自动化2023年9-10月 第261期
    2023年11月第261期
    2022-2023年,全球经济前景的“不确定性”正在对安防与其他行业产生着重大的影响,通货膨胀、供应链挑战、地缘政治冲突、全球劳动力市场结构变化……不稳定的经济环境在很大程度上给全球安防行业的发展带来了极大的阻力。2022年国内安防市场保持着增长,但增速放缓,2023年国内宏观经济呈现复苏态势,市场需求有所回暖,但由于国内政府财政收支减少、部分项目进展缓慢、房地产市场下滑、企业端市场投资信心减弱等因素,给安防企业带来持续挑战。