admin管理员组

文章数量:1594590

1.NVDLA简介

英伟达深度学习加速器(NVDLA)是一种免费开放式架构,NVDLA具有可扩展性,高度可配置性,旨在简化集成和可移植性。NVDLA软件生态系统包括一个设备上的软件堆栈(开源版本的一部分),一个完整的培训基础架构,用于构建包含深度学习的新模型,以及将现有模型转换为可在设备上使用的形式的解析器软件。可以提供其自己的硬件平台以及软件内核

  • 硬件架构:基于Xavier–全球首款专为汽车产品设计的自动处理器 - 以及完整的验证套件。
  • 基于开放行业标准的IP核模型提供:Verilog模型是RTL形式的综合和仿真模型,TLM SystemC仿真模型可用于软件开发,系统集成和测试。

2.硬件架构

2.1硬件简介

NVIDIA®深度学习加速器(NVDLA)是一种可配置的固定功能硬件加速器,适用于深度学习应用程序中的推理操作。通过展示加速与每个CNN层相关的操作的各个构建块(例如,卷积,反卷积,完全连接,激活,池化,本地响应归一化等),为卷积神经网络(CNN)提供全硬件加速。保持独立且可独立配置的块意味着NVDLA的尺寸可以适用于许多较小的应用。
NVDLA架构中的每个块都支持特定的操作,这些操作对于深度神经网络的推理是不可或缺的。推理操作分为五组:

  • 卷积运算(卷积核心和缓冲区块)
    卷积模式有很多种支持:直接卷积、图像输入卷积模式、Winograd卷积模式、批量卷积模式、卷积缓冲区
  • 单数据点操作(激活引擎块)
    单数据点操作支持:线性函数、非线性函数
  • 平面数据操作(池化引擎块)
    池化功能支持:maximum-pooling - 从池窗口获取最大值、最小池 - 从池窗口获取最小值、average-pooling - 池化窗口中的特征值的平均值
  • 多平面操作(本地和标准块)
  • 数据存储器和重塑操作(重塑和桥接DMA模块)
    桥DMA(

本文标签: nvdlainvestigate