英特尔FPGA深度学习加速(DLA)套件

news/2024/9/17 3:26:01
英特尔FPGA深度学习加速(DLA)套件
    英特尔FPGA的DLA加速套件,如图11-17所示。
图11-17 英特尔FPGA的DLA加速套件
深度学习部署工具包(DLDT)中的推理引擎,提供了一个高级的设备无关API来编程推理。这是一些示例代码,如图11-18所示。
图11-18 深度学习部署工具包(DLDT)中的推理引擎示例代码
推理引擎加载用户提供的IR并调用相应的插件来处理特定设备的推理,如图11-19所示。
图11-19 推理引擎加载用户提供的IR并调用相应的插件来处理特定设备的推理
对于FPGA,它调用了DLA(深度学习加速)运行时引擎,如图11-20所示。
图11-20 FPGA调用了DLA(深度学习加速)运行时引擎
如图11-21,驱动加速器中DL模型的执行。
图11-21 驱动加速器中DL模型的执行
部署DNN模型是一个软件过程。FPGA已经预先编程了一个为DLA运行DL模型而设计的比特流。不需要FPGA编译。如图11-22所示。
图11-22 FPGA已经预先编程了一个为DLA运行DL模型而设计的比特流
这里是DLA 运行时用于运行DL模型的DLA架构。该架构包含卷积PE(处理元素)阵列、用于存储特征图和 DL 中常用的层(组件)的缓存,如图11-23所示。
图11-23 DLA 运行时用于运行DL模型的DLA架构
将DNN模型映射到这个加速引擎架构中。许多DL模型,如AlexNet,包含高度相似的层序列组,例如卷积层后跟ReLU、归一化和最大池化。如图11-24所示。
 
图11-24 将DNN模型映射到这个加速引擎架构中
在FPGA内部DL层是由配置的互连链接的块实现的,如图11-25所示。
图11-25 在FPGA内部DL层是由配置的互连链接的块实现的
要运行一组层,创建一个数据流并通过负责特定类型DL层的块传递它。要执行整个模型,重复流式循环以处理下一组,直到所有DNN层都被处理。如图11-26所示。
图11-26 创建一个数据流并通过负责特定类型DL层的块传递
这些块在运行时高度可重构且可绕过。这使得深度学习层(DL)的不同设计参数(如CNN步幅)或跳过不需要的层成为可能。如图11-27所示。
图11-27 在运行时高度可重构且可绕过
首先,视频数据从DDR(双数据率)通道到达,如图11-28所示。
图11-28 视频数据从DDR(双数据率)通道到达
如果视频数据太大而无法存储在芯片上的流缓存中,则将其切片并在多个流水线迭代中逐个传递。在每个迭代中,数据从缓存中提取并通过卷积PE阵列(PE-处理元素)和激活块进行处理。然后通过交叉开关(XBAR)传递给其他块,例如标准化和最大池化。然后将数据反馈到流缓存中,以供下一组层使用。一旦整个模型处理完毕,就会将其写回内存并继续处理下一片数据。以图11-28表总结了深度学习加速器(DAL)引擎用于执行DL模型的图循环架构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/57842.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

推理引擎流程

推理引擎流程 总结一下推理引擎(IE)调用FPGA设备的流程。开发人员通过IE通用API进行推理调用,IE调用FPGA插件,这调用了运行OpenCL运行时的DLA(英特尔深度学习加速器)。最终发送到实现基元(如卷积、ReLU等)的DLA FPGA IP。如图11-28所示。图11-28 推理引擎(IE)调用FPG…

企业管理系统-ERP开发

Enterprise Resource Planning 基于.NET FW 4.8.1开发的ERP系统,以 HandyControl 作为设计参考。 目的 初衷在于学习C#开发。自己设定了一个学习的目标,朝着WPF的方向前进,开发一个能媲美于公司管理系统的Windows客户端(前公司的企业管理系统使用的是Office Access VBA开发…

Exception in thread main java.io.IOException :could not find resource xxxxx.xml

错误如下: 错误原因:(无法正确识别项目中的Resources目录或者java目录的配置文件) 1. resource不是资源目录了 2.配置文件在java目录下 或者这样 解决方法: 1. 在项目结构中将resource选择为资源文件 2. 查看pom文件的build ,如果指定了资源文件是java目录而忘记了指定re…

24.9.7——小学期开发实记

今天完成了基础信息的CRUD,但是遇到了一个关于JAVA Spring Boot注入的问题。 问题如下: Error:(20, 34) Could not autowire. No beans of workCenterInfoMapper type found.@Autowired private workCenterInfoMapper workCenterInfoMapper; 我改成:@Resource private workC…

2024软件工程第一次个人作业

这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzu/SE2024/这个作业要求在哪里 https://edu.cnblogs.com/campus/fzu/SE2024/homework/13243这个作业的目标 初步认识博客园和GIthub平台,初步了解软件工程学科的任务学号 102201622一、个人logo文生图任务 使用工具:Op…

Gitness 基础安装

对gitness最基本的安装以及从Github配置token获取源码仓库的相关配置。目录Docker 安装注册账户创建项目导入已有仓库配置 Github Token同步源代码仓库 官方链接Gitness was the next step in the evolution of Drone, from continuous integration to source code hosting, br…

Gradle下载太慢? Gradle官方最全版本极速下载网址

Gradle下载太慢? Gradle官方最全版本极速下载地址 Gradle简介 Gradle 作为一种开源的构建工具,理论上可以开发所有应用,在 Java 应用程序的构建与发布方面起着极大的助力作用。Gradle能够为开发者构建应用程序提供有力支持,这不仅对自动化测试大有益处,还能实现分发构建,…