一种卷积网络运算单元及可重构卷积神经网络处理器和实现图像去噪处理的方法

文档序号:9914669阅读:637来源:国知局
一种卷积网络运算单元及可重构卷积神经网络处理器和实现图像去噪处理的方法
【技术领域】
[0001] 本发明涉及图像处理领域,特别涉及一种卷积网络运算单元及可重构卷积神经网 络处理器和实现图像去噪处理的方法。
【背景技术】
[0002] 图像雨滴和灰尘的去除对于图像处理应用有重要意义,特别是视频监控和导航系 统。它可用于恢复被雨滴、灰尘污染的图像或者视频,还可作为前处理操作为后续的图像识 别或者分类提供帮助。
[0003] 当前的去除图像噪声的方法大都利用高斯滤波、中值滤波、双边滤波等方式完成, 这些方法处理效果不好,常常不能满足特定图像处理应用的需求。因此需要一个效果更好 的方法来去除图像噪声,卷积神经网络的方法成为一个不错的选择。
[0004] 当前的深度学习网络大都在GPU上运行,但是GPU价格昂贵,功耗高,并不适合大规 模的广泛应用。而在CPU上运行速度慢,运行大规模的深度学习网络效率低,无法满足性能 需求。
[0005] 可以看出目前技术对于应用卷积神经网络,主要存在的问题有:处理器面积大,成 本高,功耗大,性能差等问题。因此这就需要一个低功耗、面积小、处理效果好的可重构卷积 神经网络处理器。

【发明内容】

[0006] 本发明的目的在于提供一种卷积网络运算单元及可重构卷积神经网络处理器和 实现图像去噪处理的方法,硬件资源消耗低、面积小,能恢复被雨滴、灰尘污染的图像或者 视频。
[0007] 为了实现上述目的,本发明采用如下技术方案:
[0008] -种卷积网络运算单元,包括2个可重构分离卷积模块、非线性激活函数单元和乘 累加器单元;
[0009] 第一个可重构分离卷积模块的输出为非线性激活函数单元的输入,非线性激活函 数单元的输出为乘累加器单元的输入,乘累加器单元的输出为第二个可重构分离卷积模块 的输入;
[0010]图像信号和配置网络参数信号输入到第一个可重构分离卷积模块;第一个可重构 分离卷积模块完成16 X 16卷积运算;非线性激活函数单元完成卷积神经网络中激活函数的 运算;乘累加器单元完成卷积神经网络中的连接层的运算;第二个可重构分离卷积模块同 时完成4个8X8卷积运算;
[0011]所述乘累加器单元包括若干乘累加器和若干寄存器;其中乘累加器用于计算上一 层卷积网络的输出值与权重参数乘积的和;寄存器将上一层卷积网络的结果输入到乘累加 器中。
[0012] 进一步的,所述可重构分离卷积模块包括16个4X4可重构一维卷积模块和第一寄 存器组;第一寄存器组将图像信号和卷积网络参数输入到可重构一维卷积模块;可重构分 离卷积模块可完成1个16 X 16卷积或者同时完成4个8 X 8卷积运算;4 X 4可重构一维卷积模 块包括4个第一选择器、4个第一2输入乘法器、第一4输入加法器、4个第二2输入乘法器和第 二4输入加法器;4个第一选择器的输出端连接对应的4个第一 2输入乘法器的输入端,4个第 一 2输入乘法器的另外一个输入端为神经网络的权重;4个第一 2输入乘法器的输出端连接 第一 4输入加法器的输入端;4个第二2输入乘法器的输入为第一 4输入加法器的输出和神经 网络的权重;第二4输入加法器的输入为4个第二2输入乘法器的输出。
[0013] 进一步的,所述非线性激活函数单元包括QD产生器和运算器组;其中QD产生器的 输入为可重构分离卷积的输出,运算器组的输入为QD产生器的输出;QD产生器用于产生激 活函数所需的参数;运算器组用于计算激活函数最终的结果值;
[0014] 所述QD产生器包含一个第一除法器;输入信号输入到第一除法器,第一除法器输 出商Q和余数D;所述运算器组包含移位寄存器、2个第一加法器和第二除法器;移位寄存器 输出和为2个第一加法器的输入;2个第一加法器的输出为第二除法器的输入;移位寄存 器、第一加法器和第二除法器依次连接;
[0015] 一种可重构卷积神经网络处理器,包括总线接口、前处理单元、可重构硬件控制 器、SRAM、SRAM控制模块、输入缓存模块、输出缓存模块、存储器、数据存储器控制器和若干 权利要求1至3中任一项所述的卷积网络运算单元;总线接口连接前处理单元、数据存储器 控制器、可重构硬件控制器和输入缓存、输出缓存;存储器连接数据存储器控制器;输入缓 存连接可重构硬件控制器和SRAM控制模块;卷积网络运算单元连接输入缓存模块、输出缓 存模块;
[0016]所述的前处理单元的输入为图像或者视频信号;完成白平衡、噪声过滤等前处理 操作;
[0017] 所述的输入缓存模块、输出缓存模块分别用于缓存卷积网络运算单元的输入和输 出;
[0018] 所述的可重构硬件控制器对卷积网络运算模块进行配置,控制其运算过程;在运 算过程中或者结束时发送中断请求完成与外部系统的交互;
[0019 ]所述的SRAM控制模块用于控制卷积网络权重参数的传输。
[0020] 进一步的,包括512个卷积网络运算单元,实现基于卷积神经网络的图像去噪处 理。
[0021] 进一步的,所述一种可重构卷积神经网络处理器实现一个3层卷积神经网络,用于 去除图像或者视频中附着的雨滴和灰尘;所述的卷积神经网络第一层由512个16X16卷积 构成,第二层为神经网络连接层,第三层由512个8 X 8卷积构成。
[0022] 一种可重构卷积神经网络处理器实现图像去噪处理的方法,包括:
[0023]在图像去噪处理的过程中,随机减少卷积个数,减少硬件资源的消耗,提高处理速 度;
[0024] 或者,在图像去噪处理的过程中将16X16卷积运算单元和8X8卷积运算单元分别 分成16个和4个4 X 4的卷积模板,对每个4 X 4的卷积采用一维卷积。
[0025]相对于现有技术,本发明具有以下有益效果:卷积网络运算单元利用可重构技术, 可完成16X16卷积或者同时完成4个8X8卷积运算,提高硬件性能和灵活性。本发明利用深 度学习的方法,实现了可去除图像雨滴和灰尘的去噪处理,处理效果满足需求。本发明在不 影响处理效果的前提下,随机减少卷积网络的模板个数,而且还利用分块一维卷积的方法, 硬件资源消耗大大减少,处理速度大大提高。此处理器可实现3层的卷积神经网络,能够为 后续更高层次的图像识别、分类提供特征。相对于GPU价格昂贵,功耗高,面积大。CPU运行速 度慢,运行大规模的深度学习网络效率低。本发明采用可重构技术和上述减少模板个数和 分块一维卷积的方法,实现的可重构卷积神经网络处理器的资源消耗低、易于硬件实现,能 够恢复被雨滴、灰尘污染的图像或者视频。
【附图说明】
[0026] 图1是卷积网络运算单元的结构示意图;
[0027] 图2是非线性激活函数单元的结构示意图;
[0028] 图3是第一 4X4可重构一维卷积模块的结构示意图;
[0029] 图4是可重构分离卷积模块的结构示意图;
[0030] 图5是可重构卷积神经网络处理器的结构示意图;
【具体实施方式】
[0031] 下面结合【附图说明】和【具体实施方式】对本发明做详细说明。
[0032] 参照图1,本发明中可重构卷积神经网络处理器中所使用的卷积网络运算单元包 括2个可重构分离卷积模块、非线性激活函数单元和乘累加器单元;第一个可重构分离卷积 模块的输出为非线性激活函数单元的输入,非线性激活函数单元的输出为乘累加器单元的 输入,乘累加器单元的输出为第二个可重构分离卷积模块的输入;
[0033]图像信号和配置网络参数信号输入到第一个可重构分离卷积模块;第一个可重构 分离卷积模块完成16 X 16卷积运算;非线性激活函数单元完成卷积神经网络中激活函数的 运算;乘累加器单元完成卷积神经网络中的连接层的运算;第二个可重构分离卷积模块同 时完成4个8X8卷积运算;
[0034] 请参阅图2所示,非线性激活函数单元包括QD产生器和运算器组;其中QD产生器的 输入为可重构分离卷积的输出,运算器组的输入为QD产生器的输出;QD产生器用于产生激 活函数所需的参数;运算器组用于计算激活函数最终的结果。
[0035]本发明神经网络的激活函数为双曲正切函数
[0037]通过定义域扩展和泰勒级数展开,得到
[0039] QD产生器包含一个第一除法器,输入信号输入到第一除法器,第一除法器除以定 值0.69,输出商Q和余数D;所述运算器组包含移位寄存器、2个第一加法器和第二除法器;移 位寄存器输出和为2个第一加法器的输入;2个第一加法器的输出为第二除法器的输入;移 位寄存器、第一加法器和第二除法器依次连接;
[0040] 请参阅图3所示,4 X 4可重构一维卷积模块包括4个第一选择器MUX,4个第一2输入 乘法器,第一4输入加法器,4个第二2输入乘法器,第二4输入加法器。第一选择器的两个输 入为图像信号和前一级结果;4个第一选择器的输出端连接对应的4个第一 2输入乘
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1