基于卷积神经网络的行人检测系统设计(4)

○3算法的改进:诸如网络层数变深、应用激活函数ReLU替代传统的激活函数Tanh或者Logistic、采用Dropout技术以防止过拟合等。 1.3有关本文 本文共六部分,第


○3算法的改进:诸如网络层数变深、应用激活函数ReLU替代传统的激活函数Tanh或者Logistic、采用Dropout技术以防止过拟合等。

1.3 有关本文

本文共六部分,第一部分为绪论,主要介绍一下行人检测与卷积神经网络的发展现状以及本文各部分内容简要介绍;第二部分为Faster R-CNN这一目标检测框架的介绍;第三部分为MobileNet这一网络模型的介绍:第四部分主要是有关于通过第三方开源代码进行工程实现,主要从数据集、代码、具体训练测试过程进行介绍;第五部分为实验部分,主要对卷积神经网络模型的一些性质对行人检测的结果的影响进行实验与讨论,同时提出建议;第六部分为结论。

2 Faster R-CNN介绍

Faster R-CNN(Faster Region-based Convolutional Neural Networks)是在Fast R-CNN[22](Fast Region-based Convolutional Neural Networks,以下简称为Fast R-CNN)提出之后,通过将候选区域生成网络(Region Proposal Network,以下简称RPN)和Fast R-CNN二者通过分享它们的卷积特征,即所谓的深度学习中的注意力机制(Attention Mechanism)合并进一个网络中。

2.1 Faster R-CNN的发展历史

卷积神经网络在目标检测领域的应用中首先出现的是Region-based CNN[23](以下简称R-CNN)。其作为Fast R-CNN的基础,通过端至端训练卷积神经网络以用来将候选区域分类至相应目标类别或者背景。而在这个时期,R-CNN主要作为一个分类器来发挥作用,并不预测目标的边界(除了用边界框的回归来对网络进行调整的时候)。恰恰是候选区域这个模块的作用决定了其准确率。

而在R-CNN基础上,Fast R-CNN通过应用共享卷积特征进行端至端训练的检测器,将R-CNN的准确率以及速度都大大提升。

之后,在Fast R-CNN的基础上,其作者将Fast R-CNN以及RPN作为两个模块结合在一起,得到了本文所使用的拥有更高准确率以及更快速率的检测器——Faster R-CNN。