人工智能研究所
当前位置: 首页>>科学研究>>人工智能研究所>>正文
 科研平台 
 科研项目 
 科研团队 
 科研成果 
 论文著作 
 专利软著 
 人工智能研究所 
研究成果之羊脸检测
2022-03-25 09:40  

基于计算机视觉的羊脸识别技术具有不接触、非侵入的优点,几乎不对羊只造成任何影响和应激,因此有望在羊只身份管理发挥重要作用

羊脸识别的前提是羊脸检测,即检测图像中有无羊脸。如果有,则输出羊脸的位置信息。羊脸检测属于目标检测问题。目前,基于深度学习的方法已经成为目标检测的主流方法。复杂目标检测问题需要处理多目标、多类别、不同尺度等问题,即检测1幅图像中的多个不同大小的目标,并对检测到的目标进行分类,同时还要兼顾检测速度。

研究人员提出了多种基于深度学习的目标检测方法,典型的方法如YOLO, Faster RCNN, SSD等,他们都能取得较好的目标检测效果。

对于羊脸检测,需要自己收集羊脸图像,进行标注,使用上述方法训练检测模型。羊脸检测属于单类别、多目标、不同尺度的目标检测问题。一幅图像中可能有1个羊脸,也可能有多个羊脸,也可能有不同大小的羊脸,理想的检测模型应该能检测到图像中的所有羊脸。

我们使用了Kaggle上的羊图像数据集,使用labelme标注软件对每幅图像上的所有羊脸进行标注,标注结果保存为.json格式文件,并可转化为VOC2007数据集格式(标注文件为.xml格式)。

使用Python编程语言和Pytorch深度学习框架,训练了两种羊脸检测模型。第一种方法采用深度残差网络ResNet18, 对输入图像进行卷积操作,提取图像特征,在网络末端获取5121×1的特征图,将其与1层全连接层(fc)连接,输出羊脸包围盒(Bounding Box)的左上角、右下角两个顶点的4个坐标。检测效果如下面图1所示。这种方法的优点是模型训练速度和检测速度都快。但是需要预设图像中羊脸的最大数量。

第二种方法使用了YOLO V5目标检测框架。YOLOYou Only Look Once的简称。顾名思义,它只需要对图像扫描1次,即能输出检测到的目标及其类别。简要地讲,YOLO将输入图像分成S×S个格子,每个格子负责检测落入该格子的物体。若某个物体的中心位置坐标落入到某个格子,这个格子就负责检测出这个物体。每个格子输出BBounding Box信息,以及C个物体属于某种类别的概率信息。YOLO V5对多类别、多目标、多尺度的目标检测问题取得了较好的检测效果。基于YOLO V5训练的羊脸检测模型对羊脸检测的效果如图2所示。

图1 ResNet18羊脸关键点检测结果 

图2 YOLO V5羊脸检测结果



关闭窗口