admin管理员组

文章数量:1531529


2024年6月15日发(作者:)

第13期

2023年7月

无线互联科技

WirelessInternetTechnology

No.13

July,2023

基于改进YOLOv8的苹果检测方法

(1.吉林化工学院,吉林

吉林

132022;2.吉林农业科技学院,吉林

吉林

132101;

3.一汽东机工减振器有限公司,吉林

长春

130001)

杜宝侠

1,2

,唐 友

1,2∗

,辛 鹏

1

,杨 牧

3

摘要:实现苹果自动检测对推动苹果生产管理自动化、智能化有着重要意义。为了解决当前苹果检测

方法准确率低、鲁棒性差等问题,文章提出了一种基于改进YOLOv8算法的苹果检测模型,通过引入

GAM注意力机制提升模型的检测精度。在苹果检测数据集上进行验证,基于改进的YOLOv8算法和

原始YOLOv8算法相比,mAP

0.5提高了1.7%,mAP0.5∶0.95提高了2.2%。实验结果表明,文章提

出的改进YOLOv8算法更能满足实际情况中对苹果检测的要求。

关键词:苹果检测;YOLOv8;注意力机制

中图分类号:S661.1;TP391.41  文献标志码:A

0 引言

  我国是农业大国,水果生产和消费数量在世界上

位居前列,在众多水果中,苹果的种植面积和产量均

超过世界总量的50%,均居世界首位

[1]

。苹果生产是

我国农业经济发展的重要支柱,但我国的大部分苹果

生产还处于传统的农业模式阶段,在苹果生产管理过

程中需要耗费大量的人力物力,这也导致了生产效率

的低下和农民收入水平的不稳定。因此,推动苹果生

产过程的自动化、智能化发展具有重要意义。

近年来,现代农业结合计算机视觉技术的各种智

能设备在农业生产中的应用日益普及,并且成为农业

领域的研究热点。这些智能设备的应用极大地提高

了农业生产效率和精度,减少了对劳动力和资源的依

赖,并降低了农业生产成本,促进了农业的可持续发

展。具体到苹果的生产方面,计算机视觉技术可以通

过拍摄的图片或视频进行产量预测、病虫害识别,也

可以通过图像信息对苹果果实进行优劣分级等,这些

技术极大地推动了苹果生产管理的智能化发展。其

中,利用目标检测技术对苹果果实进行识别和定位,

从而帮助智能机器人实现自动采摘是一个重要的研

究方向。

在对苹果的检测方面,可以分为传统算法和基于

深度学习的算法两类。传统算法大多依赖于目标的

颜色、形状等外部特征来区分目标和背景

[2]

,存在特

征提取困难、模型泛化能力差、在环境变化时性能下

降严重等问题。近年来,基于卷积神经网络的深度学

习技术在目标检测领域取得了显著的成功,相较于传

统的机器学习方法,基于深度学习的目标检测技术场

景适应性强,精度更高。牟其松

[3]

简化了YOLOv3的

主干网络,并通过改进损失函数,提高了苹果检测的

精度;张中华等

[4]

提出了一种基于优化FCOS网络的

绿色苹果检测模型,通过改进特征融合FPN提高了

对绿色苹果的检测精度;Meili等

[5]

针对复杂环境下

的小苹果提出了一种平衡特征金字塔网络BFP

Net。

上述研究通过对先进目标检测算法进行改进,增强其

不容易部署等问题。

在实际的果园场景中,要实现苹果的实时检测,

不仅需要较好的检测精度,对检测的速度也有较高的

要求。因此,本文以单阶段目标检测算法中最先进的

YOLOv8模型为基础并加以改进,来实现苹果果实的

自动检测。

1 YOLOv8模型原理

1.1 YOLOv8模型结构

  YOLOv8是YOLO系列最新的模型,具有非常优

检测苹果的能力,但仍存在模型较复杂、检测速度慢、

秀的检测精度和速度。根据网络的深度与特征图的

宽度大小,YOLOv8算法分为:YOLOv8

-

n、YOLOv8

-

s、

YOLOv8

-

m、YOLOv8

-

l、和YOLOv8

-

x5个版本。按

基金项目:吉林省科技发展计划项目;项目名称:基于数据挖掘技术的全基因组选择方法研发及云计算平

台体系构建;项目编号:YDZJ202201ZYTS692。

作者简介:杜宝侠(1998—

),男,山东泰安人,硕士研究生;研究方向:计算机视觉。

∗通信作者:唐友(1979—

),男,黑龙江龙江人,教授,博士;研究方向:生物信息学,农业信息化。

Copyright©博看网. All Rights Reserved.

—119—

第13期

2023年7月无线互联科技·研究创新 

No.13

July,2023

照网络结构图,YOLOv8可分为:Input、Backbone、Neck

和Head

4部分。其中,Input输入端负责将输入图片

缩放到训练需要的尺寸,并包含缩放、改变图片色调

和Mosaic数据增强等数据增强操作;Backbone主干

网络用来进行目标特征的提取,由卷积模块

Conv、

C2f结构和YOLOv5中使用的SPPF模块构成;Neck

用来将不同维度的特征进行加强融合,其结构遵循特

征金字塔(Feature

PyramidNetwork,FPN)和路径聚

合结构(Path

AggregationNetwork,PAN),并删除了

YOLOv5上采样阶段的卷积操作;Head部分将加强后

的特征进行计算,最终得到不同目标的置信度和位

置。考虑到模型检测的速度和精度,本次实验以检测

速度最快的YOLOv8

-

n为基线模型,并在此基础上加

以改进。

1.2 数据增强

  数据增强是在不改变图像重要信息的前提下,基

于有限的数据生成更多同样有效的数据的方法。可

以极大地丰富训练数据的多样性,从而使得训练后的

模型具有更强的泛化能力。改变图片的颜色和形状

是最基础和常见的数据增强方式,在本研究中,使用

随机改变图片的色调、饱和度、明亮度,同时对图片进

行随机缩放和平移这些传统的数据增强方式。除了

这些基础的数据增强方式外,有些研究还提出了更

高效的数据增强方式,如Mosaic等

[6]

。Mosaic数据

增强方法的主要思想是将4张图片随机裁剪缩放,

再拼接到一张图上作为训练数据。在本次实验中使

用传统数据增强和Mosaic方法相结合的数据增强

方式。

2 YOLOv8模型改进方法

2.1 GAM注意力机制原理

  注意力机制可以赋予空间中不同通道或区域以

不同的权重,从而帮助模型专注于更重要信息的提

取。全局注意力机制(Global

AttentionMechanism,

GAM)

[7]

,可以通过减少信息缩减和放大全局交互表

示来提高深度神经网络的性能。该机制使用了通道

-

空间注意机制,在通道层面,GAM首先将输入特征图

进行维度转换,接着输入到MLP恢复原来的维度,最

后通过Sigmoid输出。在空间层面,GAM通过一系列

的卷积处理再送入Sigmoid输出,最终实现两个层面

注意力作用的叠加。GAM的整体模块如图1所示。

图1 GAM注意力机制原理

2.2 改进的模型结构

  在YOLOv8模型的改进方面,将GAM注意力添

加在Neck和Head的连接部分,引入的GAM注意力

模块可以对通道和空间维度中的特征图信息进行自

适应学习,并对特征进行重新拟合和分配,帮助模型

更聚焦于苹果目标,提高了特征图中小目标的权重占

比,从而加强了模型对其特征的训练。最终改进的

YOLOv8网络模型如图2所示。

3 实验结果与分析

3.1 数据集

  本实验使用的数据集来源为aistudio.

3.3 评估方法

  为验证改进方法的有效性,使用P(Precision:精

处理器为2个

Intel(R)Xeon(R)Silver4110,GPU为

GeForceRTX3090,显存为24GB。模型训练框架为

Pytorch1.12.0,具体训练参数设置如表1所示。

度)、R(Recall:召回率)、mAP

0.5(Mean

Average

Precision:各类别在IOU

=

0.5下的AP平均值)和mAP

0.5∶0.95(Mean

AveragePrecision:各类别在不同IOU

下的AP平均值)作为模型评价指标。另外,TP(True

/aistudio/datasetdetail/93304,图像数量为

287张。其中,训练集、验证集和测试集的图像数量

分别为273张、14张和10张。如图3所示为数据集

示例。

3.2 实验环境

  本文实验平台使用Ubuntu20.02操作系统,CPU

Positive)表示将正类预测为正类数,FN(False

Negative)表示将正类预测为负类数,FP(False

Positive)表示将负类预测为正类数,TN(True

Negative)表示将负类预测为负类数。对应的评价指

标计算方法如下。

精度是衡量模型识别出的真实阳性样本数占所

有被模型识别为阳性样本数的比例。精度越高,说明

模型识别出的阳性样本更准确,具有更好的准确性。

Copyright©博看网. All Rights Reserved.

—120—

第13期

2023年7月

  

无线互联科技·研究创新 

No.13

July,2023

图2 改进后的YOLOv8结构

图3 数据集示例

表1 训练参数

参数名

LearningRate(学习率)

参数值

0.01

640

×

640

32

参数名

Momentum(梯度动量)

参数值

0.937

ImageSize(图片尺寸)

BatchSize(批量)

Epochs(迭代轮次)300

WeightDecay(权重衰减度)0.0005

计算公式如下:

TP

P

=

(1)

TP

+

FP

召回率是衡量模型识别出的真实阳性样本数占

所有真实样本数的比例。召回率越高,说明模型能够

更准确地识别出真实阳性样本,具有更好的鉴别能

力。计算公式如下:

TP

R

=

(2)

TP

+

FN

AP的定义为P

-

R曲线下面的面积,AP值越高,

模型的性能越好,mAP为各类别AP的平均值,可以

通过下列公式得到:

AP

=

(r

i

+

1

i

=

1

n

-

1

mAP

=

3.4 实验结果与分析

  为验证本文所用改进方法的有效性,通过使用相

m

1

AP

i

i

=

1

m

-

r

i

)p(r

i

+

1

)(3)

(4)

Copyright©博看网. All Rights Reserved.

—121—

第13期

2023年7月无线互联科技·研究创新 

No.13

July,2023

同的训练参数设置在数据集上进行实验,改进后的

YOLOv8模型检测精度和召回率明显提高,具体的数

值结果如表2所示,可以看出,通过添加GAM注意力

机制,模型的性能得到了有效提高。和原模型相比,

改进后的YOLOv8模型mAP

0.5提高了1.7%,

mAP

0.5∶0.95提高了2.2%。结果表明,改进后的

YOLOv8模型更能满足对苹果果实的检测要求。

表2 评价指标对比结果

P

0.934

R

0.81

0.92

mAP

0.5

算法

YOLOv80.941

0.958

mAP0.5∶0.95

0.498

0.52改进的YOLOv80.87

4 结语

  为解决苹果果实的智能检测问题,提高智能设备

对苹果的检测能力,本文使用先进的YOLOv8目标检

测模型并加以改进,通过使用多种数据增强方法,增

加了模型的泛化能力。同时引入GAM注意力机制,

提升模型聚焦苹果的能力,并提高模型的检测性能。

最终的实验结果可知,改进后的YOLOv8算法具有较

高的检测精度,在640

×

640大小的图像输入下,

mAP

0.5达到了0.958,比原模型提高了1.7%,更加

适合部署到设备。未来的工作目标是要丰富苹果检

测场景,提升模型在复杂环境下的检测效果。

产业发展报告(精简版)[J].中国果菜,2022(2):

1

-

6.

[2]孙飒爽,吴倩,谭建昌,等.枝条遮挡下单个苹果

目标识别与重建方法的研究[J].西北农林科技大学

学报(自然科学版),2017(11):138

-

46.

[3]牟其松.基于深度学习的水果采摘通用检测模型

研究[D].天津:天津理工大学,2021.

[4]张中华,贾伟宽,邵文静,等.优化FCOS网络复杂

果园环境下绿色苹果检测模型[J].光谱学与光谱分

析,2022(2):647

-

53.

[5]MEILI

S,LIANCHENGX,XIUDEC,

net:balancedfeaturepyramidnetworkforsmallapple

detectionincomplexorchardenvironment[J].Plant

Phenomics,2022(1):1

-

19.

[6]BOCHKOVSKIY

A,WANGCY,LIAOHYM.

YOLOv4:optimalspeedandaccuracyofobjectdetection

[EB/OL].(2020

-

04

-

23)[2023

-

05

-

04].

/abs/2004.10934.

[7]LIU

YC,SHAOZR,

attentionmechanism:retaininformationtoenhance

channel

-

spatialinteractions[EB/OL].(2021

-

12

-

10)

[2023

-

05

-

04]./abs/2112.05561.

(编辑 沈 强)

参考文献

[1]霍学喜,刘天军,刘军弟,等.2020年度中国苹果

AppledetectionmethodbasedonimprovedYOLOv8

DuBaoxia

1 2

TangYou

1 2∗

XinPeng

1

YangMu

3

nstituteofChemicalTechnology Jilin132022 China

griculturalScienceandTechnologyUniversity Jilin132101 China

-

TokicoShockAbsorberCo. Ltd. Changchun130001 China

Abstract

Theimplementationofautomaticappledetectionisofgreatsignificanceforpromotingtheautomationand

rtosolvetheproblemsoflowaccuracyandpoorrobustnessof

currentappledetectionmethods thearticleproposesanappledetectionmodelbasedontheimprovedYOLOv8

algorithm whichimprovestothedetectionaccuracyofthemodelbyintroducingtheGAMattentionmechanism.

Verifiedontheappledetectiondataset basedontheimprovedYOLOv8algorithmandtheoriginalYOLOv8algorithm

mAP0.5improvedby1.7%andmAP0.5∶0.95improvedby2.2%.Theexperimentalresultsshowthattheimproved

YOLOv8algorithmproposedinthispapercanbettermeettherequirementsofappledetectioninpracticalsituations.

Keywords

appledetection YOLOv8 attentionmechanism

Copyright©博看网. All Rights Reserved.

—122—


本文标签: 检测苹果模型数据进行