基于改进YOLOv8_的苹果检测方法|电子爱好者

admin管理员组
文章数量:1531529

2024年6月15日发(作者：)

第13期

2023年7月

无线互联科技

WirelessInternetTechnology

No.13

July,2023

基于改进YOLOv8的苹果检测方法

(1.吉林化工学院,吉林

吉林

132022;2.吉林农业科技学院,吉林

吉林

132101;

3.一汽东机工减振器有限公司,吉林

长春

130001)

杜宝侠

1,2

,唐　友

1,2∗

,辛　鹏

,杨　牧

摘要:实现苹果自动检测对推动苹果生产管理自动化、智能化有着重要意义。为了解决当前苹果检测

方法准确率低、鲁棒性差等问题,文章提出了一种基于改进YOLOv8算法的苹果检测模型,通过引入

GAM注意力机制提升模型的检测精度。在苹果检测数据集上进行验证,基于改进的YOLOv8算法和

原始YOLOv8算法相比,mAP

0.5提高了1.7%,mAP0.5∶0.95提高了2.2%。实验结果表明,文章提

出的改进YOLOv8算法更能满足实际情况中对苹果检测的要求。

关键词:苹果检测;YOLOv8;注意力机制

中图分类号:S661.1;TP391.41　　文献标志码:A

0　引言

　　我国是农业大国,水果生产和消费数量在世界上

位居前列,在众多水果中,苹果的种植面积和产量均

超过世界总量的50%,均居世界首位

[1]

。苹果生产是

我国农业经济发展的重要支柱,但我国的大部分苹果

生产还处于传统的农业模式阶段,在苹果生产管理过

程中需要耗费大量的人力物力,这也导致了生产效率

的低下和农民收入水平的不稳定。因此,推动苹果生

产过程的自动化、智能化发展具有重要意义。

近年来,现代农业结合计算机视觉技术的各种智

能设备在农业生产中的应用日益普及,并且成为农业

领域的研究热点。这些智能设备的应用极大地提高

了农业生产效率和精度,减少了对劳动力和资源的依

赖,并降低了农业生产成本,促进了农业的可持续发

展。具体到苹果的生产方面,计算机视觉技术可以通

过拍摄的图片或视频进行产量预测、病虫害识别,也

可以通过图像信息对苹果果实进行优劣分级等,这些

技术极大地推动了苹果生产管理的智能化发展。其

中,利用目标检测技术对苹果果实进行识别和定位,

从而帮助智能机器人实现自动采摘是一个重要的研

究方向。

在对苹果的检测方面,可以分为传统算法和基于

深度学习的算法两类。传统算法大多依赖于目标的

颜色、形状等外部特征来区分目标和背景

[2]

,存在特

征提取困难、模型泛化能力差、在环境变化时性能下

降严重等问题。近年来,基于卷积神经网络的深度学

习技术在目标检测领域取得了显著的成功,相较于传

统的机器学习方法,基于深度学习的目标检测技术场

景适应性强,精度更高。牟其松

[3]

简化了YOLOv3的

主干网络,并通过改进损失函数,提高了苹果检测的

精度;张中华等

[4]

提出了一种基于优化FCOS网络的

绿色苹果检测模型,通过改进特征融合FPN提高了

对绿色苹果的检测精度;Meili等

[5]

针对复杂环境下

的小苹果提出了一种平衡特征金字塔网络BFP

Net。

上述研究通过对先进目标检测算法进行改进,增强其

不容易部署等问题。

在实际的果园场景中,要实现苹果的实时检测,

不仅需要较好的检测精度,对检测的速度也有较高的

要求。因此,本文以单阶段目标检测算法中最先进的

YOLOv8模型为基础并加以改进,来实现苹果果实的

自动检测。

1　YOLOv8模型原理

1.1　YOLOv8模型结构

　　YOLOv8是YOLO系列最新的模型,具有非常优

检测苹果的能力,但仍存在模型较复杂、检测速度慢、

秀的检测精度和速度。根据网络的深度与特征图的

宽度大小,YOLOv8算法分为:YOLOv8

n、YOLOv8

s、

YOLOv8

m、YOLOv8

l、和YOLOv8

x5个版本。按

基金项目:吉林省科技发展计划项目;项目名称:基于数据挖掘技术的全基因组选择方法研发及云计算平

台体系构建;项目编号:YDZJ202201ZYTS692。

作者简介:杜宝侠(1998—

),男,山东泰安人,硕士研究生;研究方向:计算机视觉。

∗通信作者:唐友(1979—

),男,黑龙江龙江人,教授,博士;研究方向:生物信息学,农业信息化。

—119—

第13期

2023年7月无线互联科技·研究创新　

No.13

July,2023

照网络结构图,YOLOv8可分为:Input、Backbone、Neck

和Head

4部分。其中,Input输入端负责将输入图片

缩放到训练需要的尺寸,并包含缩放、改变图片色调

和Mosaic数据增强等数据增强操作;Backbone主干

网络用来进行目标特征的提取,由卷积模块

Conv、

C2f结构和YOLOv5中使用的SPPF模块构成;Neck

用来将不同维度的特征进行加强融合,其结构遵循特

征金字塔(Feature

PyramidNetwork,FPN)和路径聚

合结构(Path

AggregationNetwork,PAN),并删除了

YOLOv5上采样阶段的卷积操作;Head部分将加强后

的特征进行计算,最终得到不同目标的置信度和位

置。考虑到模型检测的速度和精度,本次实验以检测

速度最快的YOLOv8

n为基线模型,并在此基础上加

以改进。

1.2　数据增强

　　数据增强是在不改变图像重要信息的前提下,基

于有限的数据生成更多同样有效的数据的方法。可

以极大地丰富训练数据的多样性,从而使得训练后的

模型具有更强的泛化能力。改变图片的颜色和形状

是最基础和常见的数据增强方式,在本研究中,使用

随机改变图片的色调、饱和度、明亮度,同时对图片进

行随机缩放和平移这些传统的数据增强方式。除了

这些基础的数据增强方式外,有些研究还提出了更

高效的数据增强方式,如Mosaic等

[6]

。Mosaic数据

增强方法的主要思想是将4张图片随机裁剪缩放,

再拼接到一张图上作为训练数据。在本次实验中使

用传统数据增强和Mosaic方法相结合的数据增强

方式。

2　YOLOv8模型改进方法

2.1　GAM注意力机制原理

　　注意力机制可以赋予空间中不同通道或区域以

不同的权重,从而帮助模型专注于更重要信息的提

取。全局注意力机制(Global

AttentionMechanism,

GAM)

[7]

,可以通过减少信息缩减和放大全局交互表

示来提高深度神经网络的性能。该机制使用了通道

空间注意机制,在通道层面,GAM首先将输入特征图

进行维度转换,接着输入到MLP恢复原来的维度,最

后通过Sigmoid输出。在空间层面,GAM通过一系列

的卷积处理再送入Sigmoid输出,最终实现两个层面

注意力作用的叠加。GAM的整体模块如图1所示。

图1　GAM注意力机制原理

2.2　改进的模型结构

　　在YOLOv8模型的改进方面,将GAM注意力添

加在Neck和Head的连接部分,引入的GAM注意力

模块可以对通道和空间维度中的特征图信息进行自

适应学习,并对特征进行重新拟合和分配,帮助模型

更聚焦于苹果目标,提高了特征图中小目标的权重占

比,从而加强了模型对其特征的训练。最终改进的

YOLOv8网络模型如图2所示。

3　实验结果与分析

3.1　数据集

　　本实验使用的数据集来源为aistudio.

3.3　评估方法

　　为验证改进方法的有效性,使用P(Precision:精

处理器为2个

Intel(R)Xeon(R)Silver4110,GPU为

GeForceRTX3090,显存为24GB。模型训练框架为

Pytorch1.12.0,具体训练参数设置如表1所示。

度)、R(Recall:召回率)、mAP

0.5(Mean

Average

Precision:各类别在IOU

0.5下的AP平均值)和mAP

0.5∶0.95(Mean

AveragePrecision:各类别在不同IOU

下的AP平均值)作为模型评价指标。另外,TP(True

/aistudio/datasetdetail/93304,图像数量为

287张。其中,训练集、验证集和测试集的图像数量

分别为273张、14张和10张。如图3所示为数据集

示例。

3.2　实验环境

　　本文实验平台使用Ubuntu20.02操作系统,CPU

Positive)表示将正类预测为正类数,FN(False

Negative)表示将正类预测为负类数,FP(False

Positive)表示将负类预测为正类数,TN(True

Negative)表示将负类预测为负类数。对应的评价指

标计算方法如下。

精度是衡量模型识别出的真实阳性样本数占所

有被模型识别为阳性样本数的比例。精度越高,说明

模型识别出的阳性样本更准确,具有更好的准确性。

—120—

第13期

2023年7月

无线互联科技·研究创新　

No.13

July,2023

图2　改进后的YOLOv8结构

图3　数据集示例

表1　训练参数

参数名

LearningRate(学习率)

参数值

0.01

640

参数名

Momentum(梯度动量)

参数值

0.937

ImageSize(图片尺寸)

BatchSize(批量)

Epochs(迭代轮次)300

WeightDecay(权重衰减度)0.0005

计算公式如下:

(1)

召回率是衡量模型识别出的真实阳性样本数占

所有真实样本数的比例。召回率越高,说明模型能够

更准确地识别出真实阳性样本,具有更好的鉴别能

力。计算公式如下:

(2)

AP的定义为P

R曲线下面的面积,AP值越高,

模型的性能越好,mAP为各类别AP的平均值,可以

通过下列公式得到:

∑

mAP

3.4　实验结果与分析

　　为验证本文所用改进方法的有效性,通过使用相

∑

)p(r

)(3)

(4)

—121—

第13期

2023年7月无线互联科技·研究创新　

No.13

July,2023

同的训练参数设置在数据集上进行实验,改进后的

YOLOv8模型检测精度和召回率明显提高,具体的数

值结果如表2所示,可以看出,通过添加GAM注意力

机制,模型的性能得到了有效提高。和原模型相比,

改进后的YOLOv8模型mAP

0.5提高了1.7%,

mAP

0.5∶0.95提高了2.2%。结果表明,改进后的

YOLOv8模型更能满足对苹果果实的检测要求。

表2　评价指标对比结果

0.934

0.81

0.92

mAP

0.5

算法

YOLOv80.941

0.958

mAP0.5∶0.95

0.498

0.52改进的YOLOv80.87

4　结语

　　为解决苹果果实的智能检测问题,提高智能设备

对苹果的检测能力,本文使用先进的YOLOv8目标检

测模型并加以改进,通过使用多种数据增强方法,增

加了模型的泛化能力。同时引入GAM注意力机制,

提升模型聚焦苹果的能力,并提高模型的检测性能。

最终的实验结果可知,改进后的YOLOv8算法具有较

高的检测精度,在640

640大小的图像输入下,

mAP

0.5达到了0.958,比原模型提高了1.7%,更加

适合部署到设备。未来的工作目标是要丰富苹果检

测场景,提升模型在复杂环境下的检测效果。

产业发展报告(精简版)[J].中国果菜,2022(2):

[2]孙飒爽,吴倩,谭建昌,等.枝条遮挡下单个苹果

目标识别与重建方法的研究[J].西北农林科技大学

学报(自然科学版),2017(11):138

46.

[3]牟其松.基于深度学习的水果采摘通用检测模型

研究[D].天津:天津理工大学,2021.

[4]张中华,贾伟宽,邵文静,等.优化FCOS网络复杂

果园环境下绿色苹果检测模型[J].光谱学与光谱分

析,2022(2):647

53.

[5]MEILI

S,LIANCHENGX,XIUDEC,

net:balancedfeaturepyramidnetworkforsmallapple

detectionincomplexorchardenvironment[J].Plant

Phenomics,2022(1):1

19.

[6]BOCHKOVSKIY

A,WANGCY,LIAOHYM.

YOLOv4:optimalspeedandaccuracyofobjectdetection

[EB/OL].(2020

23)[2023

04].

/abs/2004.10934.

[7]LIU

YC,SHAOZR,

attentionmechanism:retaininformationtoenhance

channel

spatialinteractions[EB/OL].(2021

10)

[2023

04]./abs/2112.05561.

(编辑　沈　强)

参考文献

[1]霍学喜,刘天军,刘军弟,等.2020年度中国苹果

AppledetectionmethodbasedonimprovedYOLOv8

DuBaoxia

1 2

TangYou

1 2∗

XinPeng

YangMu

nstituteofChemicalTechnology Jilin132022 China

griculturalScienceandTechnologyUniversity Jilin132101 China

TokicoShockAbsorberCo. Ltd. Changchun130001 China

Abstract

Theimplementationofautomaticappledetectionisofgreatsignificanceforpromotingtheautomationand

rtosolvetheproblemsoflowaccuracyandpoorrobustnessof

currentappledetectionmethods thearticleproposesanappledetectionmodelbasedontheimprovedYOLOv8

algorithm whichimprovestothedetectionaccuracyofthemodelbyintroducingtheGAMattentionmechanism.

Verifiedontheappledetectiondataset basedontheimprovedYOLOv8algorithmandtheoriginalYOLOv8algorithm

mAP0.5improvedby1.7%andmAP0.5∶0.95improvedby2.2%.Theexperimentalresultsshowthattheimproved

YOLOv8algorithmproposedinthispapercanbettermeettherequirementsofappledetectioninpracticalsituations.

Keywords

appledetection YOLOv8 attentionmechanism

—122—

本文标签：检测苹果模型数据进行

版权声明：本文标题：基于改进YOLOv8_的苹果检测方法内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/shuma/1718439209a680937.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

基于改进YOLOv8_的苹果检测方法

更多相关文章

最新ChatGPT4.0，GPTs，AI换脸，文档分析，Suno-AI音乐生成大模型

苹果MacBook iMac免光驱安装win7方法

Chrome浏览器数据本地备份

Chrome浏览器指定用户数据的保存路径

iMazing许可证编号如何激活苹果版手机管理器支持 WinMac 双平台

测试路由器的防火墙配置，wan：入站数据，出站数据，转发

苹果6p计算机在哪里设置方法,苹果恢复出厂设置在哪里 两种方法设置【图文】...

系统安装-000 基础二：UEFI+GPT和BIOS+MBR互换（免重装系统，无损数据）

零刻SER8 AMD 8845Hs Ryzen AI 本地部署大语言模型教程！

a10 amd 安装黑苹果_AMD PRO A10-8770 R7安装黑苹果—花屏禁止安装

五笔字根查询接口,五笔输入法数据

【人工智能】人工智能、机器学习和数据工程 InfoQ 趋势报告 - 2021 年 8 月

多模态大模型总结

一口气了解大模型相关通识，基础笔记！

苹果mac电脑查看已连接到的wifi密码

移动硬盘接android手机吗,笔点说：智能手机可以直接连接移动硬盘读取数据吗？...

移动硬盘文件或目录损坏且无法读取？分享恢复数据的方法

移动硬盘无法访问提示未格式化，里面的数据怎么寻回

移动硬盘修复的有效方法，恢复移动硬盘的数据这么做！

苹果笔记本装win7_m2 ngff无线网卡接口的笔记本电脑装苹果网卡

发表评论

推荐文章

利用ChatGPT和Google Colaboratory（也称 Colab）编写代码并实现代码效果，以相关性热点图为例

win10系统打开chrome浏览器几秒后自动闪退

服务器系统server读条后黑屏,电脑无法进入界面,Windows进度条读取完了就黑屏了...

error：重装系统后，office办公软件成网页版

恶意手机广告软件如何清除？不用360等所谓杀毒防护软件。

热门文章

如何加入bing的chatgpt内测计划

有效管理token，充分发挥ChatGPT的能力

win10-cmd查看硬盘接口信息

winscp如何连接安卓手机_通过winscp连接路由器

水星路由器Mercury-D121无线桥接Mercury-mw310R

你真正会安装系统么？

amd 安装 matlab,AMD平台下安装运行MATLAB的设置

暴风云视频平台SDK使用介绍（四）-- 视频播放（Android）

windows11第一个更新包 10月累积更新 适合基于 x64 的系统 (KB5006674)

Dell服务器做磁盘阵列

最新文章

Apriori算法进行关联分析

引入codemirror时报错，webpack中resolve.extensions配置产生的问题

Java 异常（Exception）简介及异常处理方式

SAT阅读长难句学习要点

考研英语 长难句训练day11

mysql嵌套事务的问题

扩展Win2003架构报错：Adprep detected that the domain is not in native mode [StatusConsequence] Adprep has

通用学术英语重点词汇表11-20词

because of, due to, owing to, on account of,as a result of和thanks to的用法比较

分享会笔记——关于批评

rule

The Fine Print

Linux上手动编译apache

英语之贬低

远程调试之gdb移植

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

苹果6p计算机在哪里设置方法,苹果恢复出厂设置在哪里两种方法设置【图文】...

windows11第一个更新包 10月累积更新适合基于 x64 的系统 (KB5006674)

考研英语长难句训练day11

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载