Yolov5 使用精灵标注助手制作数据集|电子爱好者

admin管理员组
文章数量:1609936

精灵标记助手下载：http://www.jinglingbiaozhu/

首先点击菜单文件->新建，然后选择位置标注，选择图片文件夹，点击创建按钮，软件会自动加载文件夹下的图片（png,jpg,gif）并创建一个项目。

项目名称：根据自己的需求命名
图片文件夹：图片文件所在电脑磁盘的路径
分类值：根据对图片划分的类别，对不同类的框命名

可以选择曲线框，多边形框，矩形框等对图片进行标注。

注：所选框不能超出图片大小，如图下

为了有更好的识别效果，上面的图片应该进行如下标记：

注意：每次标记完一张图后，要对图片进行保存，通过快捷键 ctrl + s 或者点击图片下方的 ✔，

当左下角弹出 √保存成功，则证明该张图片的标记已经保存，如果标记的图片没有进行保存，在切换图片的过程中，前一张的图片标记框会自动消失，此时需要对图片重新标记。

快捷键

R：矩形框
←：前一张图片
→：后一张图片
空格：移动
放大缩小图片：ctrl + 鼠标滚轮
保存标记：ctrl + s

所有的数据集标注完成后，将标注的信息导出。

注：选择导出格式时候必须选择pascal—voc导出XML直接选择XML会在后面无法读取到标注
的信息

导出后，会在目录中生成一个 outputs 文件夹，导出的文件就是pascal-voc的xml，效果如下：

输出的标注文件XML保存在Annotations中

数据集标记好后，将原始图片数据集放到images文件夹中，如图所示

以下操作是对导出的XML文件和原图片进行解析。

makeTxt.py

创建 makeTxt.py 文件
makeTxt.py主要是将数据集分类成训练数据集和测试数据集，默认train，val，test按照8：1：1
的比例进行随机分类。

import os
import random

trainval_percent = 0.9
train_percent = 0.9
xmlfilepath = './datasets/Annotations'  # 数据集位置
txtsavepath = './datasets/images'  # 图片位置
tmage_sets_path = './datasets/ImageSets'  # 将数据集分为 训练数据集和测试数据集进行存放的位置
total_xml = os.listdir(xmlfilepath)

num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

# 先找ImageSets文件夹如果不存在则创建
if not os.path.exists(tmage_sets_path):
    os.makedirs(tmage_sets_path)

ftrainval = open('datasets/ImageSets/trainval.txt', 'w')  # 以只写方式打开文件。如果文件存在会被覆盖。如果文件不存在，创建新文件
ftest = open('datasets/ImageSets/test.txt', 'w')
ftrain = open('datasets/ImageSets/train.txt', 'w')
fval = open('datasets/ImageSets/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

voc_label.py

创建 voc_label.py 文件
代码如下：
classes=[……] 中填入的一定要是自己在数据集中所标注的类别名称，标记了几个类别就填写几个类别名，填写错误的话会造成读取不出xml文件里的标注信息。

# xml解析包
import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join


sets = ['train', 'test', 'val']
classes = ['杯子', '键盘', '鼠标', '手机']  #填入刚刚标记数据集的类别名称

# 进行归一化操作
def convert(size, box):  # size:(原图w,原图h) , box:(xmin,xmax,ymin,ymax)
    dw = 1. / size[0]  # 1/w
    dh = 1. / size[1]  # 1/h
    x = (box[0] + box[1]) / 2.0  # 物体在图中的中心点x坐标
    y = (box[2] + box[3]) / 2.0  # 物体在图中的中心点y坐标
    w = box[1] - box[0]  # 物体实际像素宽度

    h = box[3] - box[2]  # 物体实际像素高度
    x = x * dw  # 物体中心点x的坐标比(相当于 x/原图w)
    w = w * dw  # 物体宽度的宽度比(相当于 w/原图w)
    y = y * dh  # 物体中心点y的坐标比(相当于 y/原图h)
    h = h * dh  # 物体宽度的宽度比(相当于 h/原图h)
    return (x, y, w, h)   # 返回 相对于原图的物体中心点的x坐标比,y坐标比,宽度比,高度比,取值范围[0-1]

# year ='2012', 对应图片的id（文件名）
def convert_annotation(image_id):
    '''
    将对应文件名的xml文件转化为label文件，xml文件包含了对应的bunding框以及图片长款大小等信
    息，
    通过对其解析，然后进行归一化最终读到label文件中去，也就是说
    一张图片文件对应一个xml文件，然后通过解析和归一化，能够将对应的信息保存到唯一一个label文件
    中去
    labal文件中的格式：calss x y w h 同时，一张图片对应的类别有多个，所以对应的ｂｕｎｄｉ
    ｎｇ的信息也有多个
    '''

    # 对应的通过year 找到相应的文件夹，并且打开相应image_id的xml文件，其对应bund文件
    in_file = open('datasets/Annotations/%s.xml' % (image_id), encoding='utf-8')
    # 准备在对应的image_id 中写入对应的label，分别为
    # <object-class> <x> <y> <width> <height>
    out_file = open('datasets/labels/%s.txt' % (image_id), 'w', encoding='utf-8')
    # 解析xml文件
    tree = ET.parse(in_file)
    # 获得对应的键值对
    root = tree.getroot()
    # 获得图片的尺寸大小
    size = root.find('size')
    # 如果xml内的标记为空，增加判断条件
    if size != None:
        # 获得宽
        w = int(size.find('width').text)
        # 获得高
        h = int(size.find('height').text)
        # 遍历目标obj
        for obj in root.iter('object'):
            # 获得difficult ？？
            difficult = obj.find('difficult').text
            # 获得类别 =string 类型
            cls = obj.find('name').text
            # 如果类别不是对应在我们预定好的class文件中，或difficult==1则跳过
            if cls not in classes or int(difficult) == 1:
                continue
            # 通过类别名称找到id
            cls_id = classes.index(cls)
            # 找到bndbox 对象
            xmlbox = obj.find('bndbox')
            # 获取对应的bndbox的数组 = ['xmin','xmax','ymin','ymax']
            b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text),
                 float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
            print(image_id, cls, b)
            # 带入进行归一化操作
            # w = 宽, h = 高， b= bndbox的数组 = ['xmin','xmax','ymin','ymax']
            bb = convert((w, h), b)

            # bb 对应的是归一化后的(x,y,w,h)
            # 生成 calss x y w h 在label文件中
            out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
# 返回当前工作目录
wd = getcwd()
print(wd)

for image_set in sets:
    '''
    对所有的文件数据集进行遍历
    做了两个工作：
    １．将所有图片文件都遍历一遍，并且将其所有的全路径都写在对应的txt文件中去，方便定位
    ２．同时对所有的图片文件进行解析和转化，将其对应的bundingbox 以及类别的信息全部解析写到
    label 文件中去
    最后再通过直接读取文件，就能找到对应的label 信息
    '''

    # 先找labels文件夹如果不存在则创建
    if not os.path.exists('datasets/labels/'):
        os.makedirs('datasets/labels/')
    # 读取在ImageSets/Main 中的train、test..等文件的内容
    # 包含对应的文件名称
    image_ids = open('datasets/ImageSets/%s.txt' % (image_set)).read().strip().split()
    # 打开对应的2012_train.txt 文件对其进行写入准备
    list_file = open('datasets/%s.txt' % (image_set), 'w')
    # 将对应的文件_id以及全路径写进去并换行
    for image_id in image_ids:
        list_file.write('datasets/images/%s.jpg\n' % (image_id))
        # 调用 year = 年份 image_id = 对应的文件名_id
        convert_annotation(image_id)
    # 关闭文件
    list_file.close()

分别运行makeTxt.py和voc_label.py。
makeTxt.py主要是将数据集分类成训练数据集和测试数据集，默认train，val，test按照8：1：1
的比例进行随机分类，运行后ImagesSets文件夹中会出现四个文件，主要是生成的训练数据集和测
试数据集的图片名称，同时data目录下也会出现这四个文件，内容是训练数据集和测试数据集的图
片路径。

labels文件夹下 txt文件的内容如下：

根据数据集会写一些对图片文件和txt文件处理的脚本，
例如：以下是在标记数据集的过程中并没有对一些数据集进行标记然后，将已经标记的数据集进行分开
存放在另一个文件夹中。

import os, shutil

'''匹配训练的图片 和 标记 文件名字是否对应
把对应的名字复制到其它文件中
'''
def mycopyfile(srcfile, dstfile):  # 复制文件函数
    if not os.path.isfile(srcfile):
        print("%s not exist!" % (srcfile))
    else:
        fpath = os.path.dirname(dstfile)    # 获取文件路径
        if not os.path.exists(fpath):   # 如果没有复制的文件目录就创建复制到那里的文件目录
            os.makedirs(fpath)                # 没有就创建路径
        shutil.copyfile(srcfile, dstfile)      # 复制文件到默认路径
        print("copy %s -> %s" % (srcfile, os.path.join(fpath, dstfile)))


def operation(images_path, txt_path, copy_images_path, copy_txt_path):
    os.chdir(images_path)  # 用于改变当前工作目录到指定的路径。 相当于 cd   #当操作的文件不在当前目录时必须先进入目录
    print("开始复制....")
    cout = 0
    for images_file in os.listdir(images_path):
        images_name = os.path.splitext(images_file)[0]  # 获取文件名
        images_suffix = os.path.splitext(images_file)[1]  # 获取后缀

        for txt_file in os.listdir(txt_path):
            txt_name = os.path.splitext(txt_file)[0]  #获取文件名
            txt_suffix = os.path.splitext(txt_file)[1]  # 获取后缀
            if images_name == txt_name:
                mycopyfile(images_path + images_name + images_suffix, copy_images_path + images_name + images_suffix)
                mycopyfile(txt_path + images_name + txt_suffix, copy_txt_path + images_name + txt_suffix)

    print("images文件复制%s个，txt文件复制%s个,总共复制%s个文件" % (len(os.listdir(copy_images_path)), len(os.listdir(copy_txt_path)), len(os.listdir(copy_images_path)) + len(os.listdir(copy_txt_path))))

if __name__ == '__main__':
    # 图片路径  #文件名不能包含冒号
    images_path = 'C:\\Users\\vvcat\\Desktop\\yolov5\\total\\images\\'

    # txt文件路径
    txt_path = 'C:\\Users\\vvcat\\Desktop\\yolov5\\total\\labels\\'

    # 图片复制路径
    copy_images_path = 'C:\\Users\\vvcat\\Desktop\\yolov5\\neaten\\images\\'

    # txt文件复制路径
    copy_txt_path = 'C:\\Users\\vvcat\\Desktop\\yolov5\\neaten\\labels\\'

    operation(images_path, txt_path, copy_images_path, copy_txt_path)

本文标签：助手精灵数据

版权声明：本文标题：Yolov5 使用精灵标注助手制作数据集内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1728584876a1164848.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

Yolov5 使用精灵标注助手制作数据集

makeTxt.py

voc_label.py

更多相关文章

ACE2005数据集介绍、预处理及事件抽取

直线回归数据 离群值_离群值如何在线性回归中构成问题。

节点精灵免Root安卓辅助脚本学习一：搭建环境

口袋精灵加速版java_口袋妖怪TCG！口袋对决加速版教程(免ROOT)

触动精灵和按键精灵哪个好,如何用按键精灵ios触动精灵及脚本写自动答题脚本...

触动精灵将图片转成base64字符串后通过post方式上传给服务器

udev机制 &amp; 守护进程 (精灵进程(Daemon)）

暗影精灵9 ubuntu2004更换显卡驱动，显卡直连以后黑屏了

【5】天猫精灵开放平台实验—基于天气查询模板创建开发屏显页面技能

如何创建 mapbox 精灵图

resnet18实战宝可梦精灵

三，天猫精灵SDK驱动开发板LED

python手机连点器代码_【触动精灵】手机万能连点器 Lua 源码

【IoT物联网全栈之路 ④ 设备端】安信可windows一体化环境IDE V1.5 ESP8266 SDK二次开发直连阿里云飞燕平台，天猫精灵语音控制；

pytorch——迁移学习实战宝可梦精灵分类

画太极图辅助程序_Python精灵模块应用实例

（一 ） 天猫精灵接入Home Assistant-服务器搭建

（12）香橙派+apache2与php+天猫精灵=自建平台语音支持--天猫精灵对接7

开维控制精灵Ctrl.js使用教程

天猫精灵智能设备对接-MySQL的安装(6)

发表评论

推荐文章

infrastructure是什么？

【最佳实践】基于 Arm 虚拟硬件平台完成在Cortex-M85上移植RT-Thread操作系统

云平台部署与管理

html5生成excel,H5纯前端生成Excel表格

套用带标题行的表格样式_excel表格样式采用内置样式 使用Excel 2010内置的单元格样式制作精美的表格效果...

热门文章

vim切换编程语言_Vim多语言编程必备十大插件

【工具】FTP软件FileZilla下载和连接服务器

尚硅谷Linux教程全套资料（包含Xshell6远程连接工具与FileZilla上传下载工具）

百度浏览器Android6.0,有些安卓机型百度浏览器h5唤起app失效

电脑网卡无法连接网络？三招教你解决问题

如何构建类似CMCC的公共场合WIFI认证过程

App测试基本流程详解

Linux就这个范儿 第12章 一个网络一个世界

【excel技巧】如何在Excel表格中添加选项按钮？

java解析excel日期类型报错,java中如何读取excel表格中的日期excle 读取时间中的分...

最新文章

计算机登陆后如何防止自动注销,电脑取消自动注销_电脑怎么取消自动注销

PC设置电脑断电恢复后自动重启

计算机在未关机的情况下重启,电脑不能关机,详细教您电脑关机后总是重启怎么办...

计算机休眠设置电源开关,电脑中的待机、休眠、睡眠和关机状态的区别。

ubuntu设置关机时自动执行任务

如何通过BIOS设置自动开机

设置电脑每天几点自动关机 windows10系统

win7命令设置自动关机

ubuntu设置自动关机

APC SUA1500ICH设置断电自动关闭服务器

WIN10永久杜比音效安装指南（2021）

计算机如何设置来电启动,如何让计算机来电后自动启动.doc

雷迪司后备式UPS设置Centos Linux服务器停电自动关机（命令行文本界面）

如何使用计算机处理文件,如何设置电脑自动清理文件

延时关机命令 linux,Ubuntu自动定时关机的方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

直线回归数据离群值_离群值如何在线性回归中构成问题。

udev机制 & 守护进程 (精灵进程(Daemon)）

（一）天猫精灵接入Home Assistant-服务器搭建

套用带标题行的表格样式_excel表格样式采用内置样式使用Excel 2010内置的单元格样式制作精美的表格效果...

Linux就这个范儿第12章一个网络一个世界

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载