resnet18实战宝可梦精灵|电子爱好者

admin管理员组
文章数量:1609966

文件路径

pokemon.py（自定义数据集加载文件）

import torch
import os,glob
import random,csv
from torch.utils.data import Dataset,DataLoader
from torchvision import transforms
from PIL import Image


datapath="pokemon"

class Pokemon(Dataset):

    def __init__(self,root,resize,mode):
        super(Pokemon,self).__init__()
        self.root=root
        self.resize=resize
        self.name2label={}
        for name in sorted(os.listdir(os.path.join(root))):
            if not os.path.isdir(os.path.join(root,name)):
                continue
            self.name2label[name]=len(self.name2label.keys())
        # print(self.name2label)
        self.images,self.labels=self.load_csv("images.csv")

        if mode=="train":  #60%
            self.images=self.images[:int(0.6*len(self.images))]
            self.labels=self.labels[:int(0.6*len(self.labels))]
        elif mode=="val":  #20%  =60%->80%
            self.images = self.images[int(0.6 * len(self.images)):int(0.8 * len(self.images))]
            self.labels = self.labels[int(0.6 * len(self.labels)):int(0.8 * len(self.labels))]
        else:  #20%  =80%->100%
            self.images = self.images[int(0.8 * len(self.images)):]
            self.labels = self.labels[int(0.8 * len(self.labels)):]

    def load_csv(self,filename):

        if os.path.exists(os.path.join(self.root,filename))==0:
            images=[]
            for name in self.name2label.keys():
                images+=glob.glob(os.path.join(self.root,name,"*.png"))
                images+=glob.glob(os.path.join(self.root,name,"*.jpg"))
                images+=glob.glob(os.path.join(self.root,name,"*.jpeg"))
                images+=glob.glob(os.path.join(self.root,name,"*.gif"))
            # print(len(images),images)
# {bulbasaur:0,charmander:1,mewtwo:2   }
            random.shuffle(images)
            with open(os.path.join(self.root,filename),mode="w",newline="") as f:
                writer=csv.writer(f)
                for img in images:  #E:\\datasets\\pokemon\\bulbasaur\\00000000.png
                    name=img.split(os.sep)[-2]
                    label=self.name2label[name]
                    #E:\\datasets\\pokemon\\bulbasaur\\00000000.png   ,0
                    writer.writerow([img,label])
                print("writen into csv file:",filename)

        # read from csv file
        images,labels=[],[]
        with open(os.path.join(self.root,filename))as f:
            reader=csv.reader(f)
            for row in reader:
                img,label=row
                label=int(label)
                images.append(img)
                labels.append(label)

        assert len(images)==len(labels)

        return images,labels

    def __len__(self):
        return len(self.images)
    def denormalize(self,x_hat):
        mean=[0.485,0.456,0.406]
        std=[0.229,0.224,0.225]
        # x_hat=(x-mean)/std
        # x=x_hat*std=mean
        # x:[c,h,w]
        # mean:[3]=>[3,1,1]
        mean=torch.tensor(mean).unsqueeze(1).unsqueeze(1)
        std=torch.tensor(std).unsqueeze(1).unsqueeze(1)
        # print("x_hat",x_hat.shape,"std",std.shape,"mean",mean.shape)
        x=x_hat*std+mean
        return x

    def __getitem__(self, idx):

        #idx [0-len(images)]
        #self.images,self.labels
        #img:"pokemon\\bulbasaur\\0000000.png"   label :0
        img,label=self.images[idx],self.labels[idx]

        tf=transforms.Compose([
            lambda  x:Image.open(x).convert("RGB"),  #string path=>image data
            transforms.Resize((int(self.resize*1.25), int(self.resize*1.25))),
            transforms.RandomRotation(15),
            transforms.CenterCrop(self.resize),
            transforms.ToTensor(),
            transforms.Normalize(mean=[0.485,0.456,0.406],std=[0.229,0.224,0.225])  #mean,std为统计常量，给图像归一化
        ])
        img=tf(img)
        label=torch.tensor(label)

        return img,label


def main():
    from visdom import  Visdom
    import time
    import torchvision

    viz=Visdom()

    # 加载数据集，方法二
    """
        tf = transforms.Compose([
            transforms.Resize((64,64)),
            transforms.ToTensor(),
        ])
        db=torchvision.datasets.ImageFolder(root="pokemon",transform=tf)
        loader=DataLoader(db,batch_size=32,shuffle=True)
        print("make-code",db.class_to_idx)
        for x, y in loader:
            viz.images(x, nrow=8, win="batch", opts=dict(title="batch"))
            viz.text(str(y.numpy()), win="lablel", opts=dict(title="batch-y"))
            time.sleep(10)
    """

    db=Pokemon(datapath,128,"train")

    x,y=next(iter(db))
    print("sample",x.shape,y.shape,y)
    viz.image(db.denormalize(x),win="sample_x",opts=dict(title="sample_x"))
    loader=DataLoader(db,batch_size=32,shuffle=True,num_workers=8)
    for x,y in loader:
        viz.images(db.denormalize(x),nrow=8,win="batch",opts=dict(title="batch"))
        viz.text(str(y.numpy()),win="lablel",opts=dict(title="batch-y"))
        time.sleep(10)


if __name__=="__main__":
    main()

resnet.py（resnet网络模型定义）

import  torch
from    torch import  nn
from    torch.nn import functional as F

class ResBlk(nn.Module):
    """
    resnet block
    """

    def __init__(self, ch_in, ch_out, stride=1):
        """
        :param ch_in:
        :param ch_out:
        """
        super(ResBlk, self).__init__()

        self.conv1 = nn.Conv2d(ch_in, ch_out, kernel_size=3, stride=stride, padding=1)
        self.bn1 = nn.BatchNorm2d(ch_out)
        self.conv2 = nn.Conv2d(ch_out, ch_out, kernel_size=3, stride=1, padding=1)
        self.bn2 = nn.BatchNorm2d(ch_out)

        self.extra = nn.Sequential()
        if ch_out != ch_in:
            # [b, ch_in, h, w] => [b, ch_out, h, w]
            self.extra = nn.Sequential(
                nn.Conv2d(ch_in, ch_out, kernel_size=1, stride=stride),
                nn.BatchNorm2d(ch_out)
            )


    def forward(self, x):
        """
        :param x: [b, ch, h, w]
        :return:
        """
        out = F.relu(self.bn1(self.conv1(x)))
        out = self.bn2(self.conv2(out))
        # short cut.
        # extra module: [b, ch_in, h, w] => [b, ch_out, h, w]
        # element-wise add:
        out = self.extra(x) + out
        out = F.relu(out)

        return out


class ResNet18(nn.Module):

    def __init__(self, num_class):
        super(ResNet18, self).__init__()

        self.conv1 = nn.Sequential(
            nn.Conv2d(3, 16, kernel_size=3, stride=3, padding=0),
            nn.BatchNorm2d(16)
        )
        # followed 4 blocks
        # [b, 16, h, w] => [b, 32, h ,w]
        self.blk1 = ResBlk(16, 32, stride=3)
        # [b, 32, h, w] => [b, 64, h, w]
        self.blk2 = ResBlk(32, 64, stride=3)
        # # [b, 64, h, w] => [b, 128, h, w]
        self.blk3 = ResBlk(64, 128, stride=2)
        # # [b, 128, h, w] => [b, 256, h, w]
        self.blk4 = ResBlk(128, 256, stride=2)

        # [b, 256, 7, 7]
        self.outlayer = nn.Linear(256*3*3, num_class)

    def forward(self, x):
        """
        :param x:
        :return:
        """
        x = F.relu(self.conv1(x))

        # [b, 64, h, w] => [b, 1024, h, w]
        x = self.blk1(x)
        x = self.blk2(x)
        x = self.blk3(x)
        x = self.blk4(x)

        # print(x.shape)
        x = x.view(x.size(0), -1)
        x = self.outlayer(x)

        return x



def main():
    blk = ResBlk(64, 128)
    tmp = torch.randn(2, 64, 224, 224)
    out = blk(tmp)
    print('block:', out.shape)


    model = ResNet18(5)
    tmp = torch.randn(2, 3, 224, 224)
    out = model(tmp)
    print('resnet:', out.shape)

    p = sum(map(lambda p:p.numel(), model.parameters()))
    print('parameters size:', p)


if __name__ == '__main__':
    main()

train.py（训练文件）

import torch
from torch import optim,nn
import visdom
import torchvision
from torch.utils.data import DataLoader

from pokemon import Pokemon
from resnet import ResNet18


batchsz=32
lr=1e-3
epochs=20

device=torch.device("cuda")
torch.manual_seed(1234)
train_db=Pokemon("pokemon",224,mode="train")
val_db=Pokemon("pokemon",224,mode="val")
test_db=Pokemon("pokemon",224,mode="test")
train_loader=DataLoader(train_db,batch_size=batchsz,shuffle=True,
                        num_workers=4)
val_loader=DataLoader(val_db,batch_size=batchsz, num_workers=2)
test_loader=DataLoader(test_db,batch_size=batchsz, num_workers=2)

viz=visdom.Visdom()

def evalute(model,loader):
    correct=0
    total=len(loader.dataset)
    for x,y in loader:
        x,y=x.to(device),y.to(device)
        with torch.no_grad():
            logits=model(x)
            pred=logits.argmax(dim=1)
        correct+=torch.eq(pred,y).sum().float().item()
    return correct/total


def main():
    model=ResNet18(5).to(device)
    optimizer=optim.Adam(model.parameters(),lr=lr)
    criteon=nn.CrossEntropyLoss()
    best_acc,best_epoch=0,0
    global_step=0
    viz.line([0],[-1],win="loss",opts=dict(title="loss"))
    viz.line([0],[-1],win="val_acc",opts=dict(title="val_acc"))
    for epoch in range(epochs):

        for step,(x,y) in enumerate(train_loader):
            x,y=x.to(device),y.to(device)
            logits=model(x)
            # print("y", y.shape,y)
            # print("logits",logits.shape,logits)
            loss=criteon(logits,y)

            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            if step%10==0:
                print("epoch:",epoch,"step:",step,"loss:",loss.item())
            viz.line([loss.item()], [global_step], win="loss", update="append")
            global_step+=1
        if epoch%1==0:
            val_acc=evalute(model,val_loader)
            viz.line([val_acc], [global_step], win="val_acc", update="append")
            print("epoch:",epoch,"val_acc:",val_acc)
            if val_acc>best_acc:
                best_epoch=epoch
                best_acc=val_acc
                torch.save(model.state_dict(),"best.mdl")

    print("best acc:",best_acc,"best epoch:",best_epoch)
    
    
    model.load_state_dict(torch.load("best.mdl"))
    print("loaded from ckpt!")

    test_acc=evalute(model,test_loader)
    print("test acc:",test_acc)


if __name__ == '__main__':
    main()

utils.py

from    matplotlib import pyplot as plt
import  torch
from    torch import nn

class Flatten(nn.Module):

    def __init__(self):
        super(Flatten, self).__init__()

    def forward(self, x):
        shape = torch.prod(torch.tensor(x.shape[1:])).item()
        return x.view(-1, shape)


def plot_image(img, label, name):

    fig = plt.figure()
    for i in range(6):
        plt.subplot(2, 3, i + 1)
        plt.tight_layout()
        plt.imshow(img[i][0]*0.3081+0.1307, cmap='gray', interpolation='none')
        plt.title("{}: {}".format(name, label[i].item()))
        plt.xticks([])
        plt.yticks([])
    plt.show()

train_transfer.py 迁移学习实现

import torch
from torch import optim,nn
import visdom
import torchvision
from torch.utils.data import DataLoader

from pokemon import Pokemon
# from resnet import ResNet18
from torchvision.models import resnet18
from utils import Flatten


batchsz=32
lr=1e-3
epochs=20

device=torch.device("cuda")
torch.manual_seed(1234)
train_db=Pokemon("pokemon",224,mode="train")
val_db=Pokemon("pokemon",224,mode="val")
test_db=Pokemon("pokemon",224,mode="test")
train_loader=DataLoader(train_db,batch_size=batchsz,shuffle=True,
                        num_workers=4)
val_loader=DataLoader(val_db,batch_size=batchsz, num_workers=2)
test_loader=DataLoader(test_db,batch_size=batchsz, num_workers=2)

viz=visdom.Visdom()

def evalute(model,loader):
    correct=0
    total=len(loader.dataset)
    for x,y in loader:
        x,y=x.to(device),y.to(device)
        with torch.no_grad():
            logits=model(x)
            pred=logits.argmax(dim=1)
        correct+=torch.eq(pred,y).sum().float().item()
    return correct/total


def main():
    # model=ResNet18(5).to(device)
    trained_model=resnet18(pretrained=True)
    model=nn.Sequential(*list(trained_model.children())[:-1],  #[b,512,1,1]
                        Flatten(),  #[b,512,1,1]=>[b,512]
                        nn.Linear(512,5)
                        ).to(device)
    # x=torch.randn(2,3,224,224)
    # print(model(x).shape)
    optimizer=optim.Adam(model.parameters(),lr=lr)
    criteon=nn.CrossEntropyLoss()
    best_acc,best_epoch=0,0
    global_step=0
    viz.line([0],[-1],win="loss",opts=dict(title="loss"))
    viz.line([0],[-1],win="val_acc",opts=dict(title="val_acc"))
    for epoch in range(epochs):
        for step,(x,y) in enumerate(train_loader):
            x,y=x.to(device),y.to(device)
            logits=model(x)
            loss=criteon(logits,y)

            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            if step%10==0:
                print("epoch:",epoch,"step:",step,"loss:",loss.item())
            viz.line([loss.item()], [global_step], win="loss", update="append")
            global_step+=1
        if epoch%1==0:
            val_acc=evalute(model,val_loader)
            viz.line([val_acc], [global_step], win="val_acc", update="append")
            print("epoch:",epoch,"val_acc:",val_acc)
            if val_acc>best_acc:
                best_epoch=epoch
                best_acc=val_acc
                torch.save(model.state_dict(),"best.mdl")

    print("best acc:",best_acc,"best epoch:",best_epoch)
    model.load_state_dict(torch.load("best.mdl"))
    print("loaded from ckpt!")

    test_acc=evalute(model,test_loader)
    print("test acc:",test_acc)


if __name__ == '__main__':
    main()

本文标签：实战精灵宝可梦

版权声明：本文标题：resnet18实战宝可梦精灵内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1728584985a1164855.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

resnet18实战宝可梦精灵

文件路径

pokemon.py（自定义数据集加载文件）

resnet.py（resnet网络模型定义）

train.py（训练文件）

utils.py

train_transfer.py 迁移学习实现

更多相关文章

新一代分布式链路追踪skywalking编码实战教程（下）

Apache DolphinScheduler新一代分布式工作流任务调度平台实战

vulhub通关实战一（附docker vulhub 虚拟机环境）

《Ext JS 6.2实战》节选——使用Sencha Cmd创建应用程序

节点精灵免Root安卓辅助脚本学习一：搭建环境

linux鼠标键盘运行精灵,linux 基础操作

脚本精灵服务器引擎数据为空,脚本精灵服务器

精灵标注助手无法导入pascal文件

android脚本精灵miui,脚本精灵安卓apk下载

【5】天猫精灵开放平台实验—基于天气查询模板创建开发屏显页面技能

resnet18实战宝可梦精灵

php对接AliGenie天猫精灵服务器控制智能硬件esp8266② 全面认识第三方授权机制 oauth2.0 协议，如何在 php 上搭建 oauth2.0服务端！(附带demo)

按键精灵使用脚本编写测试Android入门与实战

解决精灵标注助手暂不支持导入pascal文件

pytorch——迁移学习实战宝可梦精灵分类

树莓派连接天猫精灵音箱通过蓝牙播放音乐的方法

（一 ） 天猫精灵接入Home Assistant-服务器搭建

cocos2.2.3精灵注册监听

（12）香橙派+apache2与php+天猫精灵=自建平台语音支持--天猫精灵对接7

（二叉树创建+查找）精灵邮差

发表评论

推荐文章

计算机网络基础知识总结，就这一篇了

如何轻松下载无水印的抖音视频：全面指南

尚硅谷Linux教程全套资料（包含Xshell6远程连接工具与FileZilla上传下载工具）

平板电脑 android系统升级,戴尔平板电脑Streak 10 Pro升级至安卓3.2 官方教程

小论快充（原理、协议、比较）

热门文章

SSD固态硬盘和HDD机械硬盘服务器区别

linux vim 编程插件,Vim多语言编程必备十大插件

Visual Studio || Visual Studio Code 连接 SQL Server 和 mysql

哥本哈根诠释（Copenhagen Interpretation）

智能手机双摄像头原理解析：RGB +Depth

整合spring boot admin 异常Connection refused: no further informati

电脑开机密码忘记了，怎么办？

几张表格怎么联动_excel表格怎么设置二级联动菜单

ACL2021 知识图谱、推荐系统相关论文

CVPR代码和论文链接目录大全

最新文章

[学习笔记]2020年win10最常用dos命令以及win+R即可运行的命令（使用命令打开自己想要的内容，总比找不到更好，赶快收藏）

史上最详细的Studio One 6.6.2破解版2024最新图文安装激活教程（附Crack下载）

WIN2012远程桌面授权服务器许可证问题解决方法

机器学习环境的搭建和使用----anacondajupytertensorflow-gpu opencv等 win10安装和常用使用方法总结

CorelDRAW2024精简版安装包下载包含CDR2024绿色永久激活码

win10系统连接wifi后可以上网但是显示【无Internet，安全】解决 and Maple初始化失败问题

EditPlus激活码

Xshell完美连接win10 Linux子系统

win10上成功运行faster-rcnn.pytorch-1.0

Beyond Compare 软件如何永久试用？

Office激活后还是弹激活窗口解决办法

typroa的永久使用

Win10下安装OpenVINO

【关闭个人数据跨境传输】

2024年手把手教你下载、安装和激活Guitarpro8中文永久破解版（附Crack）

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

（一）天猫精灵接入Home Assistant-服务器搭建

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载