NNDL 作业4：第四章课后题|电子爱好者

admin管理员组
文章数量:1579086

习题4-2 试设计一个前馈神经网络来解决 XOR 问题，要求该前馈神经网络具有两个隐藏神经元和一个输出神经元，并使用 ReLU 作为激活函数．

实现代码：

import torch
import torch.nn as nn
import torch.nn.functional as F
from sklearn.metrics import accuracy_score
import numpy as np
from sklearn.svm import SVC


# XOR问题由两个全连接层构成
class XORModule(nn.Module):
    def __init__(self):
        super(XORModule, self).__init__()
        self.fc1 = nn.Linear(2, 2)
        self.fc2 = nn.Linear(2, 1)
        self.relu = nn.ReLU()

    def forward(self, x):
        x = x.view(-1, 2)
        x = self.relu((self.fc1(x)))
        x = self.fc2(x)
        return x


# 输入和输出数据
input_x = torch.Tensor([[0, 0], [0, 1], [1, 0], [1, 1]]).to(torch.float32)
label = torch.Tensor([[0], [1], [1], [0]]).to(torch.float32)
# 设置损失函数和参数优化函数
module = XORModule()
learing_rate = 0.01
epochs = 10000
loss_function = nn.MSELoss(reduction='mean')  # 用交叉熵损失函数会出现维度错误
optimizer = torch.optim.SGD(module.parameters(), lr=learing_rate)  # 用Adam优化参数选不好会出现计算值超出0-1的范围

# 进行训练
for epoch in range(epochs):
    out_y = module(input_x)
    loss = loss_function(out_y, label)  # 计算损失函数
    # print('啦啦啦')
    optimizer.zero_grad()  # 对梯度清零，避免造成累加
    loss.backward()  # 反向传播
    optimizer.step()  # 参数更新

out_test = module(input_x)
print( "前馈神经网络的准确率：{}%".format(accuracy_score(out_test.detach().numpy().astype(np.int64), label.detach().numpy()) * 100))

输出结果：

准确率有点低，增加隐藏层数再试试

import torch
import torch.nn as nn
import torch.nn.functional as F
from sklearn.metrics import accuracy_score
import numpy as np
from sklearn.svm import SVC


# XOR问题由两个全连接层构成
class XORModule(nn.Module):
    def __init__(self):
        super(XORModule, self).__init__()
        self.fc1 = nn.Linear(2, 50)
        self.fc2 = nn.Linear(50, 1)
        self.relu = nn.ReLU()

    def forward(self, x):
        x = x.view(-1, 2)
        x = self.relu((self.fc1(x)))
        x = self.fc2(x)
        return x


# 输入和输出数据
input_x = torch.Tensor([[0, 0], [0, 1], [1, 0], [1, 1]]).to(torch.float32)
label = torch.Tensor([[0], [1], [1], [0]]).to(torch.float32)
# 设置损失函数和参数优化函数
module = XORModule()
learing_rate = 0.01
epochs = 10000
loss_function = nn.MSELoss(reduction='mean')  # 用交叉熵损失函数会出现维度错误
optimizer = torch.optim.SGD(module.parameters(), lr=learing_rate)  # 用Adam优化参数选不好会出现计算值超出0-1的范围

# 进行训练
for epoch in range(epochs):
    out_y = module(input_x)
    loss = loss_function(out_y, label)  # 计算损失函数
    # print('啦啦啦')
    optimizer.zero_grad()  # 对梯度清零，避免造成累加
    loss.backward()  # 反向传播
    optimizer.step()  # 参数更新

out_test = module(input_x)
print( "前馈神经网络的准确率：{}%".format(accuracy_score(out_test.detach().numpy().astype(np.int64), label.detach().numpy()) * 100))

得到结果：

这是非常好的结果了

习题4-3 试举例说明“死亡ReLU问题”，并提出解决方法

梯度消失：在神经网络的构建过程中，随着网络层数的增加，理论上网络的拟合能力也应该是越来越好的。但是随着网络变深，参数学习更加困难，容易出现梯度消失问题。由于Sigmoid型函数的饱和性，饱和区的导数更接近于0，误差经过每一层传递都会不断衰减。当网络层数很深时，梯度就会不停衰减，甚至消失，使得整个网络很难训练，这就是所谓的梯度消失问题。

在深度神经网络中，减轻梯度消失问题的方法有很多种，一种简单有效的方式就是使用导数比较大的激活函数，如：ReLU，但ReLu会出现“死亡ReLU”问题。

死亡ReLU问题：ReLU激活函数是改善梯度消失问题的一种方法，但是在某些情况下容易出现死亡 ReLU问题，使得网络难以训练。这是由于当x<0时，ReLU函数的输出恒为0。在训练过程中，如果参数在一次不恰当的更新后，某个ReLU神经元在所有训练数据上都不能被激活（即输出为0），那么这个神经元自身参数的梯度永远都会是0，在以后的训练过程中永远都不能被激活。

改善方法：

1.我认为最简单的方法是调整学习率。我们知道，ReLU叠加越多层越容易出现神经元活性失效，所以可以简单通过降低学习率的方法来缓解神经元活性失效的问题。甚至可以说这是一种通用且有效的方法。

2.将激活函数更换为Leaky ReLU函数，这个尝试在本周的实验中就已经试过，效果也十分的显著。

习题4-7 为什么在神经网络模型的结构化风险函数中不对偏置b进行正则化?

这个问题对我而言太难，于是查找资料得到如下说法：

对于神经网络正则化，一般只对每一层仿射变换的weights进行正则化惩罚，而不对偏置bias进行正则化。

相比于weight，bias训练准确需要的数据要更少。每个weight指定了两个变量之间的关系。weights训练准确需要在很多种情况下的同时观察两个变量。每个bias只控制一个变量。这意味着不对bias正则化，没有引入很多方差（variance）。同时，对bias进行正则化容易引起欠拟合。

原文：

Before delving into the regularization behavior of different norms, we note that for neural networks, we typically choose to use a parameter norm penalty Ω that penalizes only the weights of the affine transformation at each layer and leaves the biases unregularized. The biases typically require less data to fit accurately than the weights. Each weight specifies how two variables interact. Fitting the weight well requires observing both variables in a variety of conditions. Each bias controls only a single variable. This means that we do not induce too much variance by leaving the biases unregularized.Also,regularizing the bias parameters can introduce a significant amount of underfitting.

总结：

这个偏置 b 对于函数来说只是平移，并且 b 对输入的改变是不敏感的，无论输入变大还是变小，b 对结果的贡献只是一个偏置，因此其对过拟合没有帮助。

习题 4-8 为什么在用反向传播算法进行参数学习时要采用随机参数初始化的方式而不是直接令 w= 0, 𝒃 = 0？

如果 W=0,b=0 ，第一次计算时，隐藏层神经元的计算结果是完全相同的，并且在反向传播时参数更新也一致，导致每两层间的参数都一样，等价于隐藏层只有 1 个神经元，浪费资源，减缓效率。

用之前实验的例子：

二分类准确率维持为50%左右，说明模型没有学到任何内容。训练和验证loss几乎没有怎么下降。

习题4-9 梯度消失问题是否可以通过增加学习率来缓解？

梯度消失问题是由于激活函数为类似于Sigmoid，其值太大或太小时导数都趋于0，并且在深层网络中，误差反向传播时，传播到前几层时梯度信息也会很小。现在问可否通过增大学习率来增大梯度，以至于梯度信息可以在更新时变大，应该是不行，增大学习率带来的缺陷会比梯度消失问题更加严重，学习率变大时，很容易使得参数直接跳过最优值点，然后梯度方向改变，导致参数优化时无法有效收敛，进而无法得到理想的训练结果。

总结心得：

这几个问题都与前面的实验有关，所以回答起来会比较有经验，不会的就上网搜资料再自己理解一下，也算是查漏补缺，循序渐进的进步吧。

本文标签：作业第四章课后 NNDL

版权声明：本文标题：NNDL 作业4：第四章课后题内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1727844932a1132976.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

NNDL 作业4：第四章课后题

习题4-2 试设计一个前馈神经网络来解决 XOR 问题，要求该前馈神经网络具有两个隐藏神经元和一个输出神经元，并使用 ReLU 作为激活函数．

习题4-3 试举例说明“死亡ReLU问题”，并提出解决方法

习题4-7 为什么在神经网络模型的结构化风险函数中不对偏置b进行正则化?

习题 4-8 为什么在用反向传播算法进行参数学习时要采用随机参数初始化的方式而不是直接令 w= 0, 𝒃 = 0？

习题4-9 梯度消失问题是否可以通过增加学习率来缓解？

更多相关文章

结对作业_core组

HTML期末学生大作业（9套）html+css+javascript仿京东、天猫、服装、各大电商模板(大学毕业设计)

HIT 计算机系统大作业 程序人生-Hello’s P2P

2021年T电梯修理模拟试题及T电梯修理作业考试题库

用Python写个自动批改作业系统！

《深入理解Android 卷III》第四章 深入理解WindowManagerService（完整版）

20级信安第一次作业

QGhappy小组成立以及开始作业

数据平台作业调度系统详解－实践篇

安卓期末大作业-记账app（含源码+导出app+运行截图）附下载链接

操作系统第八次作业

第 4 节课作业-XTuner 微调个人小助手认知

手机上做c语言作业的软件下载,手机c语言编程软件

HTML5期末大作业：小说网页设计——在线阅读7页(代码质量好) 学生DW网页设计作业源码 web课程设计网页规划与设计

(全网最全)微型计算机原理与接口技术第六版课后习题答案-周荷琴，冯焕清-第1章微型计算机的基础知识和发展概况-中国科学技术大学出版社

第四章：网络应用技术

C语言课后习题(19)

网络空间安全导论课程作业

NNDL 作业4：第四章课后题

吴恩达机器学习作业8（下）--- 推荐系统

发表评论

推荐文章

'__pendingCallbacks[...].async' 错误

HTTP 错误 500.19- Internal Server Error 错误解决方法

用关键词获取店铺详情

Aria2打造属于自己的下载神器

谷歌浏览器自定义视频的倍速播放

热门文章

CodeForces 645E Intellectual Inquiry（构造+贪心+dp）

破解无线上网密码 无线WEP密码破解

2024办公文件怎么加密？常用的8款加密软件排行榜

SpringBoot（一）使用itelliJ社区版创建SpringBoot项目

计算机会显示机械硬盘丢失,Win10机械硬盘突然消失，无法检测到解决方案

linux下硬盘修复：you are in emergency mode......

centos7 修改主机名重启后导致 welcome to emergency mode

2021-06-16

谷歌浏览器有些链接无法跳转

谷歌浏览器怎么长截图怎么截_Chrome谷歌浏览器如何截取整个网页长图？

最新文章

一芯FC1178BC主控U盘量产修复指南

慧荣SMISM3280AB开卡量产工具适用于无法识别设备黑片U盘量产工具修复使用

u盘无法识别怎么办，u盘无法识别解决方法

linux 下u盘分区修复无法识别问题解决

定了，6大领域93个开源任务，阿里开源导师带你参与中科院开源之夏2022

识别到硬盘 计算机不显示盘符,笔者教你修复可以识别u盘但不显示盘符的问题...

agio U盘强制弹出导致的无法识别需格式化的问题的修复方案

U盘无法与计算机连接,U盘无法连接电脑

通过修复VMware软件解决虚拟机无法识别到U盘设备的问题

@mysql数据库面试手册

修复U盘【笔记】

Ubuntu及Debian下挂载U盘及exFat文件系统U盘无法挂载的解决

linux usb3.0无法识别u盘启动,Deepin 20系统能识别USB3.0：如果不能用请重启系统或重插几次...

为什么计算机无法读取u盘,电脑无法识别读取U盘怎么办？逐一排查解决问题

解决Ubuntu下U盘无法识别的问题

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

HIT 计算机系统大作业程序人生-Hello’s P2P

《深入理解Android 卷III》第四章深入理解WindowManagerService（完整版）

破解无线上网密码无线WEP密码破解

识别到硬盘计算机不显示盘符,笔者教你修复可以识别u盘但不显示盘符的问题...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载