机器翻译实战（英译汉）Transformer代码学习详解|电子爱好者

admin管理员组
文章数量:1532440

任务目标

基于Transformer实现英语翻译汉语。如有疏忽请多指教

数据

Hi.	嗨。
Hi.	你好。
Run.	你用跑的。
Wait!	等等！
Hello!	你好。
I try.	让我来。
I won!	我赢了。
Oh no!	不会吧。
Cheers!	乾杯!
Got it?	你懂了吗？
He ran.	他跑了。
Hop in.	跳进来。
I lost.	我迷失了。
I quit.	我退出。
I'm OK.	我沒事。
Listen.	听着。
No way!	不可能！
No way!	没门！
Really?	你确定？
Try it.	试试吧。
We try.	我们来试试。
Why me?	为什么是我？
……     ……

代码&数据来源

Github：transformer-simple
哈弗NLP

Transformer模型结构

Transformer的组成
    1. Encoder
        a. 若干个EncoderLayer（两个子层）
            i. Feed Forward Neural Network
            connected layer.子层间使用Add & Normalization 相连
            ii. Self-Attention
    2. Decoder
        a. 若干个DecoderLayer（三个子层）
            i. Feed Forward Neural Network
            connected layer.子层间使用Add & Normalization 相连
            ii. Encoder-Decoder-Attention，常规注意力机制
            connected layer.子层间使用Add & Normalization 相连
            iii. Self-Attention，自注意力机制

Batch and Masking

Mask策略一

一种就是普通的mask，就是自然语言处理中将某些字符（如标点符号，空格等）进行mask的操作

# 该部分与transformer实现有关
class Batch:
    """
    Batches and Masking
    "Object for holding a batch of data with mask during training." 在训练期间使用mask处理数据
    """
    def __init__(self, src, trg=None, pad=0):
        """
        构造函数
        @param src: 源数据
        @param trg: 目标数据
        @param pad: 需要mask掉的字符，默认为0
        一共有两种mask的方式：
        一种就是普通的mask，就是自然语言处理中将某些字符（如标点符号，空格等）进行mask的操作
        另一种就是对目标数据的mask，其原因是为了不让decoder在训练中看到后续的内容（即，我对于下一个字符的预测，只来源于前面的字符）
        对于src的mask就是第一种mask，而对于tgt的mask是第一种加第二种
        """
        # 将numpy.array转换为张量torch.tensor
        src = torch.from_numpy(src).to(args.device).long()
        trg = torch.from_numpy(trg).to(args.device).long()

        self.src = src
        # 此处pad=0，src向量均不为0(0表示UNK标识)，src!=pad生成bool数组，且数组所有元素均为True
        # 此处为第一种mask策略
        self.src_mask = (src != pad).unsqueeze(-2) # unsqueeze()扩展维度，负数表示扩展的维度在倒数第n个位置
        if trg is not None:
            self.trg = trg[:, :-1]  # 截掉trg中每个句子最后一个字符<EOS>
            self.trg_y = trg[:, 1:]  # 截掉trg中每个句子第一个字符<BOS>
            self.trg_mask = self.make_std_mask(self.trg, pad)  # 对trg掩蔽
            self.ntokens = (self.trg_y != pad).data.sum()

    @staticmethod
    def make_std_mask(tgt, pad):
        """
        mask 目标数据
        "Create a mask to hide padding and future words." 翻译：创造一个mask来屏蔽补全词和字典外的词进行屏蔽
        @param tgt: 即构造函数中的trg，目标数据
        @param pad: 需要mask的字符，默认为0
        @return: 返回mask后的目标数据
        """
        # 此处为第一种mask策略
        tgt_mask = (tgt != pad).unsqueeze(-2)  # 由于没有0，此时布尔矩阵全为True
        # 此处为第二种mask策略，调用utils中的subsequent_mask方法得到上三角布尔矩阵
        # Variable()封装tensor，并存储tensor的梯度，与tgt_mask做与运算
        tgt_mask = tgt_mask & Variable(subsequent_mask(tgt.size(-1)).type_as(tgt_mask.data))
        return tgt_mask

Mask策略二

另一种就是对目标数据的mask，其原因是为了不让decoder在训练中看到后续的内容（即，我对于下一个字符的预测，只来源于前面的字符）

def subsequent_mask(size):
    """
    第二种mask策略
    "Mask out subsequent positions."
    @param size: 句子长度
    @return:
    """
    attn_shape = (1, size, size)
    # np.triu函数生成一个对角线位置上移一位的上三角矩阵（k=1代表按对角线方向上移），矩阵大小为attn_shape
    subsequent_mask = np.triu(np.ones(attn_shape), k=1).astype('uint8')
    return torch.from_numpy(subsequent_mask) == 0  # 返回布尔矩阵，subsequent_mask上三角矩阵中0的位置对应True

make_model

构造Transformer模型

def make_model(src_vocab, tgt_vocab, N = 6, d_model = 512, d_ff = 2048, h = 8, dropout = 0.1):
    """
    定义了一个接收超参数并生成完整模型的函数。
    @param src_vocab: 源数据字典长度
    @param tgt_vocab: 目标数据字典长度
    @param N: 层数layer
    @param d_model: 表征后的维度
    @param d_ff: FeedForward输出维度
    @param h: attention机制，head多头个数
    @param dropout:
    @return:
    """
    c = copy.deepcopy
    attn = MultiHeadedAttention(h, d_model).to(args.device)  # 多头注意力机制
    ff = PositionwiseFeedForward(d_model, d_ff, dropout).to(args.device)
    position = PositionalEncoding(d_model, dropout).to(args.device)  # 位置信息嵌入
    # model其实是Transformer的类
    model = Transformer(
        Encoder(EncoderLayer(d_model, c(attn), c(ff), dropout).to(args.device), N).to(args.device),
        Decoder

本文标签：机器翻译详解实战代码英译汉

版权声明：本文标题：机器翻译实战（英译汉）Transformer代码学习详解内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1726843177a1086788.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

FT2004(D2000)开发实战之AMD HD8570显卡驱动适配

22小时前

一 AMD显卡驱动概述 Linux内核显卡驱动又叫DRM驱动，目前Linux内核中有两种用于Radeon显卡的DRM驱动：一种是radeon驱动，支持R100 ~ GCN2的各个子系列的显卡，代码位于driversgpudrmrad

VirtualBox虚拟机CentOS打不开，无法开机，代码E_FALL

19小时前

VirtualBox中CentOS虚拟机打不开，开机出现如图错误右键以管理员身份运行VirtualBox再重新开启虚拟机就好了具体原因也不是很了解，不过是在数据库作业中遇到的小bug罢了……

手机打开html乱码怎么解决,打开网页出现乱码怎么办打开网页出现乱码解决方法【详解】...

19小时前

时代不断发展，科技不断进步，电脑已经成为我们日常生活中不可取代的通讯工具，它可以让我们及时的浏览到世界各地的信息，也可以让我们及时得出里自己的工作文件&

Android开发实战《手机安全卫士》——13.“缓存清理”模块实现

19小时前

文章目录 1.缓存清理——获取缓存过程2.缓存清理——获取有缓存的应用 & 添加到线性布局3.缓存清理——获取缓存界面进度条更新4.缓存清理——清理缓存功能5.缓存清理——单个应用缓存清理6.缓存清理——选项卡使用7.缓存清理——S

用代码记住家里面的WiFi密码

12小时前

"老王，你家的 WiFi 账号密码是什么呀？" 你慢悠悠的接过手机，找到 WiFi 设置，选择你家里的 WiFi &#xf

快速实现WIFI TCP通信详解

11小时前

ESP8266作为TCP Client和Server通信一、本例程实现功能二、 Core提供的TCP功能介绍三、接线图五、完整代码（通过IP地址和服务器建立连接）六、完整代码&#xff0

DELL电脑Windows出现蓝屏 0x0000007B代码解决办法

9小时前

STOP 0x0000007B(0xF78DA63C,0x0000034,0X x0000000,0x0000000 error message if I booted with Windows XP. I resolved the iss

0x0000007b电脑蓝屏是什么原因_0x0000007b蓝屏代码原因分析及解决办法

9小时前

最近有网友问我电脑出现0x0000007b电脑蓝屏是什么原因？0x0000007b电脑蓝屏通常情况是硬盘的存储控制器驱动加载错误导致故障。出现0x0000007b蓝屏代码的原因有很多比如硬盘模式、安装的系统没有集成相关

蓝屏代码分析

9小时前

1.停止错误编号:0x0000000A 说明文字:IRQL-NOT-LESS-OR-EQUAL 通常的原因:驱动程序使用了不正确的内存地址. 解决方法：如果无法登陆,则重新启动计算机.当出现可用的作系统列表时,按F8键

win蓝屏代码

9小时前

0x0000 作业完成。 0x0001 不正确的函数。 0x0002 系统找不到指定的档案。 0x0003 系统找不到指定的路径。 0x0004 系统无法开启档案。 0x0005 拒绝存取。 0x0006 无效的代码

IDEA的安装、配置与使用详解

9小时前

IDEA的安装、配置与使用详解目录结构 IDEA的安装、配置与使用详解一、IDEA介绍1. Jet Brains公司介绍2. IDEA介绍3. IDEA的主要功能介绍4. IDEA的主要优势：(相较于Eclipse)5. IDEA的官网下

试用AI生成代码工具Fauxpilot,详细安装过程

6小时前

设置服务预先说明需要预先安装支持NVIDIA的docker,docker compose > 1.28不能再容器里运行，否则出现以下报错： rootc536ca0dbd64:te

Transformer整体结构代码详解

6小时前

我对于Transformer结构的pytorch版本进行了代码的梳理以及部分解析，Transformer在自然语言处理以及计算机视觉领域均大放异彩，极大地促进了语言以及视觉(ViT,Swin-T)

5.5 ControllerAdvice注解 -《SSM深入解析与项目实战》

6小时前

项目中所有的源码都可以在此链接的仓库中找到：https:githubchenhaoxianguifuture-ssm 文章目录 5.5 ControllerAdvice注解ControllerAdvice源码ControllerAd

计算机蓝屏代码0000a,Win7系统出现蓝屏代码0x000000a的原因及解决方法

4小时前

win7系统电脑遇见蓝屏故障问题已经是常见故障，引起蓝屏问题的原因又是各种各样的，首先我们要根据蓝屏代码提示找到原因及解决方法。最近有位用户说win7系统蓝屏代码提示0x000000a&#

2023最新网站在QQ打开自动跳转浏览器打开(qq自动跳转浏览器代码)

3小时前

最新可用网站在QQ打开自动跳转浏览器打开，这个代码检测到是qq打开网站就会跳转到浏览器打开，不过在我测试的时候发现只能跳转到qq浏览器，其他浏览器不会跳。把代码加到页面里面

你也可以成为数据分析师: 实战案例手把手教你如何在ChatGPT内使用Code Interpreter进行数据分析

3小时前

终于，OpenAI向所有Plus用户开放了Code Interpreter功能，这真是个令人振奋的好消息！我迫不及待地开始了测试，并且测试结果出奇地令人满意。借助Python代码的强大功能，Code Interpreter在数

【Unity】AI实战应用——Unity接入GPT和对游戏开发实际应用的展望

3小时前

GPT for unity插件地址: GitHub - sunsvipChatGPTForUnity: ChatGPT for unity 用法: 打开Unity PackageManager界面.Add package from g

科技论文英语翻译英译汉

2小时前

3-1 对翻译的认识翻译是在准确（信）、通顺（达）的基础上，把一种语言信息转变成另一种语言信息的行为。“翻”是从一种语言形式转换

Web前端-----英译汉词典的实现

1小时前

主程序：英译汉词典.html 子程序：demo.js

电子爱好者 - 最新技术资讯及电子产品介绍！

机器翻译实战（英译汉）Transformer代码学习详解

任务目标

数据

代码&数据来源

Transformer模型结构

Batch and Masking

Mask策略一

Mask策略二

make_model

更多相关文章

FT2004(D2000)开发实战之AMD HD8570显卡驱动适配

VirtualBox虚拟机CentOS打不开，无法开机，代码E_FALL

手机打开html乱码怎么解决,打开网页出现乱码怎么办 打开网页出现乱码解决方法【详解】...

Android开发实战《手机安全卫士》——13.“缓存清理”模块实现

用代码记住家里面的WiFi密码

快速实现WIFI TCP通信详解

DELL电脑Windows出现蓝屏 0x0000007B代码解决办法

0x0000007b电脑蓝屏是什么原因_0x0000007b蓝屏代码原因分析及解决办法

蓝屏代码分析

win蓝屏代码

IDEA的安装、配置与使用详解

试用AI生成代码工具Fauxpilot,详细安装过程

Transformer整体结构代码详解

5.5 ControllerAdvice注解 -《SSM深入解析与项目实战》

计算机蓝屏 代码0000a,Win7系统出现蓝屏代码0x000000a的原因及解决方法

2023最新网站在QQ打开自动跳转浏览器打开(qq自动跳转浏览器代码)

你也可以成为数据分析师: 实战案例手把手教你如何在ChatGPT内使用Code Interpreter进行数据分析

【Unity】AI实战应用——Unity接入GPT和对游戏开发实际应用的展望

科技论文英语翻译 英译汉

Web前端-----英译汉词典的实现

发表评论

推荐文章

使用Python自动打开Chrome浏览器

linux恢复安卓数据,安卓数据恢复2 - ranfs的个人空间 - OSCHINA - 中文开源技术交流社区...

linux开机启动出现grup,开机出现grub解决方法

拯救老电脑，win10 LTSC版、黑苹果、ubuntu20.04、Android x86等系统安装记录

图形处理单元(GPU)的演进

热门文章

win10 卸载cuda10.1

chrome浏览器实现进入网页自动全屏模式

解决win11系统笔记本触摸板无反应的问题

amd的cpu跑python_AMD用于深度学习到底Yes吗？ 基于mkl和openblas的numpy运算速度小测与安装教程...

手机usb计算机连接不能选择,USB调试 是灰色按钮，无法点击，现在手机无法与电脑连接。...

win11开始菜单怎么修改成win10风格 Windows11开始菜单修改成win10右键风格的设置方法

ubuntu搜狗输入法崩溃处理方法

Mac直接拔掉移动硬盘无法识别或识别要很久的解决方法

处理过多SQL Server PAGEIOLATCH_SH等待类型

英语易混淆词语：四六级，考研均适用（持续更新中~）

最新文章

mac 苹果电脑恢复 Recovery HD；进不去恢复模式；

计算机名改了怎么恢复,手把手练习win10系统改计算机名和工作组的恢复技巧

Ubuntu18.04系统备份与恢复软件推荐——Systemback

联想服务器系统如何备份软件,联想笔记本如何使用系统自带备份还原功能进行备份与还原系统...

华为鸿蒙系统操作教程_华为鸿蒙OS 2.0还原EMUI11稳定版教程

计算机怎么恢复上一步,电脑怎么撤销上一步操作

Win7系统还原，创建还原点，永久保存自定义还原点，不被删除

记录一次系统迁移&amp;恢复(manjaro+timeshift)

计算机环境变量怎么恢复默认,windows10系统中环境变量怎么恢复默认

计算机桌面显示左右有黑边,电脑两边黑边怎么还原

计算机桌面显示变小,电脑屏幕变小怎么还原回来

计算机桌面任务栏过宽怎么处理,任务栏变宽怎么还原_电脑下方任务栏变宽了的处理方法－系统城...

在虚拟环境下进行Windows 10系统备份与恢复

惠普战66系统还原后，在桌面右击鼠标很卡处理

计算机自带游戏删掉还能装吗,电脑自带游戏删除后怎么恢复

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

手机打开html乱码怎么解决,打开网页出现乱码怎么办打开网页出现乱码解决方法【详解】...

计算机蓝屏代码0000a,Win7系统出现蓝屏代码0x000000a的原因及解决方法

科技论文英语翻译英译汉

amd的cpu跑python_AMD用于深度学习到底Yes吗？基于mkl和openblas的numpy运算速度小测与安装教程...

手机usb计算机连接不能选择,USB调试是灰色按钮，无法点击，现在手机无法与电脑连接。...

记录一次系统迁移&恢复(manjaro+timeshift)

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载