Pytorch简单实现BiLSTM文本生成|电子爱好者

admin管理员组
文章数量:1642443

一、准备数据

seq = "I love you. Chinese vocabulary is generally used to express one's feelings to another person whom one admires. It can also be used among relatives. It is the expression of one person's feelings to another. It can also be used to express things with strong feelings, such as pets and goods. It can be said by boys to girls, girls to boys, girls to girls, boys to boys."

此后需要将数据转换为小写并且去除标点符号，保留空格，并且建立字母索引表，如下所示：

index2word = {0: 'a', 1: 'b', 2: 'c', 3: 'd', 4: 'e', 5: 'f', 6: 'g', 7: 'h', 8: 'i', 9: 'j', 10: 'k', 11: 'l', 12: 'm', 13: 'n', 14: 'o', 15: 'p', 16: 'q', 17: 'r', 18: 's', 19: 't', 20: 'u', 21: 'v', 22: 'w', 23: 'x', 24: 'y', 25: 'z', 26: ' '}
word2index = {'a': 0, 'b': 1, 'c': 2, 'd': 3, 'e': 4, 'f': 5, 'g': 6, 'h': 7, 'i': 8, 'j': 9, 'k': 10, 'l': 11, 'm': 12, 'n': 13, 'o': 14, 'p': 15, 'q': 16, 'r': 17, 's': 18, 't': 19, 'u': 20, 'v': 21, 'w': 22, 'x': 23, 'y': 24, 'z': 25, ' ': 26}

再将seq中的使用index表示，例如 :

"i love" = ['i', ' ', 'l', 'o', 'v', 'e'] = [8, 26, 11, 14, 21, 4]

最后设置窗口大小，例如：每5个字母预测下一个字母，设置window = 5，如图：

二、模型

输入采用embedding生成词向量输入
模型采用双向LSTM接一个LSTM，将LSTM最后一个隐层作为全连接层的输入
此模型图如下所示：

三、具体代码

import torch
import torch.nn as nn
import torch.optim as optim
import torch.utils.data as Data
from torch.autograd import Variable


seq = "I love you. Chinese vocabulary is generally used to express one's feelings to another person whom one admires. It can also be used among relatives. It is the expression of one person's feelings to another. It can also be used to express things with strong feelings, such as pets and goods. It can be said by boys to girls, girls to boys, girls to girls, boys to boys."
letters = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', ' ']
# 转为小写并去除标点符号
seq_lower = [i for i in seq.lower() if i in letters]

word2index = {}
id = 0
for i in letters:
    word2index[i] = id
    id += 1
index2word = {value: key for key, value in word2index.items()}

# 句子索引
seq_index = [word2index[i] for i in seq_lower]
seq_length = len(seq_index)
window = 3
# 生成输入数据
batch_x = []
batch_y = []
for i in range(seq_length - window + 1):
    x = seq_index[i: i + window]
    if i + window >= seq_length:
        y = word2index[' ']
    else:
        y = seq_index[i + window]
    batch_x.append(x)
    batch_y.append(y)

# 训练数据
batch_x, batch_y = Variable(torch.LongTensor(batch_x)), Variable(torch.LongTensor(batch_y))

# 参数
vocab_size = len(letters)
embedding_size = 16
n_hidden = 32
batch_size = 10
num_classes = vocab_size

dataset = Data.TensorDataset(batch_x, batch_y)
loader = Data.DataLoader(dataset, batch_size, shuffle=True)

# 建立模型
class BiLSTM(nn.Module):
    def __init__(self):
        super(BiLSTM, self).__init__()
        self.word_vec = nn.Embedding(vocab_size, embedding_size)
        # bidirectional双向LSTM
        self.bilstm = nn.LSTM(embedding_size, n_hidden, 1, bidirectional=True)
        self.lstm = nn.LSTM(2 * n_hidden, 2 * n_hidden, 1, bidirectional=False)
        self.fc = nn.Linear(n_hidden * 2, num_classes)

    def forward(self, input):
        embedding_input = self.word_vec(input)
        # 调换第一维和第二维度
        embedding_input = embedding_input.permute(1, 0, 2)
        bilstm_output, (h_n1, c_n1) = self.bilstm(embedding_input)
        lstm_output, (h_n2, c_n2)= self.lstm(bilstm_output)
        fc_out = self.fc(lstm_output[-1])
        return fc_out

model = BiLSTM()
print(model)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 训练
for epoch in range(50):
    cost = 0
    for input_batch, target_batch in loader:
        pred = model(input_batch)
        loss = criterion(pred, target_batch)
        cost += loss.item()
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
    print("Epoch: %d,  loss: %.5f " % (epoch, cost))

# 测试
test_text = 'lov'
test_batch = [[word2index[i] for i in test_text]]
test_batch = torch.LongTensor(test_batch)
out = model(test_batch)
predict = torch.max(out, 1)[1].item()
print(test_text,"后一个字母为：", index2word[predict])

本文标签：文本简单 Pytorch BiLSTM

版权声明：本文标题：Pytorch简单实现BiLSTM文本生成内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1729339600a1197374.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

Python实现简单可学习的手写体识别

1天前

1.前言版本：Python3.6.1PyQt5SQL Server 2012 以前一直觉得，机器学习、手写体识别这种程序都是很高大上很难的于是我开始顺着思路打算用Python、P

6代u笔记本完美支持win7_Z170等六代主板装WIN7后USB不能用实测超简单解决教程

1天前

Z170等主板属于第六代INTEL CPU的主板，而这个版本以后Intel在skylake平台上移除了EHCI主控，改为XHCI主控支持，而原生的WIN7系统并不支持XHCI

华为电视测试软件,简单便捷！实测教你华为智慧屏怎么样用USB安装APP

1天前

原标题：简单便捷！实测教你华为智慧屏怎么样用USB安装APP 之前入手华为智慧屏V65已经一段时间，对于前段时间有网友说华为智慧屏应用市场里面的APP很少&#xff0

java里面abstract和implement的简单认识

1天前

1. 简单认识abstract和implement 概念： 在java里面所有对象都是用来描述类的，但是不是所有的类都是用来描述类的，那么问题来了，

java游戏代码大全_求一个简单的Java小游戏的代码

1天前

展开全部连连看的小源码 package Lianliankan; import javax.swing.*; import java.awt.*; import java.awt.event.*; public class lianlia

html枪战游戏代码大全,3D枪战射击游戏cs简单版源代码

1天前

【实例简介】 3D枪战射击游戏cs简单版源代码，本代码用opengl开发，使用vc6.0适用于初学者【实例截图】【核心代码】 vccs └── vccs ├── CDSound.cpp ├──

Win10系统设置文件夹密码的简单方法

1天前

随着计算机和互联网的普及，我们越来越需要保护我们的个人文件和隐私。在Windows 10系统中，设置文件夹密码是一种简单而有效的方式来保护你的私密文件。本文将介绍如何使用编程来实现这个目标。下面是一个使用Python编程语言的示例代码，

Ubuntu 16.04-18.04中安装 WPS Office 2016 for Linux（集合篇含字体解决方法）简单好用

19小时前

金山软件办公套件的最新更新 WPS 2016 for Linux，日前发布了几项新功能，性能改进和各种修复。为什么选择WPS办公套件？ WPS Office由三个主要组件组

绿盾软件加密保存的文本或文档文件后怎么临时解密

15小时前

将文件的后缀名改为xml保存。然后再改回原有的格式，你会发现加锁图标没有了。

python实现简单的文件加密与解密

14小时前

2019独角兽企业重金招聘Python工程师标准>>> 对于任意的一个文件，本质上来讲都是二进制的。对于任意一个二进制数a，对其用另外任意一个与a的位数相同的二进制数m进行

对视频文件进行简单的加密

14小时前

需求： -同参考链接里的需求相同，对视频文件的头文件信息进行修改，然后存放在本地；防止有人拷贝出去使用；在软件播放是&#x

Linux MD5加密的简单使用

14小时前

文章目录一. 什么是MD5二. Linux下的简单实现三. 测试最近看到PPP拨号在验证时，有两种验证方式，一种是口令验证协商(PAP)，另一种是挑战-握手验证协议(CH

Java实现文本加密

14小时前

0x0 0x1 题目描述现对一个文本文件进行加密，保存成另一个文件，然后对此文件解密，查看解密后结果。 0x2 解释读、写的方法有点多，还

C++ 简单的文件加密和解密实例

14小时前

从网上淘了一段文件加密的程序，看完之后，明白了它所谓的文件加密，其实原理相当简单： 即是按字节或按位读取一个要加密的文件中的数据&#xf

Qt对中文文件的简单加密解密

14小时前

中文文件加密、解密，最简单的方法即可利用 QByteArrary::toBase64()，QByteArray::fromBase64()函数进行转码和解码进行简单加密、解密即自己写个简

echart简单介绍

5小时前

echarts简介百度开发团队制作，开源交给apache基金管理制作图表的JavaScript库 echarts步骤 var echartecharts.init(dom节点,主题) 例如&#xf

Deliver for Mac ，简单好用的ftp传输工具

4小时前

Deliver for Mac是一款简单好用的ftp传输工具，可以通过互联网和本地网络轻松发送和共享文件，不限制数量，发送完毕后，发送电子邮件通知&am

MessageDeliver类似于EventBus轻量级的简单的事件处理机制,足够用,超简单

4小时前

MessageDeliver 简单的时间处理,类似于EventBus的轻量级事件分发器,轻松处理fragment之间的数据互调,activity与service数据的互调,非常方便,同时非常简单,不需要学习EventBus复杂的逻辑,对于

如何把rmvb转换成mp4格式简单操作转换

2小时前

很多时候，我们从网上下载的电影是rmvb格式的，想要在随身播放器上播放视频，绝大多数还是需要转换的，并且手机、MP4播放器类、PSP等还有所不同&

ImportError: Failed to load PyTorch C extensions

2小时前

问题描述在项目中安装其他的库之后，运行项目忽然报这个错： ImportError: Failed to load PyTorch C extensions:It apperas that Py

电子爱好者 - 最新技术资讯及电子产品介绍！

Pytorch简单实现BiLSTM文本生成

一、准备数据

二、模型

三、具体代码

更多相关文章

Python实现简单可学习的手写体识别

6代u笔记本完美支持win7_Z170等六代主板装WIN7后USB不能用实测超简单解决教程

华为电视测试软件,简单便捷！实测教你华为智慧屏怎么样用USB安装APP

java里面abstract和implement的简单认识

java游戏代码大全_求一个简单的Java小游戏的代码

html枪战游戏代码大全,3D枪战射击游戏cs简单版源代码

Win10系统设置文件夹密码的简单方法

Ubuntu 16.04-18.04中安装 WPS Office 2016 for Linux（集合篇含字体解决方法）简单好用

绿盾软件加密保存的文本或文档文件后怎么临时解密

python实现简单的文件加密与解密

对视频文件进行简单的加密

Linux MD5加密的简单使用

Java实现文本加密

C++ 简单的文件加密和解密 实例

Qt对中文文件的简单加密解密

echart简单介绍

Deliver for Mac ，简单好用的ftp传输工具

MessageDeliver类似于EventBus轻量级的简单的事件处理机制,足够用,超简单

如何把rmvb转换成mp4格式简单操作转换

ImportError: Failed to load PyTorch C extensions

发表评论

推荐文章

自然语言处理NLP入门之SpaCy

在Oracle VM VirtualBox虚拟机中ubuntu识别U盘和USB设备

电脑是如何识别USB 3.0 U盘的

disabled属性的添加与移除

这台计算机是办公网络的一部分,win10专业版更改不了这是一台家庭计算机,不是办公网络的一部分如何处理...

热门文章

防火墙iptables

Visio 2016 MSI 与 Office 2016 Click-to-Run 冲突导致无法安装的解决方法

java大文件存储加密_Java IO--实现文件的加密解密

网络安全课程设计Java实现DES加密算法(可视化界面)代码+设计文档

推荐几个Mac超好用软件工具工作效率提高300%！

解决elementUI select 的disabled属性设置无效问题一例

使用el-cascader，动态添加disabled

《数据结构》_PTA_数据结构作业2：栈和队列

安装pexpect遇到的坑

Photoshop CS6调整界面字体大小

最新文章

【win11】解决win11家庭版没有组策略编辑器

win11关闭Hyper-V

VirtualBox 安装 win11 虚拟机

win11文件访问被拒绝解决方法win11不能修改c盘文件修改权限的解决办法

win11安装虚拟机

Win11文件类型怎么改？Win11修改文件后缀的方法

win11toast：python桌面通知工具

Win11高效日历推荐(六十六)

win11多桌面功能怎么使用 win11多桌面设置步骤

Win11动态磁贴没了？Win11中恢复动态磁贴的方法

Win11系统更新后任务栏不见了怎么恢复？Win11任务栏不见了恢复方式最新分享

win11磁盘分区_win11系统磁盘如何分区

win11桌面一直刷新闪屏无法操作怎么办？快速排查并修复Win11中的屏幕闪烁问题

延迟win11的更新

Win11怎么共享文件夹？Win11创建共享文件夹的方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

C++ 简单的文件加密和解密实例

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载