python nltk 自然语音处理基础|电子爱好者

admin管理员组
文章数量:1612689

英文文本分词

import nltk.tokenize as tk

doc = "Are you curious about tokenization? " \
      "Let's see how it works! " \
      "We need to analyze a couple of sentences " \
      "with punctuations to see it in action."
print(doc)
print('-' * 30)

# 文本分词 分成句子
tokens = tk.sent_tokenize(doc)
for i, token in enumerate(tokens):
    print("%2d" % (i + 1), token)
print('-' * 30)

# 文本分词  分成单词 方法一
tokens = tk.word_tokenize(doc)
for i, token in enumerate(tokens):
    print("%2d" % (i + 1), token)

print('-' * 30)
# 文本分词  分成单词 方法二
tokenizer = tk.WordPunctTokenizer()
tokens = tokenizer.tokenize(doc)
for i, token in enumerate(tokens):
    print("%2d" % (i + 1), token)

英文词干提取

import nltk.stem.porter as pt
import nltk.stem.lancaster as lc
import nltk.stem.snowball as sb

# 单词
words = ['table', 'probably', 'wolves', 'playing',
         'is', 'dog', 'the', 'beaches', 'grounded',
         'dreamt', 'envision']

# 三种提干提取方式
pt_stemmer = pt.PorterStemmer()
lc_stemmer = lc.LancasterStemmer()
sb_stemmer = sb.SnowballStemmer('english')

# 词干提取 并显示
for word in words:
    pt_stem = pt_stemmer.stem(word)
    lc_stem = lc_stemmer.stem(word)
    sb_stem = sb_stemmer.stem(word)
    print('%8s %8s %8s %8s' % (
        word, pt_stem, lc_stem, sb_stem))

英文词性还原

import nltk.stem as ns

# 单词
words = ['table', 'probably', 'wolves', 'playing',
         'is', 'dog', 'the', 'beaches', 'grounded',
         'dreamt', 'envision']

# 词性还原
lemmatizer = ns.WordNetLemmatizer()

# 词性还原并显示
for word in words:
    n_lemma = lemmatizer.lemmatize(word, pos='n')
    v_lemma = lemmatizer.lemmatize(word, pos='v')
    print('%8s %8s %8s' % (word, n_lemma, v_lemma))

本文标签：语音自然基础 Python nltk

版权声明：本文标题：python nltk 自然语音处理基础内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1728632015a1167187.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

【小5聊】jquery基础之offset和position的top、left值

12小时前

假如有这么一个需求，当打开下拉ul列表，列表值能够滚动到指定li中显示 1、offset() offset() 方法返回或设置匹配元素相对于文档的偏移（位置&#xf

pythonUnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-3:

12小时前

python 错误提示 w.writerows(results)UnicodeEncodeError: ascii codec cant encode characters in position 0-3: ordinal not in r

python编码报错：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbc in position 2: invalid start byt

12小时前

UnicodeDecodeError: utf-8 codec cant decode byte 0xbc in position 2: invalid start byte 解决问题 UnicodeDecodeError: utf-8 c

Python报错：UnicodeDecodeError: ‘utf8‘ codec can‘t decode byte 0xa4 in position 712: invalid start byte

11小时前

在对一个网页进行爬取的时候，数据能取下来，最后解析的时候报错： UnicodeDecodeError: utf8 codec cant decode byte 0xa4 i

【python-bug】日期正则表达式 unbalanced parenthesis at position 64

11小时前

# 正则表达式import repatternre.compile(r"^((19[2-9]d{1})|(20((0?[0-9])|(1?[0-8])))) ((0?[1-9])|(1?[0-2])) ((0?[1-

python open报错：‘gbk‘ codec can‘t decode byte 0xbd in position xxxx: illegal multibyte sequence

11小时前

python 打开文件： fopen(logpath, r)bufff.read()出错：UnicodeDecodeError: gbk codec cant decode byte

python报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb8 in position 9: invalid start byte

11小时前

python版本3.9.1 场景: 将一个byte数据串转成字符串格式时使用.decode()报错: 分析: 出现异常报错是由于设置了decode()方法的第二个参数errors为严格（strict&#xff

python显示安装失败_Win7安装Python失败提示Setup failed

9小时前

一、安装报错如图所示，双击Python安装包后进行安装显示Setup failed 安装失败： 二、错误排除 1.首先查看自己的计算机是否已经安装了 Win7 Service Pack 1大

C++基础篇之STL库（一）——string的使用及其模拟实现

7小时前

文章目录 string类简介string类成员变量string类构造与析构构造函数拷贝构造赋值重载析构函数 string类迭代器string类容量操作reserve函数resize函数 string类插入push_backappendins

Anaconda 安装python时出错：Collecting package metadata (current_repodata.json): failed

6小时前

condarc’文件复制一下代码 channels: - defaults show_channel_urls: true default_channels: - https:mirrors.tuna.tsinghua.ed

python matplotlib RuntimeWarning: Glyph xxxxx missing from current font.字体设置问题

5小时前

错误信息 D:Anaconda3libsite-packagesmatplotlibbackendsbackend_agg.py:180: RuntimeWarning: Glyph 26041 missing from cu

Python：RuntimeError: The current Numpy installation

5小时前

问题描述 Python运行时报错：RuntimeError: The current Numpy installation (‘E:Pythonlibsite-packagesnumpyinit.py’)

Python-PackagesNotFoundError: The following packages are not available from current channels

5小时前

Python-PackagesNotFoundError: The following packages are not available from current channels 在conda用以下命令安装mlxtend的时候报错&

Photoshop零基础全套学习教程资源百度云分享

3小时前

这几年有这么一段话，在网上十分流行：韩国的整容，太过的人妖，中国的PS，是当下社会的新三大奇迹。这其中的PS&#xff0c

python ---- fundamental iteration

1小时前

those in python can use for loops, and those can traverse？ 答：iterable objects or objects that umpl

python fundamental structure_Python for BioinformaticsPDF 下载

1小时前

As mentioned in the previous chapter, some data structures are shared between different computer languages, but some of

RANSAC求解基础矩阵----ORB-SLAM2

1小时前

根据特征点匹配，随机生成每组包含8对匹配特征点的集合用于归一化八点算法 *** brief 并行地计算基础矩阵和单应性矩阵，选取其中一个模型，恢复出最开始两帧之间的相对姿态

语音信号处理

1小时前

文章目录语音信号处理第一章绪论第二章语音信号处理基础知识语音和语言 **浊音的声带振动基本频率（fundamental frequency）称为基音频率。浊音的基音频率&#xff08

python基础知识整理

54分钟前

文章目录 1.列表去重2.Python中如何拷贝一个对象1).浅拷贝：2).深拷贝：3).特殊拷贝：4) 举例： 3.赋值、深拷贝与浅拷贝的区别一、赋值

Python获取Windows用户图片文件夹路径

15分钟前

使用Python获取Windows系统下的默认图片路径、文档路径、下载路径都可以使用以下方法： 只需要更改Pictures为对应名称即可，例如Downloads等。 os.path.join(o

电子爱好者 - 最新技术资讯及电子产品介绍！

python nltk 自然语音处理基础

英文 文本分词

英文 词干提取

英文 词性还原

更多相关文章

【小5聊】jquery基础之offset和position的top、left值

pythonUnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-3:

python编码报错：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbc in position 2: invalid start byt

Python报错：UnicodeDecodeError: ‘utf8‘ codec can‘t decode byte 0xa4 in position 712: invalid start byte

【python-bug】日期正则表达式 unbalanced parenthesis at position 64

python open报错：‘gbk‘ codec can‘t decode byte 0xbd in position xxxx: illegal multibyte sequence

python报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb8 in position 9: invalid start byte

python显示安装失败_Win7安装Python失败 提示Setup failed

C++基础篇之STL库（一）——string的使用及其模拟实现

Anaconda 安装python时出错：Collecting package metadata (current_repodata.json): failed

python matplotlib RuntimeWarning: Glyph xxxxx missing from current font.字体设置问题

Python：RuntimeError: The current Numpy installation

Python-PackagesNotFoundError: The following packages are not available from current channels

Photoshop零基础全套学习教程资源百度云分享

python ---- fundamental iteration

python fundamental structure_Python for BioinformaticsPDF 下载

RANSAC求解基础矩阵----ORB-SLAM2

语音信号处理

python基础知识整理

Python获取Windows用户图片文件夹路径

发表评论

推荐文章

CSS里面position：relative与position：absolute 区别

position:sticky 粘性定位 (sticky) 与 固定定位

Unexpected token o in JSON at position 1 报错原因

MYSQL基础：参数调优:3:InnoDB调优参数示例

基于java的土地档案管理系统设计与实现(项目报告+答辩PPT+源代码+数据库+部署视频)

热门文章

WIN10什么都没开内存占用率过高， WIN7单网卡设置双IP，命令续期

【win7旗舰版64位通过硬盘安装Ubuntn16.04双系统】

大型分布式电商系统架构是如何从0开始演进的？

win10系统激活相关知识

报错：Unexpected token u in JSON at position 0

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd3 in position 0: invalid continuation byte解决

MyEclipse的优化与快捷键的设置

优雅地实现无线路由器桥接

从小市值因子策略入手，带你入门量化投资 (附年化收益率77.83%策略)

计算机视觉学习7_多视图几何_基础矩阵

最新文章

windows安装mycat

ElasticSearch6.X下载安装（Windows版本）

windows下安装sentinel

Windows10下如何提升双网卡提升网速，叠加网卡，跃点数

Windows下安装GTK+（整理）

Windows10下安装wget

Windows运维终端安装syslog日志客户端

windows下Node版本的切换方式

Windows nc命令下载使用与使用bash建立反弹shell

Tomcat下载（Linux版本和Windows版本）

windows安装部署hadoop 2.7.7

JDK7下载|JDK1.7下载可选择window版和linux版

JDK 1.6.0_43 下载

boost的下载和安装(windows版)

windows 系统下protobuf-2.6.1的安装说明

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

英文文本分词

英文词干提取

英文词性还原

python显示安装失败_Win7安装Python失败提示Setup failed

position:sticky 粘性定位 (sticky) 与固定定位

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载