自然语言工具包NLTK安装出现的问题及解决办法

您所在的位置:网站首页 如何解决错误代码11004的问题 自然语言工具包NLTK安装出现的问题及解决办法

自然语言工具包NLTK安装出现的问题及解决办法

2024-04-26 15:50| 来源: 网络整理| 查看: 265

NLTK库是Python中最为常用的NLP(自然语言处理)工具,它提供了易于使用的接口,通过这些接口可以访问超过50个语料库和词汇资源(如WordNet),还有一套用于分类、标记化、词干标记、解析和语义推理的文本处理库,以及工业级NLP库的封装器和一个活跃的讨论论坛。

接下来介绍一下windows环境下该库的安装方法以及我碰到的坑。

使用pip进行安装是最为方便的,在命令提示符中输入

pip install nltk

即可完成安装,在命令提示符中输入python进入解释器,输入如下代码:

import nltk

nltk.download( )

但在执行nltk.download()报错:[WinError 10054]远程主机强迫关闭了一个现有连接

1585239611891651.png

解决方法:首先手动下载nltk数据集,

然后把下载好的压缩包解压至上图中的Download Directory目录下,每个人的机子这个地方可能不一样。

之后打开python命令行,输入from nltk.book import *,出现以下结果则说明安装成功:

1585239655809336.png

到这里,说明nltk库已经安装好了,但是在编程测试的时候,仍然报错:

sentence = 'The brown fox is quick and he is jumping over the lazy dog'

import nltk

tokens = nltk.word_tokenize(sentence)

tagged_sent = nltk.pos_tag(tokens)

print(tagged_sent)

错误1:punkt没找到

解决方案:

1、打开路径:D:\nltk_data\tokenizers,发现有一个名为的压缩包;

2、选中该压缩包,解压到当前目录下

再次运行上述程序,又报错,错误为:D:\nltk_data\tokenizers\punkt\PY3\english.pickle没找到,

1585239791913165.png

解决方案:

1、打开路径C:\Users\TY\AppData\Roaming\nltk_data\tokenizers\punkt,发现其实存在english.pickle

2、路径检索的时候多了个\PY3\,所以,在C:\Users\TY\AppData\Roaming\nltk_data\tokenizers\punkt 新建一下文件夹,命名为PY3,然后将文件english.pickle拷贝进去PY3文件夹下

再次运行程序,结果正确:

1585239835691708.png

总结

如果在运行程序时,提示说没有找到某个文件,那么可以去该路径下查看,是否没有解压文件,或者路径不对。

按照提示路径创建文件即可。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3