Python:如何利用正则表达式统计词频

您所在的位置:网站首页 python英文文本词频统计代码 Python:如何利用正则表达式统计词频

Python:如何利用正则表达式统计词频

#Python:如何利用正则表达式统计词频| 来源: 网络整理| 查看: 265

1.打开PyCharm软件,创建一个Python文件,并准备一份有内容的文本文件。

2.引入re模块。

3.写上打开与关闭文件的代码。

4.统计单个英文字母出现的频率。

1、f.read()函数读取文件全部内容;

2、re.findall('i',f.read())获取文件中出现的i;

3、len()函数统计列表元素个数。

5.统计单个中文单词出现的频率,除了需要重新处理下文件偏移量外,其他步骤与第四步完全一致。

6.统计数字出现的频率(与第五步一致)。

7.统计英文字母出现的频率(与第五步一致)。

8.统计有多少个标点符号(与第五步一致)。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3