Python:如何利用正则表达式统计词频 |
您所在的位置:网站首页 › python英文文本词频统计代码 › Python:如何利用正则表达式统计词频 |
1.打开PyCharm软件,创建一个Python文件,并准备一份有内容的文本文件。 2.引入re模块。 3.写上打开与关闭文件的代码。 4.统计单个英文字母出现的频率。 1、f.read()函数读取文件全部内容; 2、re.findall('i',f.read())获取文件中出现的i; 3、len()函数统计列表元素个数。 5.统计单个中文单词出现的频率,除了需要重新处理下文件偏移量外,其他步骤与第四步完全一致。 6.统计数字出现的频率(与第五步一致)。 7.统计英文字母出现的频率(与第五步一致)。 8.统计有多少个标点符号(与第五步一致)。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |