200个句子搞定3500个高考词汇,究竟有多少词? |
您所在的位置:网站首页 › 高考英语单词有多少个 › 200个句子搞定3500个高考词汇,究竟有多少词? |
200个句子搞定3500个高考词汇,究竟有多少词?
起因分析方法取出来所有英文对每行进行第1次预处理将所有行合并成一行替换掉文中的逗号分出每个单词并逐行输出
问题排查python查一行python读全部文本替换掉异常文本
结果最终大致单词数2300词组未计算在内
起因
发现杨哥单词总是背单词表,容易忘,期末考试过后在网上发现了200句记3500个词汇的小册子,一看句子还不错,在很多相似的词编写在一个句子里,对照着看,如respectable,respectful,respect,以及effect,affect, make efforts,诸如此类。突然间很好奇,这些个句子真的是3500个词吗?于是想着分析一下。 分析方法写程序显然不是我的选择。第一想法是用命令进行分析。 取出来所有英文这个很简单,网上有处理好的。实际上网上处理好的下载时要钱,我是自己把200个中文剪切掉放到文后的。 对每行进行第1次预处理通过.号,将索引1、2、3和文末的小.都去掉。 awk -F “.” '{print $2}‘ 这一句能成立主要是句子中间没有小. 将所有行合并成一行使用paste命令格式化打印,-d指定分隔符,-s表示合并成一行: paste -d" " -s - < test.txt 替换掉文中的逗号英语里最多的就是逗号,用sed替换成空格。 sed ‘s/,/ /g’ t2.txt >t3.txt 现在得到一个基本上全是空格的长字符串。可以进行单词输出了。 分出每个单词并逐行输出cat cc1.txt |awk -F " " ‘{for(i=1;i |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |