完全基于情感词典的文本情感分析 |
您所在的位置:网站首页 › snownlp函数 › 完全基于情感词典的文本情感分析 |
度。 ⽬前,情感倾向分析的⽅法主要分为两类:⼀种是基于情感词典的⽅法;⼀种是基于机器学习的⽅法,如基于⼤规模语料库的机器学习。前 者需要⽤到标注好的情感词典;后者则需要⼤量的⼈⼯标注的语料作为训练集,通过提取⽂本特征,构建分类器来实现情感的分类。 ⽂本情感分析的分析粒度可以是词语、句⼦、段落或篇章。 段落篇章级情感分析主要是针对某个主题或事件进⾏情感倾向判断,⼀般需要构建对应事件的情感词典,如电影评论的分析,需要构建电影 ⾏业⾃⼰的情感词典,这样效果会⽐通⽤情感词典更好;也可以通过⼈⼯标注⼤量电影评论来构建分类器。句⼦级的情感分析⼤多通过计算 句⼦⾥包含的所有情感词的值来得到。 篇章级的情感分析,也可以通过聚合篇章中所有的句⼦的情感倾向来计算得出。因此,针对句⼦级的情感倾向分析,既能解决短⽂本的情感 分析,同时也是篇章级⽂本情感分析的基础。 中⽂情感分析的⼀些难点,⽐如句⼦是由词语根据⼀定的语⾔规则构成的,应该把句⼦中词语的依存关系纳⼊到句⼦情感的计算过程中去, 不同的依存关系,进⾏情感倾向计算是不⼀样的。⽂档的情感,根据句⼦对⽂档的重要程度赋予不同权重,调整其对⽂档情感的贡献程度 等。 SnowNLP 快速进⾏评论数据情感分析 如果有⼈问,有没有⽐较快速简单的⽅法能判断⼀句话的情感倾向,那么 SnowNLP 库就是答案。 SnowNLP 主要可以进⾏中⽂分词、词性标注、情感分析、⽂本分类、转换拼⾳、繁体转简体、提取⽂本关键词、提取摘要、分割句⼦、⽂ 本相似等。 需要注意的是,⽤ SnowNLP 进⾏情感分析,官⽹指出进⾏电商评论的准确率较⾼,其实是因为它的语料库主要是电商评论数据,但是可以 ⾃⼰构建相关领域语料库,替换单⼀的电商评论语料,准确率也挺不错的。 1. SnowNLP 安装。 ( 1 )
使⽤ pip 安装: pip install snownlp==0.11.1 ( 2 )使⽤ Github 源码安装。 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |