完全基于情感词典的文本情感分析

您所在的位置:网站首页 snownlp函数 完全基于情感词典的文本情感分析

完全基于情感词典的文本情感分析

2023-03-24 08:19| 来源: 网络整理| 查看: 265

度。

⽬前,情感倾向分析的⽅法主要分为两类:⼀种是基于情感词典的⽅法;⼀种是基于机器学习的⽅法,如基于⼤规模语料库的机器学习。前

者需要⽤到标注好的情感词典;后者则需要⼤量的⼈⼯标注的语料作为训练集,通过提取⽂本特征,构建分类器来实现情感的分类。

⽂本情感分析的分析粒度可以是词语、句⼦、段落或篇章。

段落篇章级情感分析主要是针对某个主题或事件进⾏情感倾向判断,⼀般需要构建对应事件的情感词典,如电影评论的分析,需要构建电影

⾏业⾃⼰的情感词典,这样效果会⽐通⽤情感词典更好;也可以通过⼈⼯标注⼤量电影评论来构建分类器。句⼦级的情感分析⼤多通过计算

句⼦⾥包含的所有情感词的值来得到。

篇章级的情感分析,也可以通过聚合篇章中所有的句⼦的情感倾向来计算得出。因此,针对句⼦级的情感倾向分析,既能解决短⽂本的情感

分析,同时也是篇章级⽂本情感分析的基础。

中⽂情感分析的⼀些难点,⽐如句⼦是由词语根据⼀定的语⾔规则构成的,应该把句⼦中词语的依存关系纳⼊到句⼦情感的计算过程中去,

不同的依存关系,进⾏情感倾向计算是不⼀样的。⽂档的情感,根据句⼦对⽂档的重要程度赋予不同权重,调整其对⽂档情感的贡献程度

等。

SnowNLP 

快速进⾏评论数据情感分析

如果有⼈问,有没有⽐较快速简单的⽅法能判断⼀句话的情感倾向,那么

 SnowNLP 

库就是答案。

SnowNLP 

主要可以进⾏中⽂分词、词性标注、情感分析、⽂本分类、转换拼⾳、繁体转简体、提取⽂本关键词、提取摘要、分割句⼦、⽂

本相似等。

需要注意的是,⽤

 SnowNLP 

进⾏情感分析,官⽹指出进⾏电商评论的准确率较⾼,其实是因为它的语料库主要是电商评论数据,但是可以

⾃⼰构建相关领域语料库,替换单⼀的电商评论语料,准确率也挺不错的。

1. SnowNLP 

安装。

1

 

使⽤

 pip 

安装:

pip install snownlp==0.11.1

2

)使⽤

 Github 

源码安装。



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3