读入数据+使用snownlp进行情感分析

您所在的位置:网站首页 snownlp情感分析原理准确率 读入数据+使用snownlp进行情感分析

读入数据+使用snownlp进行情感分析

2023-11-07 08:46| 来源: 网络整理| 查看: 265

读入数据

tsv与csv读入相同,只是加一个sep=’\t’,指定分隔符就好。(csv以’,'分割)

pcfr = pd.read_csv('pacifier.tsv', sep='\t', dtype={'review_body':str, 'review_headline':str})

dataframe按列名提取,注意是两层[]

df = pcfr a = df[['review_headline','review_body']]

查看dataframe相关信息

a.info() a.type() a.head()#默认六行,可以指定 a.tail() 使用snowlnp进行情感分析

参考blog:传送门

from snownlp import SnowNLP # 用第一行的评论内容做个小实验。 text=a.review_body.iloc[0] s = SnowNLP(text) s.sentiments #output : 0.14448966846220868

处理一整列的两种方法:1 写函数

# 情感分析数值可以正确计算。在此基础上,我们需要定义函数,以便批量处理所有的评论信息。 def get_sentiment_cn(text): s = SnowNLP(text) return s.sentiments tst = [] tst = a.review_body.apply(get_sentiment_cn)

2 lambda+apply

coms=[] coms=a.review_body.apply(lambda x: SnowNLP(x).sentiments)

根据情感分析结果分类

# 情感分析,coms在0~1之间,以0.5分界,大于0.5,则为正面情感 pos_data=a[coms>=0.6] # 此处取0.6是为了使的词的情感更强烈点 neg_data=a[coms


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3