Python关联分析之

您所在的位置:网站首页 apriori算法找频繁项集 Python关联分析之

Python关联分析之

2024-07-03 05:03| 来源: 网络整理| 查看: 265

相关定义

Support(支持度):表示同时包含 A 和 B 的事务占所有事务的比例。如果用 P(A) 表示包含 A 的事务的比例,那么 Support = P(A & B)

 

Confidence(可信度):表示包含 A 的事务中同时包含 B 的事务的比例,即同时包含 A 和 B 的事务占包含 A 的事务的比例。公式表达:Confidence = P(A & B)/ P(A)

 

Lift(提升度):表示“包含 A 的事务中同时包含 B 的事务的比例”与“包含 B 的事务的比例”的比值。公式表达:Lift = ( P(A & B)/ P(A) ) / P(B) = P(A & B)/ P(A) / P(B)。

提升度反映了关联规则中的 A 与 B 的相关性,提升度 > 1 且越高表明正相关性越高,提升度 < 1 且越低表明负相关性越高,提升度 = 1 表明没有相关性。

 

安装函数库

打开命令行窗口,输入

pip install apyori

测试安装:

from apyori import apriori

 

使用说明

from apyori import apriori

data = [['豆奶','莴苣'],         ['莴苣','尿布','葡萄酒','甜菜'],         ['豆奶','尿布','葡萄酒','橙汁'],         ['莴苣','豆奶','尿布','葡萄酒'],         ['莴苣','豆奶','尿布','橙汁']]

result = list(apriori(transactions=data)

# apriori其他参数说明: min_support -- The minimum support of relations (float).最小支持度,可用来筛选项集 min_confidence -- The minimum confidence of relations (float).最小可信度,可用来筛选项集 min_lift -- The minimum lift of relations (float).最小提升度 max_length -- The maximum length of the relation (integer).序列最小长度

附Apriori库函数相关文档

转载自Python关联分析之——Apriori算法

转载自数据挖掘关联分析中的支持度、置信度和提升度  



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3