Python关联分析之 |
您所在的位置:网站首页 › apriori算法找频繁项集 › Python关联分析之 |
相关定义
Support(支持度):表示同时包含 A 和 B 的事务占所有事务的比例。如果用 P(A) 表示包含 A 的事务的比例,那么 Support = P(A & B)
Confidence(可信度):表示包含 A 的事务中同时包含 B 的事务的比例,即同时包含 A 和 B 的事务占包含 A 的事务的比例。公式表达:Confidence = P(A & B)/ P(A)
Lift(提升度):表示“包含 A 的事务中同时包含 B 的事务的比例”与“包含 B 的事务的比例”的比值。公式表达:Lift = ( P(A & B)/ P(A) ) / P(B) = P(A & B)/ P(A) / P(B)。 提升度反映了关联规则中的 A 与 B 的相关性,提升度 > 1 且越高表明正相关性越高,提升度 < 1 且越低表明负相关性越高,提升度 = 1 表明没有相关性。 安装函数库 打开命令行窗口,输入 pip install apyori 测试安装: from apyori import apriori 使用说明 from apyori import apriori data = [['豆奶','莴苣'], ['莴苣','尿布','葡萄酒','甜菜'], ['豆奶','尿布','葡萄酒','橙汁'], ['莴苣','豆奶','尿布','葡萄酒'], ['莴苣','豆奶','尿布','橙汁']] result = list(apriori(transactions=data) # apriori其他参数说明: min_support -- The minimum support of relations (float).最小支持度,可用来筛选项集 min_confidence -- The minimum confidence of relations (float).最小可信度,可用来筛选项集 min_lift -- The minimum lift of relations (float).最小提升度 max_length -- The maximum length of the relation (integer).序列最小长度 附Apriori库函数相关文档 转载自Python关联分析之——Apriori算法 转载自数据挖掘关联分析中的支持度、置信度和提升度 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |