关联规则apriori算法python |
您所在的位置:网站首页 › groceries数据集 › 关联规则apriori算法python |
- 1 - 关联规则 apriori 算法 python
关联规则是数据挖掘中常用的一种技术, 通过挖掘数据集中各项 之间的关联关系,发现它们之间的规律性,进而为商业决策、产品推 荐等提供支持。 Apriori 算法是实现关联规则挖掘的一种常用方法, 其主要思想是通过寻找频繁项集,从而推导出关联规则。
在 Python 中实现 Apriori 算法,可以使用第三方库 `mlxtend` 。 首先需要导入相关库,包括 `numpy` 和 `pandas` 用于数据处理、 `mlxtend` 用于实现 Apriori 算法。代码如下:
```python import numpy as np import pandas as pd from mlxtend.frequent_patterns import apriori from mlxtend.frequent_patterns import association_rules ```
接下来, 需要读取数据集并进行预处理。 数据集应该是一个包含 多个样本的二维数组, 每个样本代表一个事务, 每个事务包含多个项。 这里以示例数据集 `groceries.csv` 为例:
```python # 读取数据
data = pd.read_csv('groceries.csv', header=None) # 将数据转为 one-hot 编码
data_encoded = pd.get_dummies(data) |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |