关联规则apriori算法python

您所在的位置:网站首页 groceries数据集 关联规则apriori算法python

关联规则apriori算法python

2023-04-15 17:22| 来源: 网络整理| 查看: 265

 

- 1 - 

关联规则

apriori

算法

python 

    

关联规则是数据挖掘中常用的一种技术,

通过挖掘数据集中各项

之间的关联关系,发现它们之间的规律性,进而为商业决策、产品推

荐等提供支持。

Apriori

算法是实现关联规则挖掘的一种常用方法,

其主要思想是通过寻找频繁项集,从而推导出关联规则。

    

Python

中实现

Apriori

算法,可以使用第三方库

`mlxtend`

首先需要导入相关库,包括

`numpy`

`pandas`

用于数据处理、

`mlxtend`

用于实现

Apriori

算法。代码如下:

    ```python 

    import numpy as np 

    import pandas as pd 

    from mlxtend.frequent_patterns import apriori 

    from mlxtend.frequent_patterns import association_rules 

    ``` 

    

接下来,

需要读取数据集并进行预处理。

数据集应该是一个包含

多个样本的二维数组,

每个样本代表一个事务,

每个事务包含多个项。

这里以示例数据集

`groceries.csv`

为例:

    ```python 

    # 

读取数据

    data = pd.read_csv('groceries.csv', header=None) 

    # 

将数据转为

one-hot

编码

    data_encoded = pd.get_dummies(data) 



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3