主成分分析(PCA)原理与特征选取

您所在的位置:网站首页 常见的降维算法有什么 主成分分析(PCA)原理与特征选取

主成分分析(PCA)原理与特征选取

2024-07-10 16:41| 来源: 网络整理| 查看: 265

主成分分析(PCA)原理与特征选取

目录 主成分分析(PCA)原理与特征选取前言一、什么是PCA?二、PCA作用三、PCA原理四、案例分析1.引入库2.读入数据3.主成分分析获取重要特征数据 总结

前言

在许多领域中存在着大量数据特征,我们通常需要在海量的数据中提取出有价值的信息,例如如何在众多的数据特征中筛选或者是提取出高度有效的特征指标,而PCA就是一种能够解决此类问题的有效方法。

一、什么是PCA?

PCA(Principal Component Analysis),即主成分分析方法,主成分顾名思义就是代表一个数据中或者是事件中最重要、最主要的成分。主成分分析是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上(k= 0.80) + 1 print(f"需要前 {n_components} 个主成分以达到80%的累积方差") # 获取方差解释率超过80%的特征指标 selected_variance_ratios = explained_variance_ratio[:n_components] selected_features = data.columns[:-1][:n_components] # 输出方差解释率超过85%的特征指标和它们的贡献得分 print("方差解释率超过80%的特征指标和它们的贡献得分:") for feature, variance_ratio in zip(selected_features, selected_variance_ratios): print(f"特征: {feature}, 方差解释率: {variance_ratio:.4f}") # 使用所选的主成分来转换数据 pca = PCA(n_components=n_components) reduced_data = pca.fit_transform(scaled_data)

得到结构如下: 在这里插入图片描述 根据每个特征的贡献得分大小,可以有效的筛选出主要特征

总结

主成分分析的作用不仅仅于此,它还被广泛使用在各个领域,如金融、计算机视觉、文本分析等;关于主成分分析与特征提取方面还有很多改进的地方,例如可以将PCA与皮尔逊相关系数所结合,充分发挥两种方法的优点,提取出更具代表性和相关性的特征,从而提高模型的性能和可解释性。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3