四种不同机器学习方法(线性回归模型,K近邻回归模型,决策树回归模型,随机森林回归模型)对光伏发电预测

您所在的位置:网站首页 lstm回归预测 四种不同机器学习方法(线性回归模型,K近邻回归模型,决策树回归模型,随机森林回归模型)对光伏发电预测

四种不同机器学习方法(线性回归模型,K近邻回归模型,决策树回归模型,随机森林回归模型)对光伏发电预测

2023-05-26 03:48| 来源: 网络整理| 查看: 265

1.数据集介绍(可以看短期光伏发电量短期预测(Python代码,基于LSTM模型)_深度学习的奋斗者的博客-CSDN博客)

两篇文章用的是同一个数据集,不同的的是本篇多了温度特征

这些是温度数据集中的列名:

DATE_TIME: 日期和时间PLANT_ID: 电厂IDSOURCE_KEY: 数据源的关键字AMBIENT_TEMPERATURE: 环境温度MODULE_TEMPERATURE: 模块温度IRRADIATION: 辐照度

这些列包含了太阳能发电数据和气象传感器数据的各个指标和变量。

2020/5/15 0:004135001HmiyD2TTLFNqkNe25.1843161322.857507402020/5/15 0:154135001HmiyD2TTLFNqkNe25.0845886722.7616678702020/5/15 0:304135001HmiyD2TTLFNqkNe24.935752622.5923055302020/5/15 0:454135001HmiyD2TTLFNqkNe24.846130422.3608521302020/5/15 1:004135001HmiyD2TTLFNqkNe24.6215253622.1654226402020/5/15 1:154135001HmiyD2TTLFNqkNe24.536092221.9685708702020/5/15 1:304135001HmiyD2TTLFNqkNe24.6386738722.3529256702020/5/15 1:454135001HmiyD2TTLFNqkNe24.8730223323.160919202020/5/15 2:004135001HmiyD2TTLFNqkNe24.9369304723.02611302020/5/15 2:154135001HmiyD2TTLFNqkNe25.012247623.3432292702020/5/15 2:304135001HmiyD2TTLFNqkNe25.0051493323.6394592702020/5/15 2:454135001HmiyD2TTLFNqkNe24.9930195324.039485802020/5/15 3:004135001HmiyD2TTLFNqkNe25.0163094324.3841355702020/5/15 3:154135001HmiyD2TTLFNqkNe24.9852152724.3515077302020/5/15 3:304135001HmiyD2TTLFNqkNe24.9377319324.0602965302020/5/15 3:454135001HmiyD2TTLFNqkNe24.8790995323.7097941302020/5/15 4:004135001HmiyD2TTLFNqkNe24.678902222.5899415302020/5/15 4:154135001HmiyD2TTLFNqkNe24.351930821.7836425302020/5/15 4:304135001HmiyD2TTLFNqkNe24.062622221.8525249302020/5/15 4:454135001HmiyD2TTLFNqkNe24.013224222.30631502020/5/15 5:004135001HmiyD2TTLFNqkNe24.177105822.5519084702020/5/15 5:154135001HmiyD2TTLFNqkNe24.30488822.9794920702020/5/15 5:304135001HmiyD2TTLFNqkNe24.3287272723.4523804702020/5/15 5:454135001HmiyD2TTLFNqkNe24.2892111323.096691930.0008627212020/5/15 6:004135001HmiyD2TTLFNqkNe24.0884460722.20675660.005886957

2.代码流程

导入所需的库,包括numpy、pandas、seaborn和matplotlib.pyplot。读取两个CSV文件的数据,分别是'Plant_1_Generation_Data.csv'(发电相关信息)和'Plant_1_Weather_Sensor_Data.csv'(温度相关信息),存储到两个DataFrame变量中。打印一些数据统计信息,如唯一值的数量和数据的概要。将日期时间列转换为datetime类型。使用pd.merge函数将两个数据集按照日期时间进行合并,生成一个新的DataFrame df。检查并打印df中的缺失值情况。绘制df中各个变量之间的散点图矩阵。使用LabelEncoder对SOURCE_KEY列进行编码。创建一个新的DataFrame df_ml作为机器学习模型的输入数据,并选择特征变量X和目标变量y。计算特征变量X之间的相关性,并使用相关性矩阵进行可视化。将数据集拆分为训练集和测试集。使用线性回归模型进行训练和预测,并计算模型的得分。使用K近邻回归模型进行训练和预测,并找到最佳的n_neighbors值以获得最高得分。使用决策树回归模型进行训练和预测,并计算模型的得分。使用随机森林回归模型进行训练和预测,并计算模型的得分。

以上就是这段代码的主要流程。它包括了数据加载、数据预处理、特征工程、模型训练和评估等步骤,用于分析太阳能发电数据并建立回归模型进行预测。

特征变量之间相关性绘图

四种方法分别为线性回归模型,K近邻回归模型,决策树回归模型,随机森林回归模型

 选择SOURCE_KEY列的1BY6WEcLGh8j5v7 的光伏板进行AC POWER预测。

真实值与预测值展示



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3