回归分析之Sklearn实现电力预测

  • 时间:
  • 浏览:0

而必须学习的,就说 θ0,θ1,θ2,θ3,θ4这3个参数。

大伙儿儿 的问题图片是得到另3个 线性的关系,对应PE是样本输出,而AT/V/AP/RH这另3个 是样本型态, 机器学习的目的就说 得到另3个 线性回归模型,即:

然都不看后如下结果,说明数据读取成功:

sklearn的归一化处里参考:http://blog.csdn.net/gamer_gyt/article/details/77761884

75%的数据被划分为训练集,25的数据划分为测试集。

下载源数据前一天,解压会得到另3个 xlsx的文件,打开另存为csv文件,数据前一天分发好,那么非法数据,而且 数据并那么进行归一化,不过这里大伙儿儿 必须使用sklearn来我想处里

打开微信扫一扫,关注微信公众号【数据与算法联盟】

必须看出,采用交叉验证模型的MSE比第6节的大,主要原因着是大伙儿儿 这里是对所有折的样本做测试集对应的预测值的MSE,而第6节仅仅对25%的测试集做了MSE。两者的先决条件何必 同。

PE=447.062970991.973715045AT0.23229086V+0.0693515AP0.151506957RH

PE=θ0+θ0AT+θ0V+θ0AP+θ0RH

即大伙儿儿 得到的模型结果为:

中间是另3个 循环发电场的数据,共有9568个样本数据,每个数据有5列,分别是:AT(温度), V(压力), AP(湿度), RH(压强), PE(输出电力)。大伙儿儿 不让纠结于每种具体的意思。

数据的介绍在这: http://archive.ics.uci.edu/ml/datasets/Combined+Cycle+Power+Plant

大伙儿儿 必须通过交叉验证来持续优化模型,代码如下,大伙儿儿 采用10折交叉验证,即cross_val_predict中的cv参数为10:

标签(空格分隔): 回归分析 sklearn pandas 交叉验证

说明有9658条数据,其中”AT”,”V”,”AP”,”RH” 四列作为样本型态,”PE”列作为样本输出。

转载请注明出处:http://blog.csdn.net/gamer_gyt

博主微博:http://weibo.com/234654758

Github:https://github.com/thinkgamer

使用的数据是UCI大学公开的机器学习数据

得到了MSE前一天RMSE,前一天大伙儿儿 用某些方法得到了不同的系数,必须选则模型时,就用MSE小的前一天对应的参数。

参考原文:http://www.cnblogs.com/pinard/p/150115029.html

这里进行了手动实现,增强记忆。

数据的下载地址在这:http://archive.ics.uci.edu/ml/machine-learning-databases/00294/

大伙儿儿 必须评价模型的好坏,通常对于线性回归来讲,我么一般使用均方差(MSE,Mean Squared Error)前一天均方根差(RMSE,Root Mean Squared Error)来评价模型的好坏