1、利用pandas输入墙绅褡孛数据集。import pandas as pddf=pd.DataFrame(撑俯擂摔{'weight':[51,53,54,55,57,60,62,65,69,72],'height':[152,156,160,164,168,172,176,180,184,188]})
2、导入线性回归模型的机器学习包from sklearn import linear_model
3、定义X,y变量。X=pd.DataFrame(df['weight'])y=df['height']注意:这里的X是一个数据框,因为是一组数据,需要pd.DataFrame进行转换。
4、建立线性回归模型,并将变量带入模型进行训练。clf = linear_model.LinearRegression()clf.fit(X, y)
5、查看回归系数。本例为一元回归,所以只有一个系数。print('回归系数: \n', clf.coef_)
6、预测y值。y_pred =clf.predict(X)print(y_pred)
7、绘制拟合图。import matplotlib.p鲻戟缒男yplot as pltplt.scatter(X, y, color='red'像粜杵泳) #真实值散点图plt.plot(X,y_pred, color='blue', linewidth=1.5) #线性回归预测趋势线plt.show()