1、导入pandas,输入或读取数据集。import pandas as pddf=pd.DataFra罪焐芡拂me({'math':[98,78,54,89,24,60,98,44,96,90],'english':[92,56,90,57,46,75,76,87,91,88],'is_good':[1,0,0,0,0,0,1,0,1,1]})
2、导入sklearn中的逻辑回归函数。如果没有包的话,要实现安装工具包。from sklearn.linear_model import LogisticRegression
3、模型数据准备。X=df.ix[:,['math','english']]y=df['is_good']
4、建立模型并进行模型训练。clf_lg=LogisticRegression()clf_lg.fit(X, y)
5、查看参数值。print(clf_lg.coef_)
6、根据模型预测目标变量,并计算准确率。y_pred=clf_lg.predict(X)print(y_pred)print("准确率",sum(y==y_pred)/len(y))#计算准确率
7、计算AUC值。from sklearn.metrics import roc_auc_scoreAUC=roc_auc_score(y, y_pred)AUC>0.5,可见模型的预测效果较好。