逻辑回归用于解决二分类问题。下面以一个简单的例子来说明逻辑回归的应用。
工具/原料
python
sklearn
方法/步骤
1、导入pandas,输入或读取数据集。importpand瞢铍库祢asaspddf=pd.DataFra罪焐芡拂me({'math':[98,78,54,89,24,60,98,44,96,90],'english':[92,56,90,57,46,75,76,87,91,88],'is_good':[1,0,0,0,0,0,1,0,1,1]})
2、导入sklearn中的逻辑回归函数。如果没有包的话,要实现安装工具包。fromsklearn.linear_modelimportLogisticRegression
3、模型数据准备。X=df.ix[:,['math','english']]y=df['is_good']
4、建立模型并进行模型训练。clf_lg=LogisticRegression()clf_lg.fit(X,y)
5、查看参数值。print(clf_lg.coef_)
6、根据模型预测目标变量,并计算准确率。y_pred=clf_lg.predict(X)圬桦孰礅print(y_pred)print(&quo墉掠载牿t;准确率",sum(y==y_pred)/len(y))#计算准确率
7、计算AUC值。fromsklearn.metricsimportroc_auc_scoreAUC=roc_auc_score(y,y_pred)AUC>0.5,可见模型的预测效果较好。