简单介绍机器学习的建模流程,主要介绍机器学习中的数据集的简单操作以及划分数据集。
工具/原料
为了更好展现数据,所用jupyter
方法/步骤
1、机器学习建模3大流程:1.实例化,建立评估模型对象2.通过模型接口训练数据3.通过模型接口提取需要的信息(给模型打分)
2、数倌栗受绽据集的实例化(以葡萄酒数据集为例):1.数据集模块sklearn.datasets.数据以导入葡萄酒数据集为例:fromsklearn.datasetsimportload_wine
3、2.数据集的实例化Win=load_wine()
4、3.数据集常用数据1.data(数据集的特征数据)2.target(数据集的标签)3.feature_names(特征的名字)
5、数据集的划分:1.划分数据集模块fromsklearn.model_selectionimporttrain_test_split
6、2.实例化对象train_test_split()
7、3.t筠续师诈rain_test_split()所需参数及其返回值1.数据集的特征数据2.数据集的标签3.test_size划分数据逗垅型巢集例:test_size=0.4表示将40%的数据集划分为测试集,用于测试训练好的模型,将剩下60%的数据集划分为训练集,用于训练模型4.返回值(注意:返回值顺序)返回4个数据集依次为:特征数据的训练数据,特征数据的测试数据,标签的训练数据,标签的测试数据