起风了

“路海长 青夜旷 越过群山追斜阳”

9 交叉验证2 overfitting

交叉验证2 过拟合overfitting 交叉验证2 过拟合overfitting 介绍 介绍 sklearn.learning_curve 中的 learning curve 可以很直观的看出我们的 model 学习的进度, 对比发现有没有 overfitting 的问题. 然后我们可以对我们的 model 进行调整, 克服 overfitting 的问题. from sklearn.learning_curve import...

11 保存模型

保存模型 保存模型 pickle joblib 总算到了最后一次的课程了,我们训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。sklearn官方文档主要介绍两种保存Model的模块pickle与joblib。 1 pickle 首先简单建立与训练一个SVCModel。 from sklearn import sv...

sklearn中常用数据预处理方法

转载自:http://2hwp.com/2016/02/03/data-preprocessing/ 常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍; 1. 标准化(Standardization or Mean Removal and Variance Scaling) 变换后各维特征均值为0,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除...

5 sklearn的数据集-datasets

sklearn的数据集-datasets sklearn的数据集-datasets sklearn 强大数据库 文档介绍 1 经典数据 2 构造数据 例子1房价 例子2创建虚拟数据并可视化 1 sklearn 强大数据库 data sets,有很多有用的,可以用来学习算法模型的数据库。 eg: boston 房价, 糖尿病, 数字, Iris 花。 主要有两种: - 封装好...

1-4sklearn基础

sklearn基础 sklearn基础 sklearn 简介 安装 选择合适的机器学习方法模型 入门例子-分类-KNN算法-给花朵分类 笔记是观看莫烦的机器学习视频《莫烦Scikit-learn》的读书笔记,初学者强烈推荐他的视频。 1 sklearn 简介 Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一. Sklear...