菜菜的机器学习sklearn课堂

十二周,十二个任务,让菜菜带你认识sklearn,带你深入浅出地探索算法的神秘世界。我会为你解读sklearn中的主流算法,带你处理数据,调整参数,完善算法,调用结果。我会为你解析参数,助你理解算法原理,也会带你遍历案例,带你实战给你刷经验。

十二周之后,人人都能够三行实现算法,实现少加班,多钻研,在数据行业乘风破浪的目标,为成为优秀的数据挖掘工程师打下坚实的基础~

[课程前置知识]
1. 熟悉至少一门编程语言,最好是Python,掌握Numpy、Pandas和Matplotlib基础知识
2.了解机器学习的基本概念
3. 对自己的承诺与能够付出的时间

章节1:决策树与泰坦尼克号生存预测试看
课时1文本第一章课件+数据
课时2视频1. 引言,sklearn入门07:54可试看
课时3视频2. 决策树:概述08:52可试看
课时4视频3.1 分类树:参数Criterion07:11可试看
课时5视频3.2 分类树:实现一棵树,随机性参数27:11
课时6视频3.3 分类树:剪枝参数调优(1)12:08
课时7视频3.4 分类树:剪枝参数调优(2)07:36
课时8视频3.5 分类树:重要属性和接口15:37
课时9视频4.1 回归树:参数,属性和接口.mp408:44
课时10视频4.2 回归树:交叉验证 (1)06:26
课时11视频4.3 回归树:交叉验证(2)04:07
课时12视频4.4 回归树案例:用回归树拟合正弦曲线29:13
课时13视频5.1 案例:泰坦尼克号生存者预测 (1)34:41
课时14视频5.2 案例:泰坦尼克号生存者预测 (2)10:04
课时15视频5.3 案例:泰坦尼克号生存者预测 (3)16:12
课时16视频5.4 案例:泰坦尼克号生存者预测 (4)03:14
章节2:随机森林与医疗数据集调参
课时17文本第二章课件+数据
课时18视频1 集成算法概述12:26
课时19视频2.1 随机森林分类器37:53
课时20视频2.2 参数boostrap & oob_score + 重要属性和接口32:03
课时21视频2.3 [选学] 袋装法的另一个必要条件05:30
课时22视频3.1 随机森林回归器10:13
课时23视频3.2 案例:用随机森林填补缺失值 (1)25:20
课时24视频3.3 案例:用随机森林填补缺失值 (2)14:28
课时25视频3.4 案例:用随机森林填补缺失值 (3)29:57
课时26视频3.5 案例:用随机森林填补缺失值 (4)09:01
课时27视频4. 机器学习中调参的基本思想17:29
课时28视频5.1. 案例:随机森林在乳腺癌数据上的调参 (1)16:42
课时29视频5.2 案例:随机森林在乳腺癌数据上的调参 (2)24:02
章节3:数据预处理与特征工程
课时30文本第三章课件+数据
课时31视频0 概述 + 12期课纲15:42
课时32视频1.1 数据预处理1:数据归一化17:31
课时33视频1.2 数据预处理2:数据标准化08:44
课时34视频1.3 数据预处理3:缺失值 (1)07:51
课时35视频1.4 数据预处理4:缺失值 (2)14:58
课时36视频1.5 数据预处理5:处理分类型数据34:47
课时37视频1.6 数据预处理6:处理连续型数据17:30
课时38视频2.1 特征选择1:过滤法-方差过滤 (1)14:40
课时39视频2.2 特征选择2:过滤法-方差过滤 (2)28:12
课时40视频2.3 特征选择3:过滤法-卡方过滤18:37
课时41视频2.4 特征选择4:过滤法-F检验和互信息法 (1)09:31
课时42视频2.5 特征选择5:过滤法-互信息法(2) + 总结03:24
课时43视频2.6 特征选择6:嵌入法 (1)07:15
课时44视频2.7 特征选择7:嵌入法 (2)20:50
课时45视频2.8 特征选择8:包装法 + 总结18:01
章节4:降维算法PCA与手写数字案例
课时46文本第四章课件+数据
课时47视频1 降维算法概述13:08
课时48视频2.1 降维究竟怎样实现?23:07
课时49视频2.2 参数 + 案例:高维数据的可视化 (1)33:42
课时50视频2.2 参数 + 案例:高维数据的可视化 (2)04:32
课时51视频2.3 参数 + 案例:人脸识别中的components_应用.mp441:45
课时52视频2.3 PCA中的SVD,重要参数svd_solver23:31
课时53视频2.4 重要接口 + 案例1:用人脸识别看PCA降维后的信息保存量15:59
课时54视频2.4 重要接口 + 案例2:用PCA实现手写数字的噪音过滤15:05
课时55视频2.5 原理,流程,重要属性接口和参数的总结05:51
课时56视频3.1 案例:PCA实现784个特征的手写数字的降维 (1)24:45
课时57视频3.2 案例:PCA实现784个特征的手写数字的降维 (2)08:11
章节5:逻辑回归和信用评分卡
课时58文本第五章课件+数据
课时59视频0 前言03:25
课时60视频1.1 逻辑回归概述:名为“回归”的分类器14:54
课时61视频1.2 为什么需要逻辑回归08:37
课时62视频1.3 sklearn当中的逻辑回归05:01
课时63视频2.1.1 二元逻辑回归的损失函数09:22
课时64视频2.2.1 正则化:重要参数penalty & C28:46
课时65视频2.2.2 逻辑回归的特征工程 (1)08:15
课时66视频2.2.2 逻辑回归的特征工程 (2)06:15
课时67视频2.2.2 逻辑回归的特征工程 (3)15:53
课时68视频2.2.2 逻辑回归的特征工程 (4)04:18
课时69视频2.3.1 重要参数max_iter – 梯度下降求解逻辑回归的过程06:49
课时70视频2.3.2 梯度的概念与解惑11:01
课时71视频2.3.3 步长的概念与解惑18:52
课时72视频2.4 二元回归与多元回归:重要参数solver & multi_class12:26
课时73视频2.5 样本不均衡与参数class_weight05:19
课时74视频3.1 案例:评分卡与完整的模型开发流程06:36
课时75视频3.2.1~2 案例:评分卡 – 数据预处理(1) – 重复值与缺失值26:42
课时76视频3.2.3 案例:评分卡 – 数据预处理 (2) – 异常值14:44
课时77视频3.2.4 案例:评分卡 – 数据预处理 (3) – 标准化03:21
课时78视频3.2.5 案例:评分卡 – 数据预处理 (4) – 样本不均衡问题07:43
课时79视频3.2.6 案例:评分卡 – 数据预处理 (5) – 保存训练集和测试集数据05:08
课时80视频3.3 案例:评分卡 – 分箱 (1) – 概述与概念10:47
课时81视频3.3.1 案例:评分卡 – 分箱 (2) – 等频分箱 (1)06:58
课时82视频3.3.1 案例:评分卡 – 分箱 (3) – 等频分箱 (2)09:31
课时83视频3.3.2 案例:评分卡 – 分箱 (4) – 选学说明02:06
课时84视频3.3.3 案例:评分卡 – 分箱 (5) – 计算WOE与IV06:09
课时85视频3.3.4 案例:评分卡 – 分箱 (6) – 卡方检验、箱体合并、IV值等22:32
课时86视频3.3.5 案例:评分卡 – 分箱 (7) – 包装分箱函数04:44
课时87视频3.3.6 案例:评分卡 – 分箱 (8) – 包装判断分箱个数的函数06:09
课时88视频3.3.7 案例:评分卡 – 分箱 (9) – 对所有特征进行分箱07:15
课时89视频3.4 案例:评分卡 – 映射数据 (1)06:44
课时90视频3.4 案例:评分卡 – 映射数据 (2)08:02
课时91视频3.5 案例:评分卡 – 建模与模型验证11:41
课时92视频3.6 案例:评分卡 – 评分卡的输出和建立16:59
章节6:聚类算法与量化案例
课时93文本第六章课件+数据
课时94视频0 概述01:32
课时95视频1.1 无监督学习概述,聚类vs分类09:34
课时96视频1.2 sklearn当中的聚类算法04:18
课时97视频2.1 Kmeans是如何工作的?11:39
课时98视频2.2 & 2.3 簇内平方和,时间复杂度16:48
课时99视频3.1.1 KMeans – 重要参数n_clusters26:30
课时100视频3.1.2 聚类算法的模型评估指标 (1)12:58
课时101视频3.1.2 聚类算法的模型评估指标 (2) – 轮廓系数05:50
课时102视频3.1.2 聚类算法的模型评估指标 (3) – CHI09:44
课时103视频3.1.3 案例:轮廓系数找最佳n_clusters (1)10:02
课时104视频3.1.3 案例:轮廓系数找最佳n_clusters (2)10:59
课时105视频3.1.3 案例:轮廓系数找最佳n_clusters (3)23:18
课时106视频3.2 重要参数init & random_state & n_init:初始质心怎么决定?08:24
课时107视频3.3 重要参数max_iter & tol:如何让聚类停下来?04:09
课时108视频3.5 重要属性与接口 & 函数k_means06:22
课时109视频4 案例:Kmeans做矢量量化 (1):案例背景03:59
课时110视频4 案例:Kmeans做矢量量化 (2)18:00
课时111视频4 案例:Kmeans做矢量量化 (3)06:52
课时112视频4 案例:Kmeans做矢量量化 (4)14:26
章节7:支持向量机与医疗数据集调参(上)
课时113文本第七章课件+数据
课时114视频0 本周要学习什么01:52
课时115视频1.1 支持向量机概述:最强大的机器学习算法09:35
课时116视频1.2 支持向量机是如何工作的 & sklearn中的SVM15:09
课时117视频2.1.1 线性SVC的损失函数 (1)18:03
课时118视频2.1.1 线性SVC的损失函数 (2)10:22
课时119视频2.1.2 函数间隔与几何间隔04:41
课时120视频2.1.3.1 损失函数的拉格朗日乘数形态14:52
课时121视频2.1.3.2 拉格朗日对偶函数 (1)13:28
课时122视频2.1.3.2 拉格朗日对偶函数 (2)08:07
课时123视频2.1.3.3 求解拉格朗日对偶函数极其后续过程03:49
课时124视频2.1.4 SVM求解可视化 (1):理解等高线函数contour11:44
课时125视频2.1.4 SVM求解可视化 (2):理解网格制作函数meshgrid与vstack07:53
课时126视频2.1.4 SVM求解可视化 (3):建模,绘制图像并包装函数12:11
课时127视频2.1.4 SVM求解可视化 (4):探索建立好的模型02:24
课时128视频2.1.4 SVM求解可视化(5):非线性数据集上的推广与3D可视化08:17
课时129视频2.1.4 SVM求解可视化(6):Jupyter Notebook中的3D交互功能03:08
课时130视频2.2.1 & 2.2.2 非线性SVM与核函数:重要参数kernel10:54
课时131视频2.2.3 案例:如何选取最佳核函数 (1)26:07
课时132视频2.2.3 案例:如何选取最佳核函数 (2)15:52
课时133视频2.2.4 案例:在乳腺癌数据集上探索核函数的性质33:08
课时134视频2.2.5 案例:在乳腺癌数据集上对核函数进行调参 (1)05:37
课时135视频2.2.5 案例:在乳腺癌数据集上对核函数进行调参 (2)12:00
课时136视频2.3.1 SVM在软间隔数据上的推广12:47
课时137视频2.3.2 重要参数C & 总结08:19
章节8:支持向量机与Kaggle案例:澳大利亚天气数据集
课时138文本支持向量机 (下) 课件 + 源码 + 数据
课时139视频0 目录:本周将学习什么内容02:33
课时140视频1.1 简单复习支持向量机的基本原理06:43
课时141视频1.2 参数C的深入理解:多个支持向量存在的理由12:30
课时142视频1.3 二分类SVC中的样本不均衡问题08:19
课时143视频1.3 如何使用参数class_weight (1)05:14
课时144视频1.3 如何使用参数class_weight (2)09:06
课时145视频2 SVC的模型评估指标03:29
课时146视频2.1 混淆矩阵与准确率05:42
课时147视频2.1 样本不平衡的艺术(1):精确度Precision07:27
课时148视频2.1 样本不平衡的艺术(2):召回率Recall与F1 measure07:07
课时149视频2.1.3 对多数类样本的关怀:特异度Specificity和假正率04:28
课时150视频2.1.4 sklearn中的混淆矩阵01:55
课时151视频2.2 ROC曲线:Recall与假正率FPR的平衡02:06
课时152视频2.2.1 概率与阈值18:01
课时153视频2.2.2 SVM做概率预测08:41
课时154视频2.2.3 绘制ROC曲线 (1)04:00
课时155视频2.2.3 绘制ROC曲线 (2)07:52
课时156视频2.2.3 绘制ROC曲线 (3)05:22
课时157视频2.2.4 sklearn中的ROC曲线和AUC面积10:11
课时158视频2.2.5 利用ROC曲线求解最佳阈值06:53
课时159视频3 选学说明:使用SVC时的其他考虑01:59
课时160视频4 案例:预测明天是否会下雨 – 案例背景03:52
课时161视频4.1 案例:导库导数据,探索特征13:22
课时162视频4.2 案例:分集,优先处理标签11:34
课时163视频4.3.1 案例:描述性统计,处理异常值10:10
课时164视频4.3.2 案例:现实数据上的数据预处理 – 处理时间35:43
课时165视频4.3.3 案例:现实数据上的数据预处理 – 处理地点 (1)03:42
课时166视频4.3.3 案例:现实数据上的数据预处理 – 处理地点 (2)10:43
课时167视频4.3.3 案例:现实数据上的数据预处理 – 处理地点 (3)11:15
课时168视频4.3.3 案例:现实数据上的数据预处理 – 处理地点 (4)10:12
课时169视频4.3.4 案例:现实数据上的数据预处理 – 填补分类型变量的缺失值12:07
课时170视频4.3.5 案例:现实数据上的数据预处理 – 编码分类型变量04:15
课时171视频4.3.6 & 4.3.7 案例:现实数据集上的数据预处理:连续型变量07:37
课时172视频4.4 案例:建模与模型评估 (1)04:49
课时173视频4.4 案例:建模与模型评估 (2)03:25
课时174视频4.5.1 案例:模型调参:追求最高的recall04:55
课时175视频4.5.2 案例:模型调参:追求最高的精确度 (1)12:07
课时176视频4.5.2 案例:模型调参:追求最高的精确度 (2)04:23
课时177视频4.5.3 案例:模型调参:追求精确度与recall的平衡14:56
课时178视频4.6 SVM总结与结语01:42
章节9:回归大家族:线性,岭回归,Lasso,多项式
课时179文本回归大家族:课件 + 代码
课时180视频0 本周要学习什么.mp403:51
课时181视频1 概述,sklearn中的线性回归大家族04:57
课时182视频2.1 多元线性回归的基本原理和损失函数11:02
课时183视频2.2 用最小二乘法求解多元线性回归的过程13:09
课时184视频2.3 多元线性回归的参数,属性及建模代码27:44
课时185视频3.1 回归类模型的评估指标:是否预测准确?15:32
课时186视频3.2 回归类模型的评估指标:是否拟合了足够的信息?29:29
课时187视频4.1 多重共线性:含义,数学,以及解决方案34:35
课时188视频4.2.1 岭回归处理多重共线性13:00
课时189视频4.2.2 sklearn中的岭回归:linear_model.Ridge21:40
课时190视频4.2.3 为岭回归选择最佳正则化参数23:46
课时191视频4.3.1 Lasso处理多重共线性11:40
课时192视频4.3.2 Lasso的核心作用:特征选择16:36
课时193视频4.3.3 Lasso选择最佳正则化参数27:30
课时194视频5.1.1 & 5.1.2 线性数据与非线性数据09:05
课时195视频5.1.3 线性vs非线性模型 (1):线性模型在非线性数据集上的表现16:34
课时196视频5.1.3 线性vs非线性模型 (2):拟合,效果与特点15:10
课时197视频5.2 离散化:帮助线性回归解决非线性问题30:39
课时198视频5.3.1 多项式对数据做了什么?26:27
课时199视频5.3.2 多项式回归提升模型表现11:08
课时200视频5.3.3 多项式回归的可解释性18:52
课时201视频5.3.4 多项式回归:线性还是非线性模型? + 本周结语09:41
章节10:朴素贝叶斯
课时202文本朴素贝叶斯课件 + 源码
课时203视频0 本周要讲解的内容01:44
课时204视频1.1 为什么需要朴素贝叶斯04:03
课时205视频1.2 概率论基础 – 贝叶斯理论等式06:01
课时206视频1.2.1 瓢虫冬眠:理解条件概率 (1)08:12
课时207视频1.2.1 瓢虫冬眠:理解条件概率 (2)09:10
课时208视频1.2.1 瓢虫冬眠:理解条件概率 (3)05:36
课时209视频1.2.2 贝叶斯的性质与最大后验估计06:36
课时210视频1.2.3 汉堡称重:连续型变量的概率估计 (1)04:02
课时211视频1.2.3 汉堡称重:连续型变量的概率估计 (2)08:53
课时212视频1.3 sklearn中的朴素贝叶斯02:34
课时213视频2.1.1 认识高斯朴素贝叶斯19:56
课时214视频2.1.2 高斯朴素贝叶斯擅长的数据集04:08
课时215视频2.1.3 探索贝叶斯 – 拟合中的特性与运行速度 (1)02:29
课时216视频2.1.3 探索贝叶斯 – 拟合中的特性与运行速度 (2) – 代码讲解 (1)21:42
课时217视频2.1.3 探索贝叶斯 – 拟合中的特性与运行速度 (3) – 代码讲解 (2)03:20
课时218视频2.1.3 探索贝叶斯 – 拟合中的特性与运行速度 (4) – 分析与结论12:47
课时219视频2.2.1 概率类模型的评估指标 (1) – 布里尔分数12:40
课时220视频2.2.1 概率类模型的评估指标 (2) – 布里尔分数可视化06:01
课时221视频2.2.2 概率类模型的评估指标 (3) – 对数损失Logloss13:12
课时222视频2.2.3 概率类模型的评估指标 (4) – 可靠性曲线 (1)08:11
课时223视频2.2.3 概率类模型的评估指标 (5) – 可靠性曲线 (2)27:04
课时224视频2.2.4 概率类模型的评估指标 (6) – 概率分布直方图10:33
课时225视频2.2.5 概率类模型的评估指标 (7) – 概率校准 (1)18:39
课时226视频2.2.5 概率类模型的评估指标 (8) – 概率校准 (2)03:07
课时227视频2.3.1 多项式朴素贝叶斯 (1) – 认识多项式朴素贝叶斯05:14
课时228视频2.3.1 多项式朴素贝叶斯 (2) – 数学原理05:50
课时229视频2.3.1 多项式朴素贝叶斯 (3) – sklearn中的类与参数04:28
课时230视频2.3.1 多项式朴素贝叶斯 (4) – 来构造一个分类器吧11:29
课时231视频2.3.2 伯努利朴素贝叶斯 (1) – 认识伯努利朴素贝叶斯02:47
课时232视频2.3.2 伯努利朴素贝叶斯 (2) – sklearn中的类与参数03:08
课时233视频2.3.2 伯努利朴素贝叶斯 (3) – 构造一个分类器03:21
课时234视频2.3.3 探索贝叶斯 – 朴素贝叶斯的样本不均衡问题13:42
课时235视频2.3.4 补集朴素贝叶斯 – 补集朴素贝叶斯的原理 (1)04:36
课时236视频2.3.4 补集朴素贝叶斯 – 补集朴素贝叶斯的原理 (2)05:29
课时237视频2.3.4 补集朴素贝叶斯 – 处理样本不均衡问题03:40
课时238视频3.1.1 案例:贝叶斯做文本分类 (1) – 单词计数向量技术07:49
课时239视频3.1.1 案例:贝叶斯做文本分类 (2) – 单词计数向量的问题04:35
课时240视频3.1.2 案例:贝叶斯做文本分类 (3) – TF-IDF技术06:55
课时241视频3.2 案例:贝叶斯做文本分类 (4) – 探索和提取文本数据15:29
课时242视频3.3 案例:贝叶斯做文本分类 (5) – 使用TF-IDF编码文本数据03:37
课时243视频3.4 案例:贝叶斯做文本分类 (6) – 算法应用与概率校准12:29
章节11:XGBoost
课时244文本XGBoost课件 + 代码
课时245视频0 本周要学习什么06:01
课时246视频1 XGBoost前瞻:安装xgboost,xgboost库与skleanAPI12:44
课时247视频2.1 梯度提升树(1):集成算法回顾,重要参数n_estimators13:14
课时248视频2.1 梯度提升树(2):参数n_estimators下的建模21:23
课时249视频2.1 梯度提升树(3):参数n_estimators的学习曲线13:37
课时250视频2.1 梯度提升树(4):基于方差-偏差困境改进的学习曲线12:38
课时251视频2.2 梯度提升树(5):控制有放回随机抽样,参数subsample15:17
课时252视频2.3 梯度提升树(6):迭代决策树:重要参数eta20:51
课时253视频2.3 梯度提升树(7):迭代决策树:重要参数eta03:37
课时254视频3.1 XGBoost的智慧 (1):选择弱评估器:重要参数booster04:40
课时255视频3.2 XGBoost的智慧 (2):XGBoost的目标函数,使用xgboost库建模28:01
课时256视频3.3 XGBoost的智慧 (3):求解XGBoost的目标函数 – 推导过程18:15
课时257视频3.3 XGBoost的智慧 (4):XGboost的目标函数 – 泰勒展开相关问题05:46
课时258视频3.4 XGBoost的智慧 (5):参数化决策树,正则化参数lambda与alpha16:09
课时259视频3.5 XGBoost的智慧 (6):建立目标函数与树结构的直接联系11:24
课时260视频3.5 XGBoost的智慧 (7):最优树结构,求解w和T20:32
课时261视频3.6 XGBoost的智慧 (8):贪婪算法求解最优树10:05
课时262视频3.7 XGBoost的智慧 (9):让树停止生长:参数gamma与工具xgb.cv34:11
课时263视频4.1 XGBoost应用 (1):减轻过拟合:XGBoost中的剪枝参数08:42
课时264视频4.1 XGBoost应用 (2):使用xgb.cv进行剪枝参数的调参35:15
课时265视频4.2 XGBoost应用 (3):使用pickle保存和调用训练好的XGB模型10:46
课时266视频4.2 XGBoost应用 (4):使用joblib保存和调用训练好的XGB模型07:39
课时267视频4.3 XGBoost应用 (5):XGB分类中的样本不平衡问题 – sklearnAPI12:18
课时268视频4.3 XGBoost应用 (6):XGB分类中的样本不平衡问题 – xgboost库需购买观看
课时269视频4.4 XGBoost应用 (7):XGB应用中的其他问题09:18
章节12:神经网络
课时270文本神经网络 课件 + 数据

 

提取码:2333

提供最优质的资源集合

立即查看 了解详情