机器学习基础与实践
作者: 杨金坤 、马星原、张力宁、张峻
出版社:清华大学出版社 2021-03-01
简介:本课程从实践角度考虑,结合部分数学统计学知识讲解*经典的机器学习算法,主要内容是机器学习思想在具体项目上的示例和代码实现、如何做算法的参数调试和分析各种算法的选择等。本课程重视项目实践如工业实践、算法竞赛实践等,重视落地,使学生在实践中思考不同算法之间的区别和联系,提高在实际工作中选择算法的能力。本课程实践项目涉及信用卡欺诈、公共自行车租赁、波士顿房价、地铁人流量预测、广告点击率、O2O电商优惠券核销、美国人口普查及收入预测等18个实践案例。【目录】第1章机器学习概览11.1人工智能技术发展史和机器学习定义11.2必要的基础概念31.3机器学习项目工作流程51.4机器学习任务场景6小结与讨论8习题8第2章特征工程方法92.1特征类型92.2特征处理102.3特征选择112.4案例1: 北京房价数据特征工程122.4.1案例介绍122.4.2案例目标132.4.3案例拆解132.5案例2: 泰坦尼克号乘客逃生数据特征工程162.5.1案例介绍162.5.2案例目标172.5.3案例拆解17小结与讨论20习题20第3章决策树213.1决策树实现过程213.2决策树的目标函数243.3案例1: 鸢尾花分类263.3.1案例介绍263.3.2案例目标263.3.3案例拆解263.4案例2: 信用卡欺诈预测313.4.1案例介绍313.4.2案例目标313.4.3案例拆解31小结与讨论41习题42第4章K*近邻434.1K*近邻实现434.2距离度量454.3案例1: O2O优惠券使用日期预测464.3.1案例介绍464.3.2案例目标464.3.3案例拆解474.4案例2: 葡萄酒原产地预测524.4.1案例介绍524.4.2案例目标524.4.3案例拆解52小结与讨论61习题61第5章支持向量机625.1SVM建模思路625.2核技巧645.3案例1: 手写数字识别695.3.1案例介绍695.3.2案例目标705.3.3案例拆解705.4案例2: 地铁人流量预测715.4.1案例介绍715.4.2案例目标715.4.3案例拆解71小结与讨论77习题78第6章朴素贝叶斯796.1贝叶斯基础和*后验概率796.2朴素贝叶斯的实现816.3案例1: 糖尿病病情预测856.3.1案例介绍856.3.2案例目标856.3.3案例拆解856.4案例2: 亚马逊消费者投诉分析916.4.1案例介绍916.4.2案例目标916.4.3案例拆解92小结与讨论98习题98第7章线性回归与逻辑回归997.1线性回归的实现997.2逻辑回归的实现1007.3案例1: 广告点击率预测1017.3.1案例介绍1017.3.2案例目标1017.3.3案例拆解1017.4案例2: 波士顿房价预测1057.4.1案例介绍1057.4.2案例目标1057.4.3案例拆解105小结与讨论110习题110第8章集成思想 1118.1随机森林1118.2梯度提升决策树1128.3案例1: 美国居民收入预测1128.3.1案例介绍1128.3.2案例目标1128.3.3案例拆解1128.4案例2: 公共自行车租赁预测1208.4.1案例介绍1208.4.2案例目标1208.4.3案例拆解120小结与讨论125习题125第9章聚类与降维1269.1聚类概述1269.2KMeans算法的实现过程1299.3案例1: 蘑菇数据聚类1319.3.1案例介绍1319.3.2案例目标1319.3.3案例拆解1319.4案例2: 图像数据压缩1369.4.1案例介绍1369.4.2案例目标1369.4.3案例拆解136小结与讨论138习题138第10章神经网络方法 13910.1神经网络方法基础原理13910.2全连接神经网络的组成13910.3案例1: 时装图像分类14010.3.1案例介绍14010.3.2案例目标14010.3.3案例拆解14010.4案例2: 人脸图像识别14310.4.1案例介绍14310.4.2案例目标14310.4.3案例拆解143小结与讨论147习题148附录A环境问题QA149