Python数据分析与机器学习

副标题:无

作   者:周元哲 编著

分类号:

ISBN:9787111704928

微信扫一扫,移动浏览光盘

简介

本书包括两部分内容,第壹部分重点介绍了与Python语言相关的数据分析工具,包括NumPy、Matplotlib、Pandas、Scipy、Seaborn和Sklearn。第二部分介绍数据处理、特征工程、评价指标、线性模型、支持向量机、K近邻算法、朴素贝叶斯、决策树、K-Means算法和文本分析实例。附录提供了课程教学大纲和部分课后习题答案。本书内容精练、文字简洁、结构合理、实训题目经典实用、综合性强、定位明确,面向初、中级读者,由“入门”起步,侧重“提高”。特别适合作为高等院校相关专业数据分析与机器学习课程的入门教材或教学参考书,也可以供从事计算机应用开发的各类技术人员参考。

目录


前言


第1章Python与数据分析

11概述

111引例

112数据分析与数据挖掘

12Python简介

121Python特点

122Python应用场合

13数据分析流程

131明确目标

132获取数据

133清洗数据

134特征工程

135构建模型

136模型评估

14数据分析库

141NumPy

142Matplotlib

143Pandas

144Seaborn

145Scipy

146Sklearn

15Python解释器

151Ubuntu下安装Python

152Windows下安装Python

16Python编辑器

161IDLE

162VScode

163PyCharm

164Anaconda

165Jupyter

17习题

第2章NumPy——数据分析基础
工具

21安装NumPy

22ndarray对象

221认识ndarray对象

222ndarray对象属性

23创建ndarray对象

231zeros

232ones

233diag

234arange

235linspace

236logspace

24数组变换

241维度变换

242数组拼接

243数组分割

244数组复制

25索引和切片

26线性代数

261矩阵运算

262矩阵转置

263特征根和特征向量

27统计量

271平均值

272值

273中位数

274极差

275方差

276协方差

277皮尔森相关系数

28习题

第3章Matplotlib——数据可视化
工具

31安装Matplotlib

32绘图步骤

321创建画布

322绘图函数

323绘图属性

33子图基本操作

331pltsubplot

332figureadd_subplot

333pltsubplots

34绘图

341折线图

342气泡图

343饼图

344直方图

345条形图

35概率分布

351泊松分布

352正态分布

353均匀分布

354二项分布

36习题

第4章Pandas——数据处理工具

41认识Pandas

42Series

421创建Series

422 Series属性

423访问Series数据

43操作Series

431更新Series

432插入Series

433删除Series

44DataFrame

441创建DataFrame

442DataFrame属性

443选取行列数据

45操作DataFrame

451更新DataFrame

452插入DataFrame



453删除DataFrame

46Index

461创建Index

462常用属性

463常用方法

464重建Index

47可视化

471线形图

472条形图

473饼状图

474直方图与密度图

48数据转换

481数据值替换

482数据映射

483数据值合并

484数据值补充

485数据离散化

49数据分组与聚合

491数据分组

492数据聚合

410读取外部数据

4101操作Excel

4102操作文本文件

4103操作数据库

411习题

第5章Scipy——数据统计工具

51认识Scipy

52稀疏矩阵

53线性代数

531矩阵运算

532线性方程组求解

54数据优化

541非线性方程组求解

542函数值

543小二乘法

55数据分布

551泊松分布

552正态分布

553均匀分布

554二项分布

555指数分布

56统计量

561众数

562皮尔森相关系数

57图像处理

571旋转图像

572图像滤波

573边缘检测

58习题

第6章Seaborn——数据可视化
工具

61认识Seaborn

611绘图特色

612图表分类

613数据集

62绘图设置

621绘图元素

622主题

623调色板

63绘图

631直方图

632核密度图

633小提琴图

634分类散点图

635条形图

636热力图

637点图

64习题

第7章Sklearn——机器学习工具

71Sklearn简介

72安装Sklearn

73数据集

731小数据集

732大数据集

733生成数据集

74机器学习流程

741数据清洗

742划分数据集

743特征工程

744机器算法

745模型评估

75习题





第8章数据处理

81认识数据处理

82数据清洗

821处理缺失值

822处理异常值

823处理重复值

83特征处理

831规范化

832标准化

833鲁棒化

84数据分析可视库

841missingno库

842词云

85案例——学生信息清洗

86习题

第9章特征工程

91认识特征工程

92独热编码

93特征提取

931DictVectorizer

932CountVectorizer

933TfidfVectorizer

94中文分词

941Jieba分词库

942停用词表

95案例——中文特征提取

96习题

第10章评价指标


已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

Python数据分析与机器学习
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon