简介
布雷特·兰茨编*的《R语言机器学习(第2版影 印版)(英文版)》与时俱进。携*新的库和*现代 的编程思维为你丝丝入扣地介绍了专业数据科学必不 可少的技能。不用再惧怕理论知识。书中提供了编写 算法和处理数据所需的*关键的实用知识,只要有* 基本的经验就可以了。
你可以在书中找到洞悉复杂的数据所需的全部分 析工具,还能学到如何选择正确的算法来解决特定的 问题。通过与各种真实问题的亲密接触,你将学会如 何应用机器学习方法来处理常见的任务,包括分类、 预测、市场分析以及聚类。
目标读者 可能你对机器学习多少有一点了解,但是从没用 过R语言,或者是知道些R语言,但是没接触过机器学 习。不管是哪一种情况,本书都能够帮助你快速上手 。如果熟悉一些编程概念自然是*好的。不过并不要 求之前有编程经验。
你将从本书中学到什么 驾驭R语言的威力,使用真实的数据科学应用构 建常见的机器学习算法。
学习利用R语言技术对待分析数据进行清理和预 处理并可视化处理结果。
了解不同类型的机器学习模型,选择符合数据处 理需求的*佳模型,解决数据分析难题。
使用贝叶斯算法和*近邻算法分类数据。
使用R语言预测数值来构建决策树、规则以及支 持向量机。
使用线性回归预测数值,使用神经网络建模数据 。
对机器学习模型性能进行评估和改进。
学习专用于文本挖掘、社交网络数据、大数据等 的机器学习技术。
你可以在书中找到洞悉复杂的数据所需的全部分 析工具,还能学到如何选择正确的算法来解决特定的 问题。通过与各种真实问题的亲密接触,你将学会如 何应用机器学习方法来处理常见的任务,包括分类、 预测、市场分析以及聚类。
目标读者 可能你对机器学习多少有一点了解,但是从没用 过R语言,或者是知道些R语言,但是没接触过机器学 习。不管是哪一种情况,本书都能够帮助你快速上手 。如果熟悉一些编程概念自然是*好的。不过并不要 求之前有编程经验。
你将从本书中学到什么 驾驭R语言的威力,使用真实的数据科学应用构 建常见的机器学习算法。
学习利用R语言技术对待分析数据进行清理和预 处理并可视化处理结果。
了解不同类型的机器学习模型,选择符合数据处 理需求的*佳模型,解决数据分析难题。
使用贝叶斯算法和*近邻算法分类数据。
使用R语言预测数值来构建决策树、规则以及支 持向量机。
使用线性回归预测数值,使用神经网络建模数据 。
对机器学习模型性能进行评估和改进。
学习专用于文本挖掘、社交网络数据、大数据等 的机器学习技术。
【作者简介】
布雷特·兰茨(Brett Lantz)在应用创新的数据方法来理解人类的行为方面有10余年经验。他*初是一名社会学家,在学习一个青少年社交网站分布的大型数据库时,他就开始陶醉于机器学习。从那时起,他致力于移动电话、医疗账单数据和公益活动等交叉学科的研究,并维护dataspelunking.com这个网站,该网站致力于分享有关探寻数据中所蕴含的洞察的知识。
目录
PrefaceChapter 1: Introducing Machine LearningThe origins of machine learningUses and abuses of machine learningMachine learning successesThe limits of machine learningMachine learning ethicsHow machines learnData storageAbstractionGeneralizationEvaluationMachine learning in practiceTypes of input dataTypes of machine learning algorithmsMatching input data to algorithmsMachine learning with RInstalling R packagesLoading and unloading R packagesSummaryChapter 2: Managing and Understanding DataR data structuresVectorsFactorsListsData framesMatrixes and arraysManaging data with RSaving, loading, and removing R data structuresImporting and saving data from CSV filesExploring and understanding dataExploring the structure of dataExploring numeric variablesMeasuring the central tendency- mean and medianMeasuring spread - quartiles and the five-number summaryVisualizing numeric variables - boxplotsVisualizing numeric variables - histogramsUnderstanding numeric data - uniform and normal distributionsMeasuring spread - variance and standard deviationExploring categorical variablesMeasuring the central tendency - the modeExploring relationships between variablesVisualizing relationships - scatterplotsExamining relationships - two-way cross-tabulationsSummaryChapter 3: Lazy Learning - Classification Using Nearest NeighborsUnderstanding nearest neighbor classificationThe k-NN algorithmMeasuring similarity with distanceChoosing an appropriate kPreparing data for use with k-NNWhy is the k-NN algorithm lazy?Example - diagnosing breast cancer with the k-NN algorithmStep 1 - collecting dataStep 2 - exploring and preparing the dataTransformation - normalizing numeric dataData preparation - creating training and test datasetsStep 3 - training a model on the dataStep 4 - evaluating model performanceStep 5 -improving model performanceTransformation - z-score standardizationTesting alternative values of kSummaryChapter 4: Probabilistic Learning - Classification Using Naive BayesUnderstanding Naive BayesBasic concepts of Bayesian methodsUnderstanding probabilityUnderstanding joint probabilityComputing conditional probability with Bayes' theoremThe Naive Bayes algorithmClassification with Naive BayesThe Laplace estimatorUsing numeric features with Naive BayesExample - filtering mobile phone spam with theNaive Bayes algorithmStep 1 - collecting dataStep 2 - exploring and preparing the dataData preparation - cleaning and standardizing text dataData preparation - splitting text documents into wordsData preparation - creating training and test datasetsVisualizing text data - word cloudsData preparation - creating indicator features for frequent wordsStep 3 - training a model on the dataStep 4 - evaluating model performanceStep 5 -improving model performanceSummaryChapter 5: Divide and Conquer - Classification Using Decision Trees and RulesChapter 6: Forecasting Numeric Data - Regression MethodsChapter 7: Black Box Methods - Neural Networks and Support Vector MachinesChapter 8: Finding Patterns - Market Basket Analysis Using Association RulesChapter 9: Finding Groups of Data - Clustering with k-meansChapter 10: Evaluating Model PerformanceChapter 11: Improving Model PerformanceChapter 12: Specialized Machine Learning TopicsIndex
【深度学习】


- 书名R语言机器学习 第2版(影印版)
- ISBN9787564170714
- 作者(美)布雷特·兰茨
- 出版社东南大学出版社
- 出版时间2017-04-01
- 印刷时间2017-04-01
- 版次1
- 开本16开
- 纸张胶版纸
- 包装平装-胶订
- 是否套装否
R语言机器学习 第2版
- 名称
- 类型
- 大小
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问
Video Player
×
Audio Player
×
pdf Player
×