《统计学习要素:机器学习中的数据挖掘、推断与预测(第2版)》包含人工智能中用到的许多代表性主题,比如图模型、随机森林、集成方法、Lasso*小角度回归和路径算法、非负矩阵分解和频谱聚类。此外,还用一章篇幅来介绍“宽”数据(p大于n)的方法,包括多次测试和误检率。
对统计领域、人工智能领域及相关科学或行业领域内的读者而言,《统计学习要素:机器学习中的数据挖掘、推断与预测(第2版)》是一个难得的宝库,涉及面很广,从监督学习(预测)到无监督学习,具体主题包括神经网络、支持向量机、分类树和Boosting(率先对该主题进行综合论述)。与此同时,书中还包含丰富的示例和大量彩色的图表。
商品名称: | 开本: | 16开 | |
作者: | [美]特雷弗·哈斯蒂 [美]罗伯特·提布施拉尼 [美]杰罗姆· 弗雷曼 著 张军平 译 | 定价: | 159.00 |
ISBN号: | 9787302557395 | 出版时间: | 2021-01-01 |
出版社: | 清华大学出版社 | 印刷时间: | 2021-01-01 |
版次: | 1 | 印次: | 1 |
简明目录
章 概述1
第2章 监督学习综述7
第3章 回归的线性方法7
第4章 分类的线性方法77
第5章 基展开与正则化方法105
第6章 核平滑方法143
第7章 模型的评估和选择165
第8章 模型的推断和平均197
第9章 加性模型、树和相关方法223
0章 Boosting 和加性树255
1章 神经网络293
2章 支持向量机与柔性判别分析315
3章 原型方法与近邻347
4章 非监督学习365
5章 随机森林441
6章 集成学习455
7章 无向图模型471
8章 高维问题:p?N 489
章 概述 1
1.1 示例1:垃圾邮件 1
1.2 示例2:前列腺癌 2
1.3 示例3:手写数字识别 2
1.4 示例4:DNA 表达微阵列 4
1.5 本书的读者群体 5
1.6 本书的组织 6
1.7 本书网站 6
1.8 给教师的建议 6
第2章 监督学习综述 7
2.1 概述 7
2.2 变量类型和术语 7
2.3 两个简单的预测方法:小二乘和近邻 8
2.3.1 线性模型和小二乘 8
2.3.2 近邻方法 11
2.3.3 从小二乘到近邻 12
2.4 统计决策理论 14
2.5 高维中的局部方法 17
2.6 统计模型、监督学习和函数逼近 21
2.6.1 联合分布Pr(?,?) 的统计模型 21
2.6.2 监督学习 22
2.6.3 函数逼近 22
2.7 结构化的回归模型 24
2.8 受限估计子的种类 26
2.8.1 粗糙度惩罚和贝叶斯方法 26
2.8.2 核方法和局部回归 26
2.8.3 基函数和词典方法 27
2.9 模型选择和偏差-方差折衷 28
文献说明 30
习题 30
第3章 回归的线性方法 33
3.1 概述 33
3.2 线性回归模型和小二乘 33
3.2.1 示例:前列腺癌 38
3.2.2 高斯-马尔可夫定理 39
3.2.3 源自简单一元回归的多元回归 40
3.2.4 多元输出 43
3.3 子集选择 44
3.3.1 子集选择 44
3.3.2 分步前向和分步反向选择 45
3.3.3 分阶段前向回归 46
3.3.4 示例:前列腺癌(续) 46
3.4 收缩方法 47
3.4.1 岭回归 48
3.4.2 Lasso 回归 52
3.4.3 讨论:子集选择、岭回归和Lasso 回归 . 54
3.4.4 小角度回归 56
3.5 采用导出的输入方向的方法 60
3.5.1 主成分回归 60
3.5.2 偏小二乘 61
3.6 讨论:选择和收缩方法的比较 62
3.7 多元输出的收缩和选择 63
3.8 关于Lasso 和相关路径算法的更多讨论 65
3.8.1 增量式分阶段前向回归 65
3.8.2 分段线性路径算法 67
3.8.3 Dantzig 选择算子 67
3.8.4 成组Lasso 68
3.8.5 Lasso 的进一步特性 69
3.8.6 逐路径坐标优化 70
3.9 计算考虑 71
文献说明 71
习题 71
第4章 分类的线性方法 77
4.1 概述 77
4.2 指示矩阵的线性回归 78
4.3 线性判别分析 82
4.3.1 正则判别分析 85
4.3.2 LDA 的计算 86
4.3.3 降秩线性判别分析 86
4.4 Logistic 回归 90
4.4.1 拟合Logistics 回归模型 90
4.4.2 示例:南非人的心脏病 92
4.4.3 二次逼近和推断 94
4.4.4 ?1 正则化Logistic 回归 95
4.4.5 Logistic 回归或LDA? 96
4.5 分离超平面 97
4.5.1 罗森布拉特的感知机学习算法 99
4.5.2 分离超平面 100
文献说明 102
习题 102
第5章 基展开与正则化方法 105
5.1 概述 105
5.2 分段多项式与样条 106
5.2.1 自然三次样条 109
5.2.2 示例:......
《统计学习要素:机器学习中的数据挖掘、推断与预测(第2版)》在一个通用的概念框架中描述通用于数据挖掘、机器学习和生物信息学等领域的重要思想和概念。这些统计学范畴下的概念是人工智能与机器学习的基础。全书共18 章,主题包括监督学习、回归的线性方法、分类的线性方法、基展开和正则化、核光滑方法、模型评估和选择、模型推断和平均、加性模型、树和相关方法、Boosting 和加性树、神经网络、支持向量机和柔性判断、原型方法和*近邻、非监督学习、随机森林、集成学习、无向图模型和高维问题等。
《统计学习要素:机器学习中的数据挖掘、推断与预测(第2版)》主题,是一本经典的统计学习教材,适合本科高年级学生和研究生使用和参考。
斯坦福大学统计学教授。三人是该领域的杰出研究人员。哈斯蒂在新泽西州的AT&T贝尔实验室以技术人员身份工作9年之后,于1994年8月加入斯坦福大学任教。哈斯蒂用S-PLUS写了许多统计建模软件,并发明了主要曲线和曲面。他和提布施拉尼共同开发了广义加性模型并写了这一主题的热门书。提布施拉尼提出了Lasso,参与创作了《Bootstrap概论》,这本书取得了相当大的成功。弗雷曼是许多数据挖掘工具的共同发明人,包括CART、MARS、投影追踪和梯度Boosting。