| |||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||
|
内容介绍
机器学习
机器学习是计算机科学与人工智能的重要分支领域. 本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面. 全书#16 章,大致分为3 个部分:第1 部分(第1~3 章)介绍机器学习的基础知识;第2 部分(第4~10 章)讨论—些经典而常用的机器学习方法(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习);第3 部分(第11~16 章)为进阶知识,内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等. 每章都附有习题并介绍了相关阅读材料,以便有兴趣的读者进—步钻研探索。
本书可作为高等院校计算机、自动化及相关专业的本科生或研究生教材,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。
统计学习方法
统计学习是计算机及其应用领域的一门重要的学科。本书全面系统地介绍了统计学习的主要方法,te别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与大熵模型、支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。除第壹章概论和后一章总结外,每章介绍一种方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。
《统计学习方法》是统计学习及相关课程的教学参考书,适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,也可供从事计算机应用相关专业的研发人员参考。
机器学习
第1章 1
1.1 引言 1
1.2 基本术 2
1.3 假设空间 4
1.4 归纳偏好 6
1.5 发展历程 10
1.6 应用现状 13
1.7 阅读材料 16
习题 19
参考文献 20
休息—会儿 22
第2章 模型评估与选择 23
2.1 经验误差与过拟合 23
2.2 评估方法 24
2.2.1 留出法 25
2.2.2 交叉验证法 26
2.2.3 自助法 27
2.2.4 调参与*终模型 28
2.3 性能度量 28
2.3.1 错误率与精度 29
2.3.2 查准率、查全率与F1 30
2.3.3 ROC与AUC 33
2.3.4 代#敏感错误率与代#曲线 35
2.4 比较检验 37
2.4.1 假设检验 37
2.4.2 交叉验证t检验 40
2.4.3 McNemar检验 41
2.4.4 Friedman检验与后续检验 42
2.5 偏差与方差 44
2.6 阅读材料 46
习题 48
参考文献 49
休息—会儿 51
第3章 线性模型 53
3.1 基本形式 53
3.2 线性回归 53
3.3 对数几率回归 57
3.4 线性判别分析 60
3.5 多分类学习 63
3.6 类别不平衡问题 66
3.7 阅读材料 67
习题 69
参考文献 70
休息—会儿 72
第4章 决策树 73
4.1 基本流程 73
4.2 划分选择 75
4.2.1 信息增益 75
4.2.2 增益率 77
4.2.3 基尼指数 79
4.3 剪枝处理 79
4.3.1 预剪枝 80
4.3.2 后剪枝 82
4.4 连续与缺失值 83
4.4.1 连续值处理 83
4.4.2 缺失值处理 85
4.5 多变量决策树 88
4.6 阅读材料 92
习题 93......
统计学习方法
第壹章 统计学习方法概论
1.1 统计学习
1.2 监督学习
1.2.1 基本概念
1.2.2 问题的形式化
1.3 统计学习三要素
1.3.1 模型
1.3.2 策略
1.3.3 算法
1.4 模型评估与模型选择
1.4.1 训练误差与测试误差
1.4.2 过拟合与模型选择
1.5 正则化与交叉验证
1.5.1 正则化
1.5.2 交叉验证
1.6 泛化能力
1.6.1 泛化误差
1.6.2 泛化误差上界
1.7 生成模型与判别模型
1.8 分类问题
1.9 标注问题
1.10 回归问题
本章概要
继续阅读
习题
参考文献
第2章 感知机
2.1 感知机模型
2.2 感知机学习策略
2.2.1 数据集的线性可分性
2.2.2 感知机学习策略
2.3 感知机学习算法
2.3.1 感知机学习算法的原始形式
2.3.2 算法的收敛性
2.3.3 感知机学习算法的对偶形式
本章概要
继续阅读
习题
参考文献
第3章 众近邻法
3.1 k近邻算法
3.2 k近邻模型
3.2.1 模型
3.2.2 距离度量
3.2.3 k值的选择
3.2.4 分类决策规则
3.3 k近邻法的实现:kd树
3.3.1 构造af树
3.3.2 搜索af树
本章概要
继续阅读
习题
参考文献
第4章 朴素贝叶斯法
4.1 朴素贝叶斯法的学习与分类
4.1.1 基本方法
4.1.2 后验概率大化的含义
4.2 朴素贝叶斯法的参数估计
4.2.1 极大似然估计
4.2.2 学习与分类算法
4.2.3 贝叶斯估计
本章概要
继续阅读
习题
参考文献
第5章 决策树
5.1 决策树模型与学习
5.1.1 决策树模型
5.1.2 决策树与isthen规则
5.1.3 决策树与条件概率分布
5.1.4 决策树学习
5.2 特征选择
5.2.1 特征选择问题
5.2.2 信息增益
5.2.3 信息增益比
5.3 决策树的生成
5.3.1 1d3算法
5.3.2 c4.5 的生成算法
5.4 决策树的剪枝
5.5 cart算法
5.5.1 cart生成
5.5.2 cart剪枝
本章概要
继续阅读
习题
参考文献
第6章 逻辑斯谛回归与大熵模型
6.1 逻辑斯谛回归模型
6.1.1 逻辑斯谛分布
6.1.2 项逻辑斯谛回归模型
6.1.3 模型参数估计
6.1.4 多项逻辑斯谛回归
6.2 大熵模型
6.2.1 大熵原理
6.2.2 大熵模型的定义
6.2.3 大熵模型的学习
6.2.4 极大似然估计
6.3 模型学习的优化算法
6.3.1 改进的迭代尺度法
6.3.2 拟牛顿法
本章概要
继续阅读
习题
参考文献
第7章 支持向量机
7.1 线性可分支持向量机与硬间隔大化
7.1.1 线性可分支持向量机
7.1.2 函数间隔和几何间隔
7.1.3 间隔大化
7.1.4 学习的对偶算法
7.2 线性支持向量机与软间隔大化
7.2.1 线性支持向量机
7.2.2 学习的对偶算法
7.2.3 支持向量
7.2.4 合页损失函数
7.3 非线性支持向量机与核函数
7.3.1 核技巧
7.3.2 定核
7.3.3 常用核函数
7.3.4 非线性支持向量分类机
7.4 序列小优化算法
7.4.1 两个变量二次规划的求解方法
7.4.2 变量的选择方法
7.4.3 smo算法
本章概要
继续阅读
习题
参考文献
第8章 提升方法
8.1 提升方法adaboost算法
8.1.1 提升方法的基本思路
8.1.2 adaboost算法
8.1.3 adaboost的例子
8.2 adaboost算法的训练误差分析
8.3 adaboost算法的解释
8.3.1 前向分步算法
8.3.2 前向分步算法与ad9boost
8.4 提升树
8.4.1 提升树模型
8.4.2 提升树算法
8.4.3 梯度提升
本章概要
继续阅读
习题
参考文献
第9章 em算法及其推广
9.1 em算法的引入
9.1.1 em算法
9.1.2 em算法的导出
9.1.3 em算法在非监督学习中的应用
9.2 em算法的收敛性
9.3 em算法在高斯混合模型学习中的应用
9.3.1 高斯混合模型
9.3.2 高斯混合模型参数估计的em算法
9.4 em算法的推广
9.4.1 f函数的极大极大算法
9.4.2 gem算法
本章概要
继续阅读
习题
参考文献
第壹0章 隐马尔可夫模型
10.1 隐马尔可夫模型的基本概念
10.1.1 隐马尔可夫模型的定义
10.1.2 观测序列的生成过程
10.1.3 隐马尔可夫模型的3个基本问题
10.2 概率计算算法
10.2.1 直接计算法
10.2.2 前向算法
10.2.3 后向算法
10.2.4 一些概率与期望值的计算
10.3 学习算法
10.3.1 监督学习方法
10.3.2 baum-welch算法
10.3.3 baum-welch模型参数估计公式
10.4 预测算法
10.4.1 近似算法
10.4.2 维特比算法
本章概要
继续阅读
习题
参考文献
第壹1章 条件随机场
11.1 概率无向图模型
11.1.1 模型定义
11.1.2 概率无向图模型的因子分解
11.2 条件随机场的定义与形式
11.2.1 条件随机场的定义
11.2.2 条件随机场的参数化形式
11.2.3 条件随机场的简化形式
11.2.4 条件随机场的矩阵形式
11.3 条件随机场的概率计算问题
11.3.1 前向后向算法
11.3.2 概率计算
11.3.3 期望值的计算
11.4 条件随机场的学习算法
11.4.1 改进的迭代尺度法
11.4.2 拟牛顿法
11.5 条件随机场的预测算法
本章概要
继续阅读
习题
参考文献
第壹2章 统计学习方法总结
附录a 梯度下降法
附录b 牛顿法和拟牛顿法
附录c 拉格朗日对偶性
索引