当当网统计挖掘与机器学习：大数据预测建模和分析技术（原书第3版）计算机网络数据库机械工业出版社正版书籍送码网

本书创造性地汇编了数据挖掘技术，将统计数据挖掘和机器学习数据挖掘进行了区分，对经典和现代统计方法框架进行了扩展，以用于预测建模和大数据分析。本书为数据挖掘领域新晋的数据科学家所面临的共同问题提供了适当的解决方案，并侧重于数据科学家的需求，提供了实用且强大、简单而富有洞察力的量化技术，其中大部分使用了受新机器学习影响改进的“旧”统计方法。在这本畅销书的新版里，作者大幅修改并重新组织章节内容，新增了一些富有创意且用途广泛的机器学习数据挖掘技术方面的内容。简单而有针对性的量化处理方法使得本书在数据挖掘图书领域别具一格。

基本信息

商品名称：		开本：	16开
作者：	[美]布鲁斯·拉特纳(Bruce Ratner)	定价：	149.00
ISBN号：	9787111689942	出版时间：	2021-09-20
出版社：	机械工业出版社	印刷时间：	2021-09-01
版次：	1	印次：	1

第3版前言
第2版前言
致谢
关于作者
章　引论 1
1.1　个人计算机与统计学 1
1.2　统计学和数据分析 2
1.3　EDA简介 3
1.4　EDA范式 4
1.5　EDA的弱点 5
1.6　小数据和大数据 5
1.6.1　数据规模特征 6
1.6.2　数据规模：个人观点 7
1.7　数据挖掘范式 7
1.8　统计学和机器学习 8
1.9　统计数据挖掘 9
参考资料 9
第2章　数据处理相关学科：统计学和数据科学 11
2.1　引言 11
2.2　背景 11
2.3　统计学与数据科学的比较 12
2.4　讨论：统计学与数据科学的不同之处 18
2.5　本章小结 19
2.6　结语 19
参考资料 19
第3章　变量评估的两种基本数据挖掘方法 21
3.1　引言 21
3.2　相关系数 21
3.3　散点图 22
3.4　数据挖掘 24
3.4.1　示例3.1 24
3.4.2　示例3.2 24
3.5　平滑散点图 25
3.6　一般关联性检验 27
3.7　本章小结 28
参考资料 29
第4章　用于评估成对变量的基于CHAID的数据挖掘方法 30
4.1　引言 30
4.2　散点图 30
4.3　平滑散点图 31
4.4　CHAID入门 32
4.5　用更平滑的散点图进行基于CHAID的数据挖掘 33
4.6　本章小结 36
参考资料 37
第5章　校直数据的简单性和可取性对建模十分重要 38
5.1　引言 38
5.2　数据的直度和对称度 38
5.3　数据挖掘是概念 39
5.4　相关系数 39
5.5　（xx3，yy3）散点图 40
5.6　挖掘（xx3，yy3）关系 41
5.7　基于遗传算法的数据挖掘如何处理数据 43
5.8　校直多个变量 43
5.9　本章小结 44
参考资料 44
第6章　排序数据对称化：提高数据预测能力的统计数据挖掘方法 45
6.1　引言 45
6.2　量度范围 45
6.3　茎叶图 47
6.4　箱线图 47
6.5　排序数据对称处理方法的图示 47
6.5.1　示例1 48
6.5.2　示例2 50
6.6　本章小结 56
参考资料 56
第7章　主成分分析：多变量评估的统计数据挖掘方法 57
7.1　引言 57
7.2　EDA重新表述范式 57
7.3　关键点 58
7.4　PCA基础 58
7.5　示例详解 58
7.6　PCA的代数特征 59
7.7　一个不常见示例 60
7.7.1　R_CD元素（X1，X2，X3，X4，X5，X6）主成分分析 61
7.7.2　R_CD元素（X1，X2，X3，X4，X5，X6）主成分分析结果 61
7.8　用PCA构造准交互变量 62
7.9　本章小结 66
第8章　市场份额估算：一个特殊的数据挖掘案例 67
8.1　引言 67
8.2　背景 67
8.3　一个特殊的数据挖掘案例 68
8.4　构建RAL的YUM市场份额模型 69
8.4.1　市场份额模型的十分位分析 76
8.4.2　YUM_3mos市场份额模型的结论 76
8.5　本章小结 77
附录8.A 　生成 PROMO_Code哑变量 77
附录8.B　PROMO_Code哑变量的PCA 77
附录8.C　PROMO_Code哑变量上的逻辑斯谛回归YUM_3mos 78
附录8.D　生成YUM_3mos_wo_PROMO_CodeEff 78
附录 8.E　将变量标准化为位于[0， 1]内 78
参考资料 79
第9章　相关系数在[-1, 1]内取值，是这样吗 80
9.1　引言 80
9.2　相关系数的基础知识 80
9.3　计算相关系数 81
9.4　重新配对 82
9.5　计算经调整的相关系数 84
9.6　重新配对的意义 84
9.7　本章小结 84
0章　逻辑斯谛回归：回应建模方法 85
10.1　引言 85
10.2　逻辑斯谛回归模型 86
10.2.1　示例 86
10.2.2　为LRM打分 87
10.3　案例分析 88
10.4　logit值和logit散点图 89
10.5　校直数据的重要性 90
10.6　校直数据的重述 91
10.6.1　幂阶梯法 91
10.6.2　突起规则 91
10.6.3　测量校直数据 92
10.7　校直示例数据 92
10.7.1　FD2_OPEN的重述 93
10.7.2　INVESTMENT的重述 94
10.8　在突起规则不适用的情况下选用的技术 95
10.8.1　拟合logit值散点图 95
10.8.2　平滑预测值与实际值散点图 96
10.9　MOS_OPEN的重述 96
10.10　评估变量的重要性 99
10.10.1　计算G统计量 99
10.10.2　单变量的重要性 100
10.10.3　变量子集合的重要性 100
10.10.4　不同变量子集合的重要性比较 100
10.11　案例的重要变量 101
10.12　变量的相对重要性 102
10.13　案例变量的子集合 103
10.14　模型预测准确性的可视化指标 104
10.14.1　得分组的平滑残差散点图 104
10.14.2　基于十分位组的平滑预测与实际值散点图 106
10.

......

本书是一本区分统计数据挖掘和机器学习数据挖掘的图书。它创造性地汇编了数据挖掘技术，解决了对经典和现代统计方法框架的扩展，用于预测建模和大数据分析。SM-DM为数据挖掘领域新晋的数据科学家所面临的共同问题提供了适当的解决方案。它的展示侧重于数据科学家(通常被称为统计学家、数据采矿者和数据分析师)的需求，提供实用但又强大的、简单而又有洞察力的量化技术，其中大部分使用了新机器学习影响改进的“旧”统计方法。

......

当当网统计挖掘与机器学习：大数据预测建模和分析技术（原书第3版）计算机网络数据库机械工业出版社正版书籍

......

交易流程

发货方式
自动：在特色服务中标有自动发货的商品，拍下后，源码类软件类商品会在订单详情页显示来自卖家的商品下载链接，点卡类商品会在订单详情直接显示卡号密码。
手动：未标有自动发货的的商品，付款后，商品卖家会收到平台的手机短信、邮件提醒，卖家会尽快为您发货，如卖家长时间未发货，买家也可通过订单上的QQ或电话主动联系卖家。
退款说明
1、源码类：商品详情(含标题)与实际源码不一致的（例：描述PHP实际为ASP、描述的功能实际缺少、功能不能正常使用等）！有演示站时，与实际源码不一致的（但描述中有"不保证完全一样、可能有少许偏差"类似显著公告的除外）；
2、营销推广类：未达到卖家描述标准的；
3、点卡软件类：所售点卡软件无法使用的；
3、发货：手动发货商品，在卖家未发货前就申请了退款的；
4、服务：卖家不提供承诺的售后服务的；（双方提前有商定和描述中有显著声明的除外）
5、其他：如商品或服务有质量方面的硬性常规问题的。未符合详情及卖家承诺的。
注：符合上述任一情况的，均支持退款，但卖家予以积极解决问题则除外。交易中的商品，卖家无法修改描述！
注意事项
1、在付款前，双方在QQ上所商定的内容，也是纠纷评判依据（商定与商品描述冲突时，以商定为准）；
2、源码商品，同时有网站演示与商品详情图片演示，且网站演示与商品详情图片演示不一致的，默认按商品详情图片演示作为纠纷评判依据（卖家有特别声明或有额外商定的除外）；
3、点卡软件商品，默认按商品详情作为纠纷评判依据（特别声明或有商定除外）；
4、营销推广商品，默认按商品详情作为纠纷评判依据（特别声明或有商定除外）；
5、在有"正当退款原因和依据"的前提下，写有"一旦售出，概不支持退款"等类似的声明，视为无效声明；
6、虽然交易产生纠纷的几率很小，卖家也肯定会给买家最完善的服务！但请买卖双方尽量保留如聊天记录这样的重要信息，以防产生纠纷时便于送码网快速介入处理。
送码声明
1、送码网作为第三方中介平台，依据双方交易合同（商品描述、交易前商定的内容）来保障交易的安全及买卖双方的权益；
2、非平台线上交易的项目，出现任何后果均与送码网无关；无论卖家以何理由要求线下交易的（如：要求买家支付宝转账付款的，微信转账付款的等），请联系管理举报，本平台将清退卖家处理。