目录
前言 ix
第 1 章 机器学习流程 1
1.1 数据 1
1.2 任务 1
1.3 模型 2
1.4 特征 3
1.5 模型评价 3
第 2 章 简单而又奇妙的数值 4
2.1 标量、向量和空间 5
2.2 处理计数 7
2.2.1 二值化 7
2.2.2 区间量化(分箱) 9
2.3 对数变换 13
2.3.1 对数变换实战 16
2.3.2 指数变换:对数变换的推广 19
2.4 特征缩放/ 归一化 24
2.4.1 min-max 缩放 24
2.4.2 特征标准化/ 方差缩放 24
2.4.3 2
归一化 25
2.5 交互特征 28
2.6 特征选择 30
2.7 小结 31
2.8 参考文献 32
第3 章 文本数据:扁平化、过滤和分块 33
3.1 元素袋:将自然文本转换为扁平向量 34
3.1.1 词袋 34
3.1.2 n 元词袋 37
3.2 使用过滤获取清洁特征 39
3.2.1 停用词 39
3.2.2 基于频率的过滤 40
3.2.3 词干提取 42
3.3 意义的单位:从单词、n 元词到短语 43
3.3.1 解析与分词 43
3.3.2 通过搭配提取进行短语检测 44
3.4 小结 50
3.5 参考文献 51
第4 章 特征缩放的效果:从词袋到tf-idf 52
4.1 tf-idf:词袋的一种简单扩展 52
4.2 tf-idf 方法测试 54
4.2.1 创建分类数据集 55
4.2.2 使用tf-idf 变换来缩放词袋 56
4.2.3 使用逻辑回归进行分类 57
4.2.4 使用正则化对逻辑回归进行调优 58
4.3 深入研究:发生了什么 62
4.4 小结 64
4.5 参考文献 64
第5 章 分类变量:自动化时代的数据计数 65
5.1 分类变量的编码 66
5.1.1 one-hot 编码 66
5.1.2 虚拟编码 66
5.1.3 效果编码 69
5.1.4 各种分类变量编码的优缺点 70
5.2 处理大型分类变量 70
5.2.1 特征散列化 71
5.2.2 分箱计数 73
5.3 小结 79
5.4 参考文献 80
第6 章 数据降维:使用PCA 挤压数据 82
6.1 直观理解 82
6.2 数学推导 84
6.2.1 线性投影 84
6.2.2 方差和经验方差 85
6.2.3 主成分:第 一种表示形式 86
6.2.4 主成分:矩阵- 向量表示形式 86
6.2.5 主成分的通用解 86
6.2.6 特征转换 87
6.2.7 PCA 实现 87
6.3 PCA 实战 88
6.4 白化与ZCA 89
6.5 PCA 的局限性与注意事项 90
6.6 用例 91
6.7 小结 93
6.8 参考文献 93
第7 章 非线性特征化与k-均值模型堆叠 94
7.1 k-均值聚类 95
7.2 使用聚类进行曲面拼接 97
7.3 用于分类问题的k-均值特征化 100
7.4 优点、缺点以及陷阱 105
7.5 小结 107
7.6 参考文献 107
第8 章 自动特征生成:图像特征提取和深度学习 108
8.1 *简单的图像特征(以及它们因何失效) 109
8.2 人工特征提取:SIFT 和HOG 110
8.2.1 图像梯度 110
8.2.2 梯度方向直方图 113
8.2.3 SIFT 体系 116
8.3 通过深度神经网络学习图像特征 117
8.3.1 全连接层 117
8.3.2 卷积层 118
8.3.3 ReLU 变换 122
8.3.4 响应归一化层 123
8.3.5 池化层 124
8.3.6 AlexNet 的结构 124
8.4 小结 127
8.5 参考文献 128
第9 章 回到特征:建立学术论文推荐器 129
9.1 基于项目的协同过滤 129
9.2 第 一关:数据导入、清理和特征解析 130
9.3 *二关:更多特征工程和更智能的模型 136
9.4 第三关:更多特征= 更多信息 141
9.5 小结 144
9.6 参考文献 144
附录A 线性建模与线性代数基础 145
A.1 线性分类概述 145
A.2 矩阵的解析 147
A.2.1 从向量到子空间 148
A.2.2 奇异值分解(SVD) 150
A.2.3 数据矩阵的四个基本子空间 151
A.3 线性系统求解 153
A.4 参考文献 155
作者简介 156
封面简介 156
作者介绍
爱丽丝·郑(Alice Zheng) 亚
马逊广告平台建模和优化团队负责人,应用机器学习、生成算法和平台开发领域的技术领dao者,前微软研究院机器学习研究员。 阿曼达·卡萨丽(Amanda Casari) 谷歌云*发者关系工程经理,曾是Concur Labs的产品经理和数据科学家,在数据科学、机器学习、复杂系统和机器人等多个领域都有丰富经验。
发货方式
自动:在特色服务中标有自动发货的商品,拍下后,源码类 软件类 商品会在订单详情页显示来自卖家的商品下载链接,点卡类 商品会在订单详情直接显示卡号密码。
手动:未标有自动发货的的商品,付款后,商品卖家会收到平台的手机短信、邮件提醒,卖家会尽快为您发货,如卖家长时间未发货,买家也可通过订单上的QQ或电话主动联系卖家。
退款说明
1、源码类:商品详情(含标题)与实际源码不一致的(例:描述PHP实际为ASP、描述的功能实际缺少、功能不能正常使用等)!有演示站时,与实际源码不一致的(但描述中有"不保证完全一样、可能有少许偏差"类似显著公告的除外);
2、营销推广类:未达到卖家描述标准的;
3、点卡软件类:所售点卡软件无法使用的;
3、发货:手动发货商品,在卖家未发货前就申请了退款的;
4、服务:卖家不提供承诺的售后服务的;(双方提前有商定和描述中有显著声明的除外)
5、其他:如商品或服务有质量方面的硬性常规问题的。未符合详情及卖家承诺的。
注:符合上述任一情况的,均支持退款,但卖家予以积极解决问题则除外。交易中的商品,卖家无法修改描述!
注意事项
1、在付款前,双方在QQ上所商定的内容,也是纠纷评判依据(商定与商品描述冲突时,以商定为准);
2、源码商品,同时有网站演示与商品详情图片演示,且网站演示与商品详情图片演示不一致的,默认按商品详情图片演示作为纠纷评判依据(卖家有特别声明或有额外商定的除外);
3、点卡软件商品,默认按商品详情作为纠纷评判依据(特别声明或有商定除外);
4、营销推广商品,默认按商品详情作为纠纷评判依据(特别声明或有商定除外);
5、在有"正当退款原因和依据"的前提下,写有"一旦售出,概不支持退款"等类似的声明,视为无效声明;
6、虽然交易产生纠纷的几率很小,卖家也肯定会给买家最完善的服务!但请买卖双方尽量保留如聊天记录这样的重要信息,以防产生纠纷时便于送码网快速介入处理。
送码声明
1、送码网作为第三方中介平台,依据双方交易合同(商品描述、交易前商定的内容)来保障交易的安全及买卖双方的权益;
2、非平台线上交易的项目,出现任何后果均与送码网无关;无论卖家以何理由要求线下交易的(如:要求买家支付宝转账付款的,微信转账付款的等),请联系管理举报,本平台将清退卖家处理。
正版 steam 原子之心 Atomic Heart 国区激活码 cd...
steam 英雄连3 国区激活码CDKEY PC游戏正版 Compan...
M,日朋礼送男友老公创意实人用星人际机器蓝牙音箱走心情节生礼...
zippo之宝官方正品打火机古银双面贴章机器人煤油机送男友礼物女...
秋季圆领卫衣套头男友风秋天长袖时尚潮流印花卡通机器派大星上衣...
机器猫情侣衬衫小叮当落肩短袖衬衣男友外套大码潮流套装上衣薄款...
PDPAOLA小机器人情侣手链女男生日礼物520送男友男士款闺蜜Rob...
兼容乐高复仇者联盟4战争机器积木人仔钢铁侠救援机甲玩具WM723...
兼容乐高复联4钢铁侠X0252灭霸MK50 MK1战争机器拼装积木人仔...
XBOX ONE SERIES X|S 中文 战争机器4与光环5守护...
PC中文正版 铁拳7 steam动作游戏TEKKEN 7 激活码KEY...
PC中文正版 Steam 灵魂骇客2 Soul Hackers 2 ...
3册 青藤硬笔楷书入门教程硬笔书法 初学者入门练字小学生铅笔字帖圆珠笔...
【现货正版】鲁迅文学院百草园文集:我爱桃花9787501594115...
海外直订The Giant Robot Dinosaur 巨型机器人恐...
【新华书店旗舰店官网】正版包邮 笛子基础教程十四课上册 简谱版 笛子初...
王者荣耀2速写临摹范本2022烈公汤大伟人物速写教程局部结构人体动态站...
焊接机器人操作工理论考试题库 焊接技能大赛 写 著 中国工程建设焊接协...
匹克问鼎篮球鞋男2023春季魔弹科技实战防滑球鞋运动鞋男鞋...
pc中文steam 骑马与砍杀2 霸主 领主 骑马与砍杀战团 骑砍合集...