商品基本信息
商品名称:
推荐系统实战宝典
作 者:
猿媛之家 组编 吕倩倩 楚秦 等编著
市 场 价:
99.00元
ISBN 号:
9787111713531
页 数:
269
出 版 社:
机械工业出版社
目录 |
第1部分 推荐系统介绍篇 第1章 推荐系统概述/2 1.1 什么是推荐系统/2 1.2 推荐系统的架构/3 1.3 推荐系统架构治理/4 1.4 推荐引擎的架构/5 1.5 推荐系统的应用/9 1.5.1 电影和视频网站/9 1.5.2 个性化音乐电台/10 1.5.3 个性化广告及搜索广告/10 1.5.4 多业务融合推荐策略实践与思考/11 1.6 推荐系统评测/11 1.6.1 推荐系统实验方法/12 1.6.2 评测指标/13 1.6.3 评测维度/14 1.7 推荐系统知识储备/14 第2部分 推荐系统基础篇 第2章 机器学习准备工作/16 2.1 机器学习绪论/18 2.1.1 数据积累/18 2.1.2 特征(过滤法、包装法、嵌入法)/18 2.1.3 模型的不可解释性/22 2.2 数学基础知识/23 2.2.1 微积分/23 2.2.2 统计学/29 2.2.3 线性代数/35 2.2.4 信息论基础/36 2.2.5 凸优化/37 2.3 Python编程/39 第3章 机器学习基础——让推荐系统更懂你/49 3.1 贝叶斯分类器/49 3.1.1 贝叶斯决策论/53 3.1.2 大似然估计/57 3.1.3 EM算法/59 3.1.4 垃圾邮件过滤实战/62 3.2 决策树/65 3.3 支持向量机(SVM)/70 3.3.1 SVM介绍/70 3.3.2 半监督SVM/71 3.4 KNN算法/71 3.5 线性回归/73 3.6 逻辑回归/77 3.7 Spark MLlib/79 3.7.1 Spark MLlib简介/79 3.7.2 Spark MLlib矩阵计算/80 3.7.3 Spark MLlib实现分类算法/81 3.7.4 Spark MLlib实现回归算法/81 3.7.5 Spark MLlib实现聚类算法/82 3.8 聚类任务/82 3.8.1 k均值聚类算法/82 3.8.2 高斯混合聚类/85 第3部分 推荐系统进阶篇 第4章 基于点击率预估、RBM的推荐/94 4.1 传统推荐算法的局限和应用/94 4.1.1 传统推荐算法的局限/94 4.1.2 传统推荐算法的应用/95 4.1.3 点击率预估在推荐系统中的应用/95 4.2 集成学习(Ensemble Learning)/95 4.2.1 GBDT/96 4.2.2 XgBoost/97 4.2.3 Bagging与随机森林/98 4.3 实例:基于RBM的推荐算法/102 第5章 基于标签的推荐/104 5.1 基于标签系统的应用/104 5.2 数据标注与关键词提取/104 5.2.1 推荐系统中的数据标注/104 5.2.2 推荐系统中的关键词提取/105 5.2.3 标签的分类/106 5.3 基于标签的推荐系统/106 5.3.1 标签评分算法/106 5.3.2 标签评分算法改进/107 5.3.3 标签基因/107 5.3.4 用户兴趣建模/107 5.4 实例:使用标签推荐算法实现艺术家的推荐/108 5.4.1 了解实现思路/108 5.4.2 准备数据/108 5.4.3 选择算法/109 5.4.4 模型训练/109 5.4.5 效果评估/110 第6章 推荐算法/112 6.1 基于内容的推荐算法/112 6.2 基于用户行为特征的推荐算法/113 6.2.1 User-Based CF详解及优化/114 6.2.2 Item-Based CF详解及优化/115 6.2.3 融合Match中协同过滤思想的深度排序模型/116 6.3 基于模型的推荐算法/117 6.4 基于流行度的推荐算法/118 6.5 混合算法/119 6.6 基于图的模型/120 6.6.1 用户行为数据的二分图表示/120 6.6.2 基于图的推荐算法/121 6.7 基于社交网络的推荐/121 6.7.1 基于邻域的社会化推荐算法/121 6.7.2 基于图的社会化推荐算法/122 6.8 Slope-one推荐算法/122 6.9 基于DNN的推荐算法介绍/123 6.10 基于TF实现稀疏自编码和在推荐中的应用/124 6.11 联邦推荐算法及应用/127 第7章 推荐系统冷启动及召回方法/131 7.1 冷启动问题简介/131 7.2 选择合适的物品启动用户的兴趣/131 7.3 利用物品的内容信息/132 7.4 Multi-View DNN模型解决用户冷启动/132 第4部分 推荐系统强化篇 第8章 基于上下文的推荐/134 8.1 基于时间特征的推荐/134 8.1.1 时间效应介绍/134 8.1.2 推荐系统的实时性/135 8.1.3 协同过滤中的时间因子/135 8.2 实例:增加时间衰减函数的协同过滤算法/136 8.2.1 在UserCF算法中增加时间衰减函数/136 8.2.2 在ItemCF算法中增加时间衰减函数/137 第9章 文本处理/139 9.1 Word2Vec/139 9.1.1 Word2Vec简介/139 9.1.2 词向量/141 9.1.3 分层优化语言模型/147 9.1.4 连续词袋模型/147 9.2 fastText/150 9.2.1 模型架构/150 9.2.2 层次Softmax/151 9.2.3 N-Gram子词特征/151 9.2.4 fastText和Word2Vec的区别/152 9.2.5 使用fastText分类/152 9.3 Gensim/154 9.3.1 Gensim基本概念/154 9.3.2 Gensim的安装及简单使用/154 9.3.3 主题向量的转化:TF-IDF(词频逆文档频率)/156 9.3.4 主题向量的转化:LSA(潜在语义分析)/160 9.3.5 主题向量的转化:LDA(隐含狄利克雷分配)/161 9.4 NLTK/161 9.4.1 NLTK的介绍/161 9.4.2 NLTK的安装及信息提取/162 第10章 使用矩阵分解的推荐/164 10.1 Spark ALS/164 10.1.1 Spark ALS原理/164 10.1.2 Spark ALS实现协同过滤/178 10.2 暗示学习法implicit/185 10.3 libFM/185 10.3.1 libFM的介绍/185 10.3.2 libFM的源码剖析/186 10.4 SVD算法/189 10.4.1 SVD算法的介绍/189 10.4.2 基于SVD算法的推荐系统实现/191 第11章 推荐模型评估与选择/194 11.1 经验误差与泛化误差/194 11.2 评估方法/194 11.2.1 留出法/195 11.2.2 交叉验证法/195 11.2.3 自助法/196 11.2.4 调参与终模型/196 11.3 性能度量/197 11.3.1 错误率与精度/198 11.3.2 精确率、召回率/198 11.3.3 ROC曲线与AUC/198 11.3.4 为什么推荐场景用AUC来评价模型/200 11.3.5 代价敏感错误率与代价曲线/201 11.3.6 从极大似然到对数损失和交叉熵损失函数/202 11.4 比较检验/202 11.4.1 假设检验/203 11.4.2 交叉验证t检验/203 11.4.3 McNemar检验/204 11.4.4 Friedman检验与后续检验/204 11.5 偏差与方差/205 11.6 准确率/205 11.7 分类实例/206 11.8 模型评估实例/207 第5部分 推荐系统实战篇 第12章 搭建一个简易版的生产环境推荐系统/211 12.1 推荐系统的作用/211 12.2 依赖准备/212 12.3 构建矩阵/213 第13章 新闻资讯推荐系统开发/218 13.1 基于Python的数据爬取/218 13.2 基于协同过滤的用户推荐算法/220 13.2.1 ItemCF算法/220 13.2.2 UserCF算法/223 13.2.3 Apriori算法/226 13.2.4 FpGrowth算法/232 13.3 基于协同过滤的用户推荐算法优化/236 13.4 推荐系统的用户行为产生模块设计/237 第14章 电影推荐系统开发/239 14.1 MovieLens数据集/239 14.2 TensorFlow构建神经网络/239 14.3 构建计算图并训练/242 14.4 Django框架展示/243 第15章 基于hbase+spark的广告精准投放及推荐系统开发/245 15.1 模拟广告投放模块/245 15.2 矩阵处理/247 15.3 使用kafka produce和consumer对接spark streaming/247 15.4 使用hbase提取保存标签/249 第16章 基于推荐功能的搜索引擎开发/252 16.1 数据爬取模块/252 16.2 Mongodb以及redis存储数据模块/256 16.3 基于相似度算法的推荐模块/259 16.4 Web框架设计/260 第17章 基于卷积神经网络提取特征构建推荐系统/261 17.1 卷积神经网络模型构建及提取文本特征/261 17.2 PMF模型构建并且融合PMF进行推荐/266
|
内容简介 |
《推荐系统实战宝典》主要围绕推荐系统进行讲解,全面介绍了掌握推荐系统技术所需要学习的算法及步骤。书中描述了基于点击率评估、RBM的推荐,基于标签的推荐,基于用户行为、内容、模型、流行度、邻域、图的推荐,以及基于上下文的推荐,还有使用自然语言处理或者矩阵分解的推荐,包括算法原理的介绍,对于每一种推荐方式也做了细粒度的分析及场景化的应用。还分享了作者在实际应用中的解决方案及扩展思路。除此之外,本书还会涉及一些基础算法及数学知识,并且包括对于推荐算法的一些模型评估以及校验的描述。阅读本书可以帮助读者学习基础算法和推荐算法的原理及实际应用,同时还能学习到推荐系统开发的设计思想、设计模式、开发流程等。这些对于读者全面提高自己的推荐系统开发水平有很大的帮助。 《推荐系统实战宝典》为读者提供了全部案例源代码下载和超过1100分钟的高清学习视频,读者可直接扫描二维码观看。 《推荐系统实战宝典》适合从事推荐系统相关领域研发的人员、高年级本科生或研究生、热衷于推荐系统开发的读者阅读。
|