| | 【当当网】动手学深度学习(PyTorch版)李沐和亚马逊科学家阿斯顿·张等大咖作者 机器学习深度学习领域重磅教程 交互式实战环境 | RMB:69.8069.80BUY | | | | 【当当网】华为数字化转型与数据治理套装共2册 华为数字化转型之道+华为数据之道 华为官方出品 数据资源化 数据治理 数据资产化 | RMB:109.00152.60BUY | | | | 当当网 中文版Photoshop 2022从入门到精通 微课视频全彩版入门书籍 PS教程教材 摄影后期 图片后期 调色 平面设计 海报设计技巧 | RMB:49.9072.85BUY | | | 【当当网】Python编程三剑客新版:Python编程从入门到实践第2版+Python编程快速上手+Python极客项目编程 当当套装共3册 正版书籍 | RMB:149.80149.80BUY | | | | 当当网 鸟哥的Linux私房菜 基础学习篇第四版 linux操作系统教程从入门到精通书 鸟叔第4版计算机数据库编程shell技巧内核命令教程 | RMB:59.0059.00BUY | | | | 【当当网】浪潮之巅 第四4版数学之美文明之光大学之路见识态度全球科技通史吴军作品 深度剖析信息产业 智能时代指南 正版书籍 | RMB:69.50100.08BUY | | | 【当当网 正版包邮】C Primer Plus 第六6版中文版 C语言入门自学书籍 C语言程序设计 编程从入门到精通 软件开发书籍 | RMB:54.0054.00BUY | | | | 【当当网 正版书籍】C++ Primer Plus中文版第六6版 C++程序设计从入门到精通 零基础自学C++编程语言教程计算机程序设计 | RMB:59.0059.00BUY | | | | 当当网 小学生C++趣味编程 程序设计 清华大学出版社 正版书籍 | RMB:39.9043.65BUY | | | |
基本信息
商品名称: | 动手学深度学习(PyTorch版) | 开本: | 128开 |
作者: | 阿斯顿·张(Aston Zhang) | 定价: | 109.80 |
ISBN号: | 9787115600820 | 出版时间: | 2023-02-01 |
出版社: | 人民邮电出版社 | 印刷时间: | 2023-02-01 |
版次: | 1 | 印次: | 1 |
对本书的赞誉
前言
译者简介
学习环境配置
资源与支持
主要符号表
第 1章 引言 1
1.1 日常生活中的机器学习 2
1.2 机器学习中的关键组件 3
1.2.1 数据 3
1.2.2 模型 4
1.2.3 目标函数 4
1.2.4 优化算法 5
1.3 各种机器学习问题 5
1.3.1 监督学习 5
1.3.2 无监督学习 11
1.3.3 与环境互动 11
1.3.4 强化学习 12
1.4 起源 13
1.5 深度学习的发展 15
1.6 深度学习的成功案例 16
1.7 特点 17
第 2章 预备知识 20
2.1 数据操作 20
2.1.1 入门 21
2.1.2 运算符 22
2.1.3 广播机制 23
2.1.4 索引和切片 24
2.1.5 节省内存 24
2.1.6 转换为其他Python对象 25
2.2 数据预处理 26
2.2.1 读取数据集 26
2.2.2 处理缺失值 26
2.2.3 转换为张量格式 27
2.3 线性代数 27
2.3.1 标量 28
2.3.2 向量 28
2.3.3 矩阵 29
2.3.4 张量 30
2.3.5 张量算法的基本性质 31
2.3.6 降维 32
2.3.7 点积 33
2.3.8 矩阵-向量积 33
2.3.9 矩阵-矩阵乘法 34
2.3.10 范数 35
2.3.11 关于线性代数的更多信息 36
2.4 微积分 37
2.4.1 导数和微分 37
2.4.2 偏导数 40
2.4.3 梯度 41
2.4.4 链式法则 41
2.5 自动微分 42
2.5.1 一个简单的例子 42
2.5.2 非标量变量的反向传播 43
2.5.3 分离计算 43
2.5.4 Python控制流的梯度计算 44
2.6 概率 44
2.6.1 基本概率论 45
2.6.2 处理多个随机变量 48
2.6.3 期望和方差 50
2.7 查阅文档 51
2.7.1 查找模块中的所有函数和类 51
2.7.2 查找特定函数和类的用法 52
第3章 线性神经网络 54
3.1 线性回归 54
3.1.1 线性回归的基本元素 54
3.1.2 向量化加速 57
3.1.3 正态分布与平方损失 58
3.1.4 从线性回归到深度网络 60
3.2 线性回归的从零开始实现 61
3.2.1 生成数据集 62
3.2.2 读取数据集 63
3.2.3 初始化模型参数 63
3.2.4 定义模型 64
3.2.5 定义损失函数 64
3.2.6 定义优化算法 64
3.2.7 训练 64
3.3 线性回归的简洁实现 66
3.3.1 生成数据集 66
3.3.2 读取数据集 66
3.3.3 定义模型 67
3.3.4 初始化模型参数 67
3.3.5 定义损失函数 68
3.3.6 定义优化算法 68
3.3.7 训练 68
3.4 softmax回归 69
3.4.1 分类问题 69
3.4.2 网络架构 70
3.4.3 全连接层的参数开销 70
3.4.4 softmax运算 71
3.4.5 小批量样本的向量化 71
3.4.6 损失函数 72
3.4.7 信息论基础 73
3.4.8 模型预测和评估 74
3.5 图像分类数据集 74
3.5.1 读取数据集 75
3.5.2 读取小批量 76
3.5.3 整合所有组件 76
3.6 softmax回归的从零开始实现 77
3.6.1 初始化模型参数 77
3.6.2 定义softmax操作 78
3.6.3 定义模型 78
3.6.4 定义损失函数 79
3.6.5 分类精度 79
3.6.6 训练 80
3.6.7 预测 82
3.7 softmax回归的简洁实现 83
3.7.1 初始化模型参数 83
3.7.2 重新审视softmax的实现 84
3.7.3 优化算法 84
3.7.4 训练 84
第4章 多层感知机 86
4.1 多层感知机 86
4.1.1 隐藏层 86
4.1.2 激活函数 88
4.2 多层感知机的从零开始实现 92
4.2.1 初始化模型参数 92
4.2.2 激活函数 93
4.2.3 模型 93
4.2.4 损失函数 93
4.2.5 训练 93
4.3 多层感知机的简洁实现 94
模型 94
4.4 模型选择、欠拟合和过拟合 95
4.4.1 训练误差和泛化误差 96
4.4.2 模型选择 97
4.4.3 欠拟合还是过拟合 98
4.4.4 多项式回归 99
4.5 权重衰减 103
4.5.1 范数与权重衰减 103
4.5.2 高维线性回归 104
4.5.3 从零开始实现 104
4.5.4 简洁实现 106
4.6 暂退法 108
4.6.1 重新审视过拟合 108
4.6.2 扰动的稳健性 108
4.6.3 实践中的暂退法 109
4.6.4 从零开始实现 110
4.6.5 简洁实现 111
4.7 前向传播、反向传播和计算图 112
4.7.1 前向传播 113
4.7.2 前向传播计算图 113
4.7.3 反向传播 114
4.7.4 训练神经网络 115
4.8 数值稳定性和模型初始化 115
4.8.1 梯度消失和梯度 116
4.8.2 参数初始化 117
4.9 环境和分布偏移 119
4.9.1 分布偏移的类型 120
4.9.2 分布偏移示例 121
4.9.3 分布偏移纠正 122
4.9.4 学习问题的分类法 125
4.9.5 机器学习中的公平、责任和透明度 126
4.10 实战Kaggle比赛:预测房价 127
4.10.1 下载和缓存数据集 127
4.10.2 Kaggle 128
4.10.3 访问和读取数据集 129
4.10.4 数据预处理 130
4.10.5 训练 131
4.10.6 K折交叉验证 132
4.10.7 模型选择 133
4.10.8 提交Kaggle预测 133
第5章 深度学习计算 136
5.1 层和块 136
5.1.1 自定义块 138
5.1.2 顺序块 139
5.1.3 在前向传播函数中执行代码 139
5.1.4 效率 140
5.2 参数管理 141
5.2.1 参数访问 141
5.2.2 参数初始化 143
5.2.3 参数绑定 145
5.3 延后初始化 145
实例化网络 146
5.4 自定义层 146
5.4.1 不带参数的层 146
5.4.2 带参数的层 147
5.5 读写文件 148
5.5.1 加载和保存张量 148
5.5.2 加1864189419
......1864189419
本书是《动手学深度学习》的重磅升级版本,选用经典的PyTorch深度学习框架,旨在向读者交付更为便捷的有关深度学习的交互式学习体验。
本书重新修订《动手学深度学习》的所有内容,并针对技术的发展,新增注意力机制、预训练等内容。本书包含15章,第一部分介绍深度学习的基础知识和预备知识,并由线性模型引出简单的神经网络——多层感知机;第二部分阐述深度学习计算的关键组件、卷积神经网络、循环神经网络、注意力机制等大多数现代深度学习应用背后的基本工具;第三部分讨论深度学习中常用的优化算法和影响深度学习计算性能的重要因素,并分别列举深度学习在计算机视觉和自然语言处理中的重要应用。
本书同时覆盖深度学习的方法和实践,主要面向在校大学生、技术人员和研究人员。阅读本书需要读者了解基本的Python编程知识及预备知识中描述的线性代数、微分和概率等基础知识。1864189419
......1864189419
作者简介:阿斯顿·张(Aston Zhang),亚马逊科学家,美国伊利诺伊大学香槟分校计算机科学博士,统计学和计算机科学双硕士。他专注于机器学习和自然语言处理的研究,荣获深度学习国际学术会议ICLR杰出论文奖、ACM UbiComp杰出论文奖以及ACM SenSys论文奖提名。他担任过EMNLP领域和AAAI程序委员。扎卡里·C. 立顿(Zachary C. Lipton),美国卡内基梅隆大学机器学习和运筹学助理教授,并在海因茨公共政策学院以及软件和社会系统系担任礼节性任命。他领导着近似正确机器智能(ACMI)实验室,研究涉及核心机器学习方法、其社会影响以及包括临床医学和自然语言处理在内的各种应用领域。他目前的研究重点包括处理各种因果结构下分布变化的稳健和自适应算法、超越预测为决策提供信息(包括应对已部署模型的战略响应)、医学诊断和预后预测、算法公平性和可解释性的基础。他是“Approximately Correct”博客的创始人,也是讽刺性漫画“Superheroes of Deep Learning”的合著者。李沐(Mu Li),亚马逊首席科学家(Senior Principal Scientist),美国加利福尼亚大学伯克利分校、斯坦福大学客座助理教授,美国卡内基梅隆大学计算机系博士。他曾任机器学习创业公司Marianas Labs的CTO和百度深度学习研究院的主任研发架构师。他专注于机器学习系统和机器学习算法的研究。他在理论与应用、机器学习与操作系统等多个领域的学术会议上发表过论文,被引用上万次。亚历山大·J. 斯莫拉(Alexander J. Smola),亚马逊副总裁/杰出科学家,德国柏林工业大学计算机科学博士。他曾在澳大利亚国立大学、美国加利福尼亚大学伯克利分校和卡内基梅隆大学任教。他发表过超过300篇学术论文,并著有5本书,其论文及书被引用超过15万次。他的研究兴趣包括深度学习、贝叶斯非参数、核方法、统计建模和可扩展算法。译者简介:何孝霆(Xiaoting He),亚马逊应用科学家,中国科学院软件工程硕士。他专注于对深度学习的研究,特别是自然语言处理的应用(包括语言模型、AIOps、OCR),相关工作落地于众多企业。他担任过ACL、EMNLP、NAACL、EACL等学术会议的程序委员或审稿人。瑞潮儿·胡(Rachel Hu),亚马逊应用科学家,美国加利福尼亚大学伯克利分校统计学硕士,加拿大滑铁卢大学数学学士。她致力于将机器学习应用于现实世界的产品。她也是亚马逊人工智能团队的讲师,教授自然语言处理、计算机视觉和机器学习商业应用等课程。她已向累计1000余名亚马逊工程师教授机器学习,其公开课程视频在YouTube和哔哩哔哩上广受好评。1864189419