第 1章 机器人学基础 1
1.1 简介 1
1.2 机器人学的历史 2
1.3 人工智能 3
1.3.1 自然语言处理简介 4
1.3.2 计算机视觉简介 5
1.3.3 机器人的类型 5
1.3.4 机器人的硬件和软件 6
1.4 机器人定位 8
1.4.1 练习1:计算机器人的位置 10
1.4.2 如何进行机器人开发 12
1.4.3 练习2:使用Python计算轮子走过的距离 12
1.4.4 练习3:使用Python计算机器人的最终位置 13
1.4.5 项目1:使用Python和测距法进行机器人定位 15
1.5 小结 16
第 2章 计算机视觉 17
2.1 简介 17
2.2 计算机视觉基本算法 18
2.2.1 图像相关术语 18
2.2.2 OpenCV 19
2.2.3 阈值化 19
2.2.4 练习4:对图像应用各种阈值化操作 21
2.2.5 形态学变换 25
2.2.6 练习5:对图像应用形态学变换 27
2.2.7 模糊(平滑) 31
2.2.8 练习6:对图像应用模糊方法 32
2.2.9 练习7:加载图像并应用所学的各种方法 34
2.3 机器学习简介 38
2.3.1 决策树和提升方法 38
2.3.2 练习8:使用决策树、随机森林和AdaBoost进行数字
预测 41
2.3.3 人工神经网络 47
2.3.4 练习9:构建第 一个神经网络 51
2.3.5 项目2:对Fashion-MNIST数据集中的10种衣物进行分类 54
2.4 小结 56
第3章 自然语言处理 57
3.1 简介 57
3.1.1 自然语言处理 58
3.1.2 自然语言处理的两个部分 59
3.1.3 NLP的各层次 60
3.2 Python中的NLP 61
3.2.1 自然语言工具包(NLTK) 61
3.2.2 练习10:NLTK入门 62
3.2.3 spaCy 65
3.2.4 练习11:spaCy入门 67
3.3 主题建模 70
3.3.1 词频-逆文档频率(TF-IDF) 70
3.3.2 潜在语义分析(LSA) 71
3.3.3 练习12:使用Python进行主题建模 72
3.3.4 项目3:处理一个语料库 75
3.4 语言建模 76
3.4.1 语言模型简介 76
3.4.2 二元模型 77
3.4.3 N元模型 77
3.4.4 计算概率 78
3.4.5 练习13:创建一个二元模型 80
3.5 小结 83
第4章 NLP神经网络 84
4.1 简介 84
4.2 循环神经网络 86
4.2.1 循环神经网络(RNN)简介 87
4.2.2 循环神经网络原理 87
4.2.3 RNN架构 89
4.2.4 长距离依赖问题 89
4.2.5 练习14:使用RNN预测房价 90
4.2.6 长短期记忆网络 93
4.2.7 练习15:预测数学函数的下一个解 94
4.3 神经语言模型 100
4.3.1 神经语言模型简介 100
4.3.2 RNN语言模型 102
4.3.3 练习16:对一个小语料库进行编码 103
4.3.4 RNN的输入维度 107
4.3.5 项目4:预测字符序列中的下一个字符 109
4.4 小结 111
第5章 计算机视觉中的卷积神经网络 112
5.1 简介 112
5.2 CNN基础 113
5.3 构建第 一个CNN 118
练习17:构建一个CNN 119
5.4 改进模型的方法:数据增强 124
5.4.1 练习18:利用数据增强改进模型 125
5.4.2 项目5:使用数据增强来正确对花朵图像进行分类 134
5.5 最先进的模型:迁移学习 137
练习19:基于迁移学习对钞票进行分类 139
5.6 小结 144
第6章 机器人操作系统(ROS) 146
6.1 简介 146
6.2 ROS基本概念 147
6.3 ROS基本命令 148
6.4 安装和配置 149
6.5 Catkin工作空间和软件包 149
6.6 发布者和订阅者 150
6.6.1 练习20:编写简单的发布者和订阅者 151
6.6.2 练习21:编写较复杂的发布者和订阅者 154
6.7 模拟器 159
6.7.1 练习22:Turtlebot配置 159
6.7.2 练习23:模拟器和传感器 161
6.7.3 项目6:模拟器和传感器 163
6.8 小结 164
第7章 构建基于文本的对话系统(聊天机器人) 165
7.1 简介 165 7.2 向量空间中的词表示 166 7.2.1 词嵌入 166 7.2.2 余弦相似度 167 7.2.3 Word2Vec 168 7.2.4 Word2Vec的问题 169 7.2.5 Gensim 169 7.2.6 练习24:创建词嵌入 169 7.2.7 全局向量(GloVe) 173 7.2.8 练习25:使用预训练的GloVe模型观察词语在平面上的分布 174 7.3 对话系统 179 7.3.1 聊天机器人的开发工具 180 7.3.2 对话代理的类型 180 7.3.3 创建基于文本的对话系统 182 7.3.4 练习26:创建第 一个对话代理 184 7.3.5 项目7:创建一个用来控制机器人的对话代理 189 7.4 小结 191 第8章 利用基于CNN的物体识别来指导机器人 193 8.1 简介 193 8.2 多物体识别和检测 194 8.2.1 练习27:构建第 一个多物体检测和识别系统 195 8.2.2 ImageAI 200 8.3 视频中的多物体识别和检测 202 项目8:视频中的多物体检测和识别 206 8.4 小结 206 第9章 机器人的计算机视觉 208 9.1 简介 208 9.2 Darknet 209 Darknet基础安装 209 9.3 YOLO 210 9.3.1 使用YOLO进行预测 211 9.3.2 在摄像头上使用YOLO 215 9.3.3 练习28:YOLO编程 215 9.3.4 练习29:在ROS中集成YOLO 219 9.3.5 项目9:机器人保安 223 9.4 小结 224 附录 本书项目概览 225
......
机器人是人工智能时代的重要产物,为人类的工作和生活提供了非常多的助力。对于智能机器人而言,视觉识别能力和对话能力是非常重要的两个方面,本书就是基于这两个技术展开介绍,并通过一系列的编程案例和实践项目,引导读者高效掌握机器人的开发技巧。
本书基于Python语言进行讲解,结合机器人操作系统(ROS)平台给出了丰富多样的机器人开发方案。本书立足于机器人的视觉和语言处理,通过OpenCV、自然语言处理、循环神经网络、卷积神经网络等技术提高机器人的视觉识别能力和对话能力。全书包括多个练习和项目,通过知识点和编程实践相结合的方式,快速带领读者掌握实用的机器人开发技术。
本书适合机器人或智能软硬件研发领域的工程师阅读,也适合高校人工智能相关专业的师生阅读。