基本信息
书名: |
Alink指南(基于Flink的机器学入门Java) |
作者: |
杨旭 |
出版社: |
电子工业出版社 |
出版日期: |
2021-10-01 |
版次: |
1 |
ISBN: |
9787121420580 |
市场价: |
149.0 |
目录
第1章 Alink快速上手
1.1 Alink是什么
1.2 免费下载、安装
1.3 Alink能
1.3.1 丰富的算法库
1.3.2 多样的使用体验
1.3.3 与SparkML的对比
1.4 关于数据和代码
1.5 简单示例
1.5.1 数据的读/写与显示
1.5.2 批式训练和批式预测
1.5.3 流式处理和流式预测
1.5.4 定义Pipeline,简化r/> 1.5.5 嵌入预测服务系统
第2章 系统概况与核心概念
2.1 基本概念
2.2 批式任务与流式任务
2.3 Alink=A+link
2.3.1 BatchOperator和StreamOperator
2.3.2 link方式是批式算法/流式算法的通用使用方式
2.3.3 link的简化
2.3.4 组件的主输出与侧输出
2.4 Pipeline与PipelineModel
2.4.1 概念和定义
2.4.2 深入介绍
2.5 触发Alink任务的执行
2.6 模型信息显示
2.7 文件系统与数据库
2.8 Schema String
第3章 文件系统与数据文件
3.1 文件系统简介
3.1.1 本地文件系统
3.1.2 Hadoop文件系统
3.1.3 阿里云OSS文件系统
3.2 数据文件的读入与导出
3.2.1 CSV格式
3.2.2 TSV、LibSVM、Text格式
3.2.3 AK格式
第4章 数据库与数据表
4.1 简介
4.1.1 Catalog的基本r/> 4.1.2 Source和Sink组件
4.2 Hive示例
4.3 Derby示例
4.4 MySQL示例
第5章 支持Flink SQL
5.1 基本r/> 5.1.1 注册
……
第6章 用户定义函数(UDF/UDTF)
第7章 基本数据处理
第8章 线二分类模型
第9章 朴素贝叶斯模型与决策树模型
第10章 特征的转化
第11章 构造新特征
第12章 从二分类到多分类
第13章 常用多分类算法
第14章 在线学r/>第15章 回归的由来
第16章 常用回归算法
第17章 常用聚类算法
第18章 批式与流式聚类
第19章 主成分分析
第20章 超参数搜索
第21章 文本分析
第22章 单词向量化
第23章 情感分析
第24章 系统
内容介绍
Alink是开源的机器学台,提供了丰富、的算法及简便的使用方式,可帮助用户快速构建业务应用。Alink适合工业级的实际应用,支持在个人计算机上快行原型研发,支持分布式计算处理海量的数据,支持流式数据的场景,同时机器学与模型可以方便地嵌入用户的应用系统或预测服务中。
本书是根据机器学识点由浅入深来逐层讲述的,这样可降低阅读的门槛,让读者能对所学的内容有一个清晰的印象,并可熟练地运用到实践中。本书介绍算法的使用,每节结合实际的数据和典型的场景,通过Alink算法组件形成完整的解决方案,可帮助读者理解各类算法所擅长处理的问题,同时本书的方案还可以被推广、应用到类似的场景中。
本书适合机器学的初学者及中级用户快速入门,也可供数据分析师、算法工程师等专业人员参考阅读。
在线试读
媒体评论