• 最后更新 2024-05-01
  • 销量/好评 2 + 评论
  • 交易规则(重要)

【官方旗舰店】用Python动手学强化学习 全彩印刷 人工智能机器深度学习python从入门到实战编程入门零基础自学计算机网络编程书籍
本站优惠价
44.90
5.0折 原价:¥89.8
  • 销量
  • 卖家
  • 4+
  • 人民邮电出版社官方旗舰店

服务由"人民邮电出版社官方旗舰店"发货,并提供售后服务。

    担保交易,安全保证,有问题不解决可申请退款。购买前请询问清楚卖家,以卖家承诺为准! 自动发货商品,随时可以购买,付款后在订单详情下载,零等待。 不同会员等级尊享不同购买折扣。
天猫优惠券

天猫优惠券

已缴纳保证金

该商家已加入保障计划

【官方旗舰店】用Python动手学强化学习 全彩印刷 人工智能机器深度学习python从入门到实战编程入门零基础自学计算机网络编程书籍

【官方旗舰店】用Python动手学强化学习 全彩印刷 人工智能机器深度学习python从入门到实战编程入门零基础自学计算机网络编程书籍

【官方旗舰店】用Python动手学强化学习 全彩印刷 人工智能机器深度学习python从入门到实战编程入门零基础自学计算机网络编程书籍

【官方旗舰店】用Python动手学强化学习 全彩印刷 人工智能机器深度学习python从入门到实战编程入门零基础自学计算机网络编程书籍

【官方旗舰店】用Python动手学强化学习 全彩印刷 人工智能机器深度学习python从入门到实战编程入门零基础自学计算机网络编程书籍

【官方旗舰店】用Python动手学强化学习 全彩印刷 人工智能机器深度学习python从入门到实战编程入门零基础自学计算机网络编程书籍

【官方旗舰店】用Python动手学强化学习 全彩印刷 人工智能机器深度学习python从入门到实战编程入门零基础自学计算机网络编程书籍
目录
第 1章 了解强化学习 1
1.1 强化学习与各关键词之间的关系 1
1.2 强化学习的优点和弱点 8
1.3 强化学习的问题设定:马尔可夫决策过程 9

第 2章 强化学习的解法(1):根据环境制订计划 21
2.1 价值的定义和计算:贝尔曼方程 22
2.2 基于动态规划法的价值近似的学习:价值迭代 28
2.3 基于动态规划法的策略的学习:策略迭代 32
2.4 基于模型的方法和无模型的方法的区别 36

第3章 强化学习的解法(2):根据经验制订计划 39
3.1 平衡经验的积累与利用:Epsilon-Greedy 算法 41
3.2 是根据实际奖励还是预测来修正计划:蒙特卡洛方法和时序差分学习 46
3.3 用经验来更新价值近似还是策略:基于价值和基于策略 62

第4章 使用面向强化学习的神经网络 73
4.1 将神经网络应用于强化学习 74
4.2 通过含有参数的函数实现价值近似:价值函数近似 100
4.3 将深度学习应用于价值近似:DQN 109
4.4 通过含有参数的函数实现策略:策略梯度 121
4.5 将深度学习应用于策略:A2C 133
4.6 是价值近似还是策略呢 153

第5章 强化学习的弱点 157
5.1 获取样本的效率低 157
5.2 容易陷入局部*优行动和过拟合160
5.3 复现性差 163
5.4 以弱点为前提的对策 164

第6章 克服强化学习弱点的方法 169
6.1 应对采样效率低的方法:与基于模型的方法一起使用、表征学习 170
6.2 改善复现性的方法:进化策略 198
6.3 应对局部*优行动和过拟合的方法:模仿学习和逆强化学习 206

第7章 强化学习的应用领域 237
7.1 行动的*优化 239
7.2 学习的*优化 248
参考文献 252
作者介绍
[日]久保隆宏(作者) 任职于日本大型系统集成商TIS,具有丰富的机器学习研究和开发经验。论文共享网站站arXivTimes运营者,积**致力于技术普及,著有《TensorFlow应用指南》(合著)。 梁垿(译者) 硕士毕业于日本早稻田大学,研究方向为机器学习。目前在日本大型系统集成商TIS任自然语言处理工程师。热爱长跑与读书,喜欢科幻、蒸汽朋克、克苏鲁等题材的作品。 程引(译者) 工学博士学位,毕业于上海交通大学。目前在日本BizReach公司(Visional Group)AI部门任算法工程师。业务方向为推荐系统与自然语言处理,研究兴趣包括强化学习与自动控制。

  • 商品评价
  • 匿名
  • 好书!太快了!这可是春节啊!
  • 2023-08-09
好评
  • 匿名
  • 好书,很好看,质量很好,很厚实,很喜欢,喜欢的朋友可以放心购买。
  • 2023-08-09
好评
  • 交易规则


  • 发货方式


  • 自动:在特色服务中标有自动发货的商品,拍下后,源码类 软件类 商品会在订单详情页显示来自卖家的商品下载链接,点卡类 商品会在订单详情直接显示卡号密码。

    手动:未标有自动发货的的商品,付款后,商品卖家会收到平台的手机短信、邮件提醒,卖家会尽快为您发货,如卖家长时间未发货,买家也可通过订单上的QQ或电话主动联系卖家。


  • 退款说明


  • 1、源码类:商品详情(含标题)与实际源码不一致的(例:描述PHP实际为ASP、描述的功能实际缺少、功能不能正常使用等)!有演示站时,与实际源码不一致的(但描述中有"不保证完全一样、可能有少许偏差"类似显著公告的除外);

  • 2、营销推广:未达到卖家描述标准的;

    3、点卡软件所售点卡软件无法使用的;

  • 3、发货:手动发货商品,在卖家未发货前就申请了退款的;

    4、服务:卖家不提供承诺的售后服务的;(双方提前有商定和描述中有显著声明的除外)

    5、其他:如商品或服务有质量方面的硬性常规问题的。未符合详情及卖家承诺的。

  • 注:符合上述任一情况的,均支持退款,但卖家予以积极解决问题则除外。交易中的商品,卖家无法修改描述!


  • 注意事项


  • 1、在付款前,双方在QQ上所商定的内容,也是纠纷评判依据(商定与商品描述冲突时,以商定为准);

    2、源码商品,同时有网站演示与商品详情图片演示,且网站演示与商品详情图片演示不一致的,默认按商品详情图片演示作为纠纷评判依据(卖家有特别声明或有额外商定的除外);

  • 3、点卡软件商品,默认按商品详情作为纠纷评判依据(特别声明或有商定除外);

  • 4、营销推广商品,默认按商品详情作为纠纷评判依据(特别声明或有商定除外);

    5、在有"正当退款原因和依据"的前提下,写有"一旦售出,概不支持退款"等类似的声明,视为无效声明;

    6、虽然交易产生纠纷的几率很小,卖家也肯定会给买家最完善的服务!但请买卖双方尽量保留如聊天记录这样的重要信息,以防产生纠纷时便于送码网快速介入处理。


  • 送码声明


  • 1、送码网作为第三方中介平台,依据双方交易合同(商品描述、交易前商定的内容)来保障交易的安全及买卖双方的权益;

  • 2、非平台线上交易的项目,出现任何后果均与送码网无关;无论卖家以何理由要求线下交易的(如:要求买家支付宝转账付款的,微信转账付款的等),请联系管理举报,本平台将清退卖家处理。


热门推荐
浏览记录