Joy RL：强化学习实践教程最新章节全文无弹窗在线阅读-QQ阅读仙侠女生网

QQ阅读仙侠女生网

仙侠女生网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书是继《EasyRL：强化学习教程》（俗称“蘑菇书”）之后，为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验，涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容，旨在帮助读者快速入门强化学习的代码实践，并辅以一套开源代码框架“JoyRL”，便于读者适应业界应用研究风格的代码。与“蘑菇书”不同，本书对强化学习核心理论进行提炼，并串联知识点，重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。

品牌：人邮图书

上架时间：2025-04-01 00:00:00

出版社：人民邮电出版社

本书数字版权由人邮图书提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

江季王琦杨毅远

最新上架

会员
人工智能数学基础与Python机器学习实战
本书分为3个部分：第1章和第2章是人工智能的数学基础，主要介绍了机器学习的概念、Python开发环境的搭建、机器学习bibei的数学知识，以及线性代数和概率论的相关知识；第3~12章主要介绍了回归模型、分类模型、聚类模型、半监督模型的建立和相关算法的理论，以及如何使用sklearn具体实现相关算法模型的搭建；第13章介绍了Spark机器学习，笔者认为对于机器学习，不能只限于Python中的skle
刘润森计算机0字
会员
高效用DeepSeek：职场逆袭的实战指南
本书以DeepSeek应用为基础，讲解了DeepSeek在自媒体、咨询、营销、教育、翻译、职场、编程等多个领域的应用。书中通过丰富的案例和详细的指导，展示了DeepSeek如何帮助自媒体人打造“爆款”内容，如何为咨询提供高效决策支持，如何在营销中实现流量裂变，如何重塑未来学习范式，以及如何助力职场人和企业实现业务增效等。本书内容通俗易懂，案例丰富，无论是AI（ArtificialIntellig
李艮基曹方咏峥肖灵儿编著计算机8.2万字
会员
从零构建大模型
本书是关于如何从零开始构建大模型的指南，由畅销书作家塞巴斯蒂安·拉施卡撰写，通过清晰的文字、图表和实例，逐步指导读者创建自己的大模型。在本书中，读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练，以及定制特定任务的微调。此外，本书还将探讨如何利用人工反馈确保大模型遵循指令，以及如何将预训练权重加载到大模型中。
(美)塞巴斯蒂安·拉施卡计算机13.8万字
DeepSeek高效提问指南：提出好问题，才有好答案
如今，以DeepSeek为代表的AI工具迅速崛起，深刻地改变了人类获取与处理信息的方式。但在应用DeepSeek的过程中，很多人发现，向DeepSeek提出问题后，得到的回复往往不尽如人意，或是过于宽泛、缺乏针对性，或是未能切中要点、不能解决实际问题。导致这一问题的根本原因是，提问者缺乏有效的提问技巧，无法精准引导AI发挥强大的运算与分析能力。《DeepSeek高效提问指南》正是针对这一痛点，构建
马超编著计算机11.4万字
会员
法律人AI指南：大模型10倍提升工作效率的方法与技巧
本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章，分为五部分。第一部分（第1章）介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景，并深入探讨了AI对法律行业带来的影响等。第二部分（第2~6章）针对法律人的主要工作任务，包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等，详细讲解了应该如何使用AI来提升工作效率。第三部分（第7
张萌李小武兰洋陈中泽等计算机23.8万字
会员
新时代体育服务业与人工智能融合研究
本书综合运用定性研究和定量研究方法，对体育服务业与人工智能的融合进行深入研究。本书首先是运用耦合协调模型和灰色关联分析法对目前我国体育服务业与人工智能融合的现状进行定量研究，探索二者之间目前处于什么融合发展阶段；其次，对体育服务业与人工智能的融合机理进行了研究，在此基础上，以体育服务业的4个细分行业为例，进行了体育服务业与人工智能融合的具体研究；接着，运用模糊AHP-TOPSIS研究方法对体育服务
卿平计算机15万字
人工智能与计算生物的未来
这是一本探讨人工智能与生物技术的融合颠覆传统医疗，并会对未来药物研发产生重大影响的书。作者凭借其在生物科学方面的专业背景，以及在生物技术和制药行业的从业经验，为读者呈现了对于医疗科技这一前沿领域的深刻见解。书中首先概述了数据科学方法的兴起以及生物学领域的范式转变，这一转变催生了计算生物学的革命，即通过计算机模拟进行生物实验和药物研发。作者详细介绍了人工智能和深度学习领域的重大突破，并探讨了这些技术
(美)布赖恩·希尔布什计算机18.6万字
大模型浪潮：商业机遇、产业变革与未来趋势
2022年末，ChatGPT在全球的风靡，让大模型随之出圈。大模型带来的机遇是人类突破能力边界最大的一次飞跃。未来基于人工智能或将实现“想象即现实，所想即所得”，这将是一次巨大的飞跃。中国、美国以及欧洲各国纷纷出台相关政策，将推动人工智能发展、大模型迭代作为重要的创新引擎。了解、应用大模型，既是时代的要求，也是产业发展的必需。但是在实践中也发现，大家对大模型的了解并不深刻，甚至时常被技术名词“劝退
沈抖计算机16.8万字
会员
大模型工程化：AI驱动下的数据体系
大模型在众多领域得到了广泛应用，促进了AI技术的整合和创新。然而，在实际应用过程中，直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分，共16章。第1部分主要介绍大模型技术的发展与应用，从大模型的发展现状展开，重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施，涵盖湖仓一体引擎、湖仓的关键技术、
腾讯游戏数据团队编著计算机15.6万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 iwrite.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015