Joy RL:强化学习实践教程在线阅读
会员

Joy RL:强化学习实践教程

江季 王琦 杨毅远
开会员,本书免费读 >

计算机网络人工智能7.8万字

更新时间:2025-05-19 16:15:54 最新章节:第12章

立即阅读
加书架
下载
听书

书籍简介

本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

江季 王琦 杨毅远
主页

最新上架

  • 会员
    本书分为3个部分:第1章和第2章是人工智能的数学基础,主要介绍了机器学习的概念、Python开发环境的搭建、机器学习bibei的数学知识,以及线性代数和概率论的相关知识;第3~12章主要介绍了回归模型、分类模型、聚类模型、半监督模型的建立和相关算法的理论,以及如何使用sklearn具体实现相关算法模型的搭建;第13章介绍了Spark机器学习,笔者认为对于机器学习,不能只限于Python中的skle
    刘润森计算机0字
  • 会员
    本书以DeepSeek应用为基础,讲解了DeepSeek在自媒体、咨询、营销、教育、翻译、职场、编程等多个领域的应用。书中通过丰富的案例和详细的指导,展示了DeepSeek如何帮助自媒体人打造“爆款”内容,如何为咨询提供高效决策支持,如何在营销中实现流量裂变,如何重塑未来学习范式,以及如何助力职场人和企业实现业务增效等。本书内容通俗易懂,案例丰富,无论是AI(ArtificialIntellig
    李艮基 曹方咏峥 肖灵儿编著计算机8.2万字
  • 会员
    本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。
    (美)塞巴斯蒂安·拉施卡计算机13.8万字
  • 如今,以DeepSeek为代表的AI工具迅速崛起,深刻地改变了人类获取与处理信息的方式。但在应用DeepSeek的过程中,很多人发现,向DeepSeek提出问题后,得到的回复往往不尽如人意,或是过于宽泛、缺乏针对性,或是未能切中要点、不能解决实际问题。导致这一问题的根本原因是,提问者缺乏有效的提问技巧,无法精准引导AI发挥强大的运算与分析能力。《DeepSeek高效提问指南》正是针对这一痛点,构建
    马超编著计算机11.4万字
  • 会员
    本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章,分为五部分。第一部分(第1章)介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景,并深入探讨了AI对法律行业带来的影响等。第二部分(第2~6章)针对法律人的主要工作任务,包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等,详细讲解了应该如何使用AI来提升工作效率。第三部分(第7
    张萌 李小武 兰洋 陈中泽等计算机23.8万字
  • 会员
    本书综合运用定性研究和定量研究方法,对体育服务业与人工智能的融合进行深入研究。本书首先是运用耦合协调模型和灰色关联分析法对目前我国体育服务业与人工智能融合的现状进行定量研究,探索二者之间目前处于什么融合发展阶段;其次,对体育服务业与人工智能的融合机理进行了研究,在此基础上,以体育服务业的4个细分行业为例,进行了体育服务业与人工智能融合的具体研究;接着,运用模糊AHP-TOPSIS研究方法对体育服务
    卿平计算机15万字
  • 这是一本探讨人工智能与生物技术的融合颠覆传统医疗,并会对未来药物研发产生重大影响的书。作者凭借其在生物科学方面的专业背景,以及在生物技术和制药行业的从业经验,为读者呈现了对于医疗科技这一前沿领域的深刻见解。书中首先概述了数据科学方法的兴起以及生物学领域的范式转变,这一转变催生了计算生物学的革命,即通过计算机模拟进行生物实验和药物研发。作者详细介绍了人工智能和深度学习领域的重大突破,并探讨了这些技术
    (美)布赖恩·希尔布什计算机18.6万字
  • 2022年末,ChatGPT在全球的风靡,让大模型随之出圈。大模型带来的机遇是人类突破能力边界最大的一次飞跃。未来基于人工智能或将实现“想象即现实,所想即所得”,这将是一次巨大的飞跃。中国、美国以及欧洲各国纷纷出台相关政策,将推动人工智能发展、大模型迭代作为重要的创新引擎。了解、应用大模型,既是时代的要求,也是产业发展的必需。但是在实践中也发现,大家对大模型的了解并不深刻,甚至时常被技术名词“劝退
    沈抖计算机16.8万字
  • 会员
    大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、
    腾讯游戏数据团队编著计算机15.6万字