强化学习入门(建立强化学习的完整框架)[1.49GB]百度网盘下载

强化学习入门(建立强化学习的完整框架)[1.49GB]百度网盘下载

资源为强化学习入门(建立强化学习的完整框架)[1.49GB]百度网盘下载,包含了49节视频课程,附带课件,无需下载即可在线播放。

强化学习入门(建立强化学习的完整框架)[1.49GB]百度网盘下载

强化学习是机器学习的一个重要分支,是多学科多领域交叉的一个产物,它的本质是自动进行决策,并且可以做连续决策。很多人对机器学习有一定的了解后,想用强化学习的方法进一步研究机器学习,但却无从下手。

本课程在具有简单的机器学习的知识基础上,帮同学们梳理强化学习的脉络,引入深度强化学习的前沿问题,通过几个经典和前沿的案例,让大家理解强化学习的主要应用与挑战,初步掌握强化学习的概念和基本工具,并可以应用这些知识阅读最新的学术文献,从而了解最新的机器学习知识。

资源目录

第 1 讲强化学习基础(上)

1.1机器学习的类型 时长 09:58

1.2监督学习的“智能”VS强化学习的“智能” 时长 08:09

1.3强化学习的各个领域中的应用(一) 时长 12:32

1.4强化学习的各个领域中的应用(二) 时长 08:08

1.5强化学习的各个领域中的应用(三) 时长 10:09

1.6强化学习框架、强化学习四元组 时长 12:19

1.7奖励、状态、行为(一) 时长 06:48

1.8奖励、状态、行为(二) 时长 10:57

1.9从行为到策略 时长 12:51

1.10摇臂赌博机 时长 13:06

1.11Thomason Sampling..Being Conservative 时长 09:33

1.12Upper Confidence Bound ..Being Optimist 时长 07:57

1.13强化学习优化框架 时长 09:02

1.14如何设计值函数? 时长 12:48

1.15小结(一) 时长 07:58

1.16小结(二) 时长 08:11

1.17马尔科夫决策过程(一) 时长 11:42

1.18马尔科夫决策过程(二) 时长 13:19

1.19值函数的迭代算法 (一) 时长 11:59

1.20值函数的迭代算法(二) 时长 15:23

第 2 讲强化学习基础(下)

2.1Max贝曼优化方程(一) 时长 07:40

2.2Max贝曼优化方程(二) 时长 10:26

2.3动态优化框架 时长 08:55

2.4Car Rental Example 时长 11:00

2.5Grid World Example 时长 15:25

2.6贴现因子会对最优解产生什么影响? 时长 13:55

2.7贪婪收敛 时长 08:46

2.8蒙特卡洛抽样和算法 时长 15:34

2.9TD算法 时长 15:18

2.10比较TD和蒙特卡洛方法(一) 时长 10:03

2.11比较TD和蒙特卡洛方法(二) 时长 11:35

2.12N-step TD 算法 时长 09:07

2.13策略估计方法总结(一) 时长 08:57

2.14策略估计方法总结(二) 时长 13:48

2.15Sarsa算法(一) 时长 09:42

2.16Sarsa算法(二) 时长 06:48

2.17Q-learning算法 时长 08:23

2.18表格方法 时长 12:09

第 3 讲强化学习的近似算法

3.1值函数近似 时长 11:04

3.2值函数近似算法的局限性 时长 15:14

3.3策略近似算法 时长 08:32

3.4策略梯度算法 时长 08:46

3.5Reinforce算法 时长 09:49

3.6Actor-Critic 算法(一) 时长 09:43

3.7Actor-Critic 算法(二) 时长 11:39

3.8加入世界模型 时长 09:45

3.9加入世界模型的好处 时长 11:15

3.10Monte Carlo Tree Search 时长 09:45

第 4 讲深度强化学习实战

4.1深度强化学习实战 时长 13:30

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源