Hexo

  • 首页

  • 归档

强化学习标签

强化学习(五)actor-critic

03-23

强化学习(四)策略梯度

03-22

强化学习(三)DQN

03-22

强化学习(二)SARSA和Q-learning

03-06

强化学习(一)动态规划、蒙特卡洛方法和时序差分

03-04

huangshh

72 日志
19 标签
© 2020 huangshh
由 Hexo 强力驱动 v3.9.0
|
主题 – NexT.Gemini v7.3.0