AQ学习的QTable依然存在高维度灾难问题,无法使Q值连续化Baction依然是从最大的Q值中选取,无法用于action连续的问题C只能处理只需短时记忆问题,无法处理需长时记忆问题D卷积神经网络(CNN)不一定收敛,需精良调参

  尔雅 智慧树 mooc


+
账户
更新
搜索
帮助
主页