Sarsa是onpolicy,而Qlearning是offpolicy;Qlearning在算法更新时,对应的下一个动作并没有执行,而sarsa的下一个动作在这次更新时已经确定了

  尔雅 智慧树 mooc


+
账户
更新
搜索
帮助
主页