3 结论
强化学习是智能无人系统实现对复杂及不确定环境具备良好适应性的有效手段,也是智能无人系统决策管理的核心技术之一。由于智能无人系统经常用于执行探测任务,以探测决策为例对强化学习辅助决策的过程进行了描述,应用强化学习后探测决策的智能化程度大幅提高。综上所述,强化学习的实质是智能无人系统从环境到动作映射的学习,以使奖励函数值最大。强化学习算法通过与所处环境不断进行自主交互来得到策略,将强化学习的决策能力与智能无人系统的感知能力相结合,通过端对端的学习方式,能够实现从输入到输出的直接控制。但是强化学习的这种特性必然会使智能无人系统的学习时间增长,如何提高强化学习的速度是一个重要问题。未来,智能无人系统依赖强大的决策支持,强化学习技术将在智能无人系统决策管理中发挥不可替代的作用。
参考文献(References)
[1] 严浙平,杨泽文,王璐,等.马尔科夫理论在无人系统中的研究现状[J].中国舰船研究,2018,13(6):9-18.
YAN Z P,YANG Z W,WANG L,et al. Research status of Markov theory in unmanned systems[J]. Chinese Journal of Ship Research,2018,13(6):9-18. (in Chinese)
[2] 张涛,李清,张长水,等.智能无人自主系统的发展趋势[J].无人系统技术,2018(1):11-22.
ZHANG T,LI Q,ZHANG C S,et al. Current trends in the development of intelligent unmanned autonomous systems[J]. Unmanned Systems Technology, 2018(1):11-22. (in Chinese)
[3] 宋庆庆,卫浩,李健,等.美军自主无人系统关键技术现状及发展趋势[J].装备制造技术,2018(11):126-128.

以上内容为高博特编辑选取的行业技术,尊重原创,如有侵权请联系删除。