基于强化学习的双臂空间机器人应急姿态控制
收藏资源简介
针对双臂空间在轨服务机器人在遭遇极端异常情况下飞轮、发动机故障等传统姿态控制失效问题,提出了一种基于强化学习的双臂空间机器人应急姿态控制算法。与传统姿态控制算法相比,本文仅通过飞行器所配置的两条机械臂进行有限的飞行器姿态恢复。通过搭建算法训练的物理环境,应用无模型的近端策略优化(Proximal policy optimization,PPO)算法进行姿态控制,结合在轨操作中机械臂运动学约束,设计奖励函数优化飞行器姿态控制精度。为验证上述策略有效性,在MuJoCo仿真环境中进行星体姿态恢复数值仿真,并针对不同星体质量、不同末端负载质量等工况进行算法适应性评估,结果表明该强化学习方法能满足飞行器进行有限姿态控制的需求,无需参数调节且具有一定鲁棒性。
资料为PDF文档格式.
本文档关键词:机器人,姿态,应急,强化,空间