Reinforcement learning based compliance control for dual-arm variable payload manipulation
Loading...
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Un novedoso marco jerárquico para la manipulación doble-brazo con cargas variables es presentado, que integra control de impedancia basado en modelos y aprendizaje por refuerzo libre de modelos mediante compensación de torque en el espacio de tareas. Un elemento central del enfoque consiste en un ajuste automatizado de la simulación en Mu-JoCo, donde la optimización de parámetros de amortiguamiento, pérdida por fricción y del armature en las articulaciones redujo el error de simulación en factores que van desde 134 hasta 3,186 veces en comparación con el modelo oficial inicial URDF FR3, lo que permitió una transferencia sim-to-real de alta fidelidad para robots Franka Research 3. El controlador de aprendizaje por refuerzo, entrenado con Soft Actor-Critic (SAC), fue evaluado para lograr una manipulación robusta en todo el rango de carga útil. La validación experimental cubrió tres tareas: colocación de objetos en un contenedor, interacción repetida en trayectoria circular sobre una superficie en el plano YZ y en el plano XY. Los resultados demuestran que el controlador de RL reduce el consumo de energía hasta en un 51% y mejora la repetibilidad hasta en un 70% en comparación con el control de impedancia de alta ganancia base, mientras mantiene una precisión en posición competitiva dentro del 20–25% respecto a este. Estos hallazgos validan la efectividad y eficiencia del método para la manipulación doble-brazo en escenarios reales con alta variabilidad.
Description
Tesis (Master of Science in Engineering)--Pontificia Universidad Católica de Chile, 2025.
Keywords
Manipulación Doble-brazo, Controlador Aprendizaje Reforzado, Transferencia Simulación a la Realidad, Modelo Dinámico FR3
