Aprendizaje por refuerzo para el mínimo consumo energético en un robot paralelo de cinco barras

Reyes Fajardo, Juan Pablo

Publicación:
Aprendizaje por refuerzo para el mínimo consumo energético en un robot paralelo de cinco barras

Autores

Resumen en español

Este trabajo presenta el desarrollo de un agente de aprendizaje por refuerzo para la optimización energética de trayectorias de pick and place. Se presenta el análisis, diseño, implementación y validación experimental de un sistema robótico paralelo de cinco barras como plataforma de estudio. A partir del sistema robótico, se construyó un entorno de simulación en el simulador MuJoCo completamente parametrizable, que incorpora los parámetros físicos identificados mediante pruebas dinámicas: inercias rotacionales, fricción seca y viscosa. El entorno fue integrado con la librería Stable-Baselines3 y personalizado en Gymnasium, permitiendo el entrenamiento de políticas energéticamente eficientes utilizando algoritmos de RL adecuados para espacios de acción continuos, como SAC, TD3 y PPO. El consumo energético se evaluó comparando las trayectorias aprendidas por RL frente a una estrategia de control tradicional basada en interpolación polinomial de quinto grado con control PD. Se realizaron pruebas tanto en simulación como en el robot físico. Los resultados mostraron que el agente entrenado mediante SAC logró una reducción promedio de 8.23% en el consumo energético en simulación, y una mejora más notable de 31.12% en el robot físico, particularmente en trayectorias de mayor longitud o exigencia dinámica. Adicionalmente, el agente tiene la capacidad de responder a cualquier objetivo en el espacio de trabajo , siendo una herramienta efectiva para el uso práctico en operaciones no repetitivas.