Publicación: 3D Human pose estimation from egocentric inputs
Autores
Resumen en inglés
Egocentric pose estimation is essential for developing embodied AI systems capable of interacting naturally with humans and their environments. This thesis addresses the challenges of first-person pose estimation through a series of interconnected studies. The first study, BoDiffusion, presents a generative model that synthesizes full-body motion from sparse inputs. The second study, Ego-Exo4D, establishes a benchmark for pose estimation in real-life settings with diverse activities. The final study, EgoCast, focuses on current pose estimation and forecasting in the wild, integrating visual and proprioceptive inputs to handle dynamic and unscripted environments. Together, these contributions provide robust, temporally consistent methods for real-world 3D pose estimation.
Resumen en español
La estimación de pose en primera persona es fundamental para el desarrollo de sistemas de Inteligencia Artificial capaces de interactuar de manera natural con los humanos y sus entornos. Esta tesis aborda los desafíos de la estimación de pose egocéntrica a través de una serie de estudios interconectados. El primer estudio, BoDiffusion, presenta un modelo generativo que genera movimientos corporales completos a partir de poca información. El segundo estudio, Ego-Exo4D, establece un punto de referencia para estudiar la estimación de pose en escenarios de la vida real. El estudio final, EgoCast, se centra en la estimación de la pose actual y en la predicción de movimientos futuros en entornos dinámicos y no estructurados, integrando datos visuales y propioceptivos. En conjunto, estas contribuciones proporcionan métodos adaptables, robustos y consistentes en el tiempo para aplicaciones en el mundo real.
PDF
FLIP