Home Smartwatch El innovador conjunto de datos de pose 6D establece un nuevo estándar...

El innovador conjunto de datos de pose 6D establece un nuevo estándar para el rendimiento de agarre robótico.

3

Investigadores del Instituto de Tecnología Shibora de Japón han desarrollado un novedoso conjunto de datos de pose 6D diseñado para mejorar la precisión y adaptabilidad del agarre robótico en entornos industriales. El conjunto de datos, que combina imágenes RGB y de profundidad, muestra un potencial significativo para aumentar la precisión de los robots que realizan tareas de recoger y colocar en entornos dinámicos.

La estimación precisa de la postura del objeto se refiere a la capacidad del robot para determinar tanto la posición como la orientación de un objeto. Esto es esencial para la robótica, especialmente en las operaciones de recogida y colocación, que son importantes en industrias como la fabricación y la logística. A medida que a los robots se les asignan tareas cada vez más complejas, su capacidad para determinar con precisión seis grados de libertad (postura 6D) de los objetos, su posición y orientación se vuelve crítica. Esta capacidad garantiza que los robots puedan interactuar de forma fiable y segura con los objetos. Sin embargo, a pesar de los avances en el aprendizaje profundo, el rendimiento de los algoritmos de estimación de pose 6D depende en gran medida de la calidad de los datos con los que se entrenan.

Un nuevo estudio dirigido por el profesor asociado Fan Xuan Tan, Facultad de Ingeniería, Instituto de Tecnología Shibora, Japón, su Junto con un equipo de investigadores, el Dr. Van-Trong Nguyen, el Sr. Cong-Doi Du y el Dr. Thanh Lam Bui de la Universidad de Industria de Hanoi, Vietnam, Asociado El profesor Thai Viet Dang de la Universidad de Ciencia y Tecnología de Hanoi, Vietnam, presenta un conjunto de datos cuidadosamente diseñado destinado a La estimación de pose 6D tiene como objetivo aumentar el rendimiento del algoritmo. Este conjunto de datos llena un vacío importante en la investigación de automatización y agarre robótico al proporcionar un recurso integral que describe los robots en entornos del mundo real. Permite realizar tareas con alta precisión y adaptabilidad. El estudio estuvo disponible en línea el 23 de noviembre de 2024 y se publicó en diciembre de 2024 en el volumen 24 de la revista Engineering Results.

El profesor asociado Tan dice: “Nuestro objetivo era crear un conjunto de datos que no sólo hiciera avanzar la investigación sino que también abordara los desafíos prácticos de la automatización robótica industrial. Esperamos que sea un recurso valioso tanto para investigadores como para ingenieros”.

El equipo de investigación creó un conjunto de datos que no solo satisface las demandas de la comunidad investigadora sino que también es aplicable en entornos industriales prácticos. Usando Intel RealSenseMT Con la cámara Depth D435, capturaron imágenes RGB y de profundidad de alta calidad, anotando cada una con rotación de datos de pose 6D y traducción de objetos. El conjunto de datos incluye una variedad de formas y tamaños, y se incorporan técnicas de aumento de datos para garantizar su versatilidad en diversas condiciones ambientales. Este enfoque hace que el conjunto de datos sea altamente aplicable a una amplia gama de aplicaciones robóticas.

“Nuestro conjunto de datos fue cuidadosamente diseñado para ser práctico para las industrias. Al incluir objetos con diferentes formas y variables ambientales, proporcionaría un recurso valioso no sólo para los investigadores sino también para los ingenieros que trabajan en estos campos. Es donde los robots trabajan en situaciones dinámicas y complejas. “, añade Assoc. . profesor tan

El conjunto de datos se evaluó utilizando modelos de aprendizaje profundo de última generación, EfficientPose y FFB6D, que lograron tasas de precisión del 97,05 % y 98,09 %, respectivamente. La alta tasa de precisión demuestra que el conjunto de datos proporciona información de pose confiable y precisa, lo cual es importante para aplicaciones como la manipulación robótica, el control de calidad en la fabricación y los vehículos autónomos. El sólido desempeño de estos algoritmos en el conjunto de datos ilustra su potencial para optimizar sistemas robóticos que requieren precisión.

El profesor asociado Tan dice: “Si bien nuestro conjunto de datos incluye una variedad de formas básicas como prismas rectangulares, trapecios y cilindros, expandirlo para incluir objetos más complejos e irregulares lo hace más aplicable a escenarios del mundo real”. Además, añade: “Aunque Intel RealSenseMT Si bien la cámara Depth D435 ofrece excelentes datos de profundidad y RGB, la dependencia del conjunto de datos en ella puede limitar su accesibilidad para los investigadores que no tienen acceso al mismo equipo”.

A pesar de estos desafíos, los investigadores son optimistas sobre el impacto del conjunto de datos. Los resultados muestran claramente que un conjunto de datos bien diseñado mejora significativamente el rendimiento del algoritmo de estimación de pose 6D, permitiendo a los robots realizar tareas más complejas con mayor precisión y eficiencia.

“¡Los resultados merecen el esfuerzo!” dijo Asoc. De cara al futuro, profesor Tan, el equipo planea ampliar el conjunto de datos para incluir una variedad más amplia de objetos y partes automatizadas del proceso de recopilación de datos para hacerlo más eficiente y accesible. Estos esfuerzos tienen como objetivo ampliar aún más la aplicabilidad y utilidad del conjunto de datos, lo que beneficiará tanto a los investigadores como a las industrias que dependen de la automatización robótica.

Source link