Robótica

Un proyecto global trabaja para crear de forma colaborativa un cerebro robótico general

Conseguiría androides conviviendo con nosotros como si fueran miembros de la familia

Representación artística de androides controlados por un cerebro robótico general.

Representación artística de androides controlados por un cerebro robótico general. / Generador de imágenes de COPILOT para T21/Prensa Ibérica.

Eduardo Martínez de la Fe

Eduardo Martínez de la Fe

El auge de la inteligencia artificial generativa impulsa un proyecto global que trabaja para crear un cerebro robótico general, capaz de generar androides como los que hemos visto hasta ahora solo en la ciencia ficción. Pero es cuestión de tiempo que convivamos con ellos en perfecta armonía. Ya no es una utopía.

Los robots son máquinas que pueden realizar tareas físicas de forma autónoma o semiautónoma, gracias a sistemas de inteligencia artificial (IA) que les permiten percibir, razonar y actuar. Sin embargo, la mayoría de los robots actuales están diseñados y programados para realizar tareas específicas y limitadas, y no pueden adaptarse a entornos o situaciones nuevas.

Pero está claro que en teoría podemos llegar mucho más lejos, por ejemplo, si pudiéramos dotar a los robots de una capacidad de aprendizaje y de generalización similar a la de los humanos, o incluso si pudiéramos crear un cerebro robótico general, que pudiera controlar cualquier tipo de robot y aprender de sus propias experiencias y de las de otros robots.

Estos son los objetivos que se plantea el proyecto RT-X, una iniciativa global que reúne a 34 laboratorios de robótica de América, Europa y Asia, con el objetivo de crear una plataforma de datos, recursos y programas de código abierto para hacer realidad los robots de propósito general, un tema al que la revista IEEE Spectrum le dedica un informe especial en su edición de febrero.

El desafío de la robótica de propósito general

La robótica de propósito general es el campo de la robótica que busca desarrollar robots que puedan realizar una amplia variedad de tareas, en diferentes entornos y condiciones, sin necesidad de una programación o un entrenamiento específicos. Imitarían de alguna forma el comportamiento autónomo de los humanos.

Estos robots serían capaces de aprender de forma autónoma, de transferir sus conocimientos a otras tareas o robots, y de adaptarse a los cambios y a las demandas de los usuarios. Por ejemplo, podrían limpiar la mesa, doblar la ropa o preparar el desayuno, tal como lo haría cualquier miembro de la familia.

Sin embargo, lograr este nivel de versatilidad y autonomía en los robots no es una tarea fácil, a pesa de los espectaculares logros conseguidos con los modelos de lenguaje de gran tamaño (LLM), como ChatGPT y otros. El problema es que estos modelos no se pueden aplicar sin más a los robots porque ambos trabajan con sistemas diferentes: los LLM con textos e imágenes, los robots con movimientos y comportamientos.

Los robots actuales, además, se enfrentan a varios desafíos, como la complejidad de los entornos físicos, la diversidad de los problemas a resolver, la escasez de datos y la falta de estándares y de interoperabilidad.

Uno de los principales obstáculos para la robótica de propósito general es, precisamente, la falta de datos. Los robots necesitan ingentes cantidades de datos para aprender, pero estos datos son difíciles de obtener, ya que requieren de interacciones reales con el mundo físico, que son costosas, lentas y arriesgadas. Además, los datos de los robots son heterogéneos y específicos de cada robot, lo que dificulta su compartición y su reutilización.

La solución del proyecto RT-X

El proyecto RT-X surge como una posible solución a este problema de los datos, capaz de provocar, tal vez, el esperado salto tecnológico a un cerebro robótico general y al mundo de los androides en las familias.

El proyecto consiste en crear una plataforma colaborativa y abierta, en la que los laboratorios de robótica de todo el mundo puedan compartir sus datos, recursos y códigos informáticos, para crear un cerebro robótico general que pueda controlar y aprender de diferentes tipos de robots.

La idea se basa en el concepto de "cross-embodiment", que se refiere a la capacidad de un sistema de IA de controlar diferentes tipos de robots, con diferentes formas, propiedades y capacidades. La idea es que un único modelo de IA, entrenado con datos de muchos robots, pueda aprender a "conducir" cualquier robot, incluso robots que nunca ha visto antes.

Para lograrlo, el proyecto RT-X utiliza una base de datos llamada "RoboNet", que contiene más de 15 millones de vídeos de robots realizando diversas tareas, como agarrar, empujar, apilar o verter objetos. En total muestran 527 habilidades a través de 160.266 tareas.

Estos vídeos se obtienen de 34 laboratorios de robótica, que aportan la combinación de 60 conjuntos de datos de robots existentes obtenidos de cámaras y diferentes escenarios. Los vídeos se etiquetan con información sobre el tipo de robot, el tipo de tarea, el tipo de objeto y el resultado de la acción.

Este horizonte tecnológico está cada vez más cerca.

Este horizonte tecnológico está cada vez más cerca. / Generador de imágenes COPILOT para T21/Prensa Ibérica.

Perspectivas del proyecto RT-X

Los resultados obtenidos hasta ahora por el proyecto RT-X muestran que el modelo de IA entrenado con los datos de RoboNet es capaz de controlar una gran variedad de robots, desde brazos robóticos hasta robots móviles, pasando por robots blandos o humanoides. El modelo de IA puede adaptarse a las características y limitaciones de cada robot, y puede generalizar sus conocimientos a tareas y objetos nuevos.

Además, el proyecto RT-X demuestra que el modelo de IA puede aprender de forma colaborativa, aprovechando los datos de otros robots para mejorar su propio rendimiento. Por ejemplo, el modelo de IA puede aprender a agarrar un objeto con un brazo robotizado, observando cómo lo hace otro robot con una forma o una pinza diferente. De esta forma, el modelo de IA puede beneficiarse de la diversidad y la complementariedad de los datos de RoboNet.

Cara…

No obstante, el proyecto RT-X tiene varias perspectivas y limitaciones que conviene tener en cuenta.

Por un lado, el proyecto nos muestra cómo se puede crear un cerebro robótico general, que pueda controlar y aprender de diferentes tipos de robots, a partir de una plataforma colaborativa y abierta de datos, recursos y código.

Esto puede ayudar a desarrollar robots más versátiles y autónomos, que puedan realizar una amplia gama de tareas, en diferentes entornos y condiciones.

…y cruz

Por otro lado, el proyecto también muestra las limitaciones y los desafíos que supone aplicar el modelo de IA a la robótica de propósito general.

El modelo de IA utilizado en el proyecto es un modelo de visión por computador, que se basa en el análisis de imágenes y vídeos para controlar los robots.

El problema es que este modelo no tiene en cuenta otros aspectos importantes para la robótica, como la física, la dinámica, la planificación, la comunicación o la interacción. Tampoco tiene una comprensión profunda o una conciencia de lo que significa realizar una acción, ni de las consecuencias o los objetivos de esta tarea.

Génesis de un gran proyecto

Todo eso significa que RT-X no ofrece, de momento, una solución definitiva o una respuesta correcta a la robótica de propósito general, sino que más bien explora y compara las capacidades y las limitaciones del modelo de IA y de los robots ante estas situaciones, con vistas a llegar algo en el futuro a este objetivo de forma colaborativa.

El proyecto también invita a reflexionar sobre la necesidad y la posibilidad de integrar otros tipos de modelos de IA, como los de lenguaje natural, los de razonamiento o los de aprendizaje por refuerzo, para crear un cerebro robótico general más completo y robusto.

La conclusión de lo que sabemos de este proyecto es que queda mucho para alcanzar el pretendido cerebro robótico general, pero que esa posibilidad ya ha salido del espacio de la utopía para convertirse en algo que, en algún momento, probablemente seremos capaces de conseguir. Nunca se había reunido tanto esfuerzo conjunto de tanto nivel para conseguirlo.

Referencia

Open X-Embodiment: Robotic Learning Datasets and RT-X Models. Open X-Embodiment Collaboration et al. arXiv:2310.08864v4 [cs.RO] ; 18 Dec 2023. DOI:https://doi.org/10.48550/arXiv.2310.08864