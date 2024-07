Doblegar peces de manera fiable i eficient és un desafiament per a les mans robòtiques. Requereix una enorme quantitat de dades, amb una dinàmica que és molt més complexa del que sembla. El sistema SpeedFolding és una de les solucions més avançades en aquest àmbit. El robot manipula una peça inicialment arrugada a partir les instruccions definides per l'usuari, com les línies de plegat, fins a obtindre una configuració suau i doblegada.

Els seus dissenyadors van quedar finalistes en el premi al millor treball de recerca en la Conferència Internacional de Robots i Sistemes Intel·ligents de l'Institut d'Enginyers Elèctrics i Electrònics (IEEE per les seues sigles en anglés). Van haver d'inventar una nova arquitectura de xarxa neuronal (una de les maneres de posar en acció la intel·ligència artificial) que fora capaç de predir els parells de posicions de la pinça. Després d'aprendre de 4.300 accions autosupervisades, el robot podia doblegar les peces, que se li entregaven en una configuració inicial aleatòria, en menys de 120 segons, amb una taxa d'èxit del 93%.

En l'equip investigador d'eixe experiment apareix un dels noms propis de la robòtica intel·ligent mundial, Torsten Kroeger, director científic d'Intrinsic, l'empresa amb la qual Alphabet, propietària de Google, vol aconseguir que els robots tradicionals, a partir d'instruccions informàtiques, adquirisquen la capacitat de detectar, aprendre i fer ajustos automàticament a mesura que completen tasques.

Ni una línia de codi

El públic va trencar en aplaudiments quan Kroeger va aparéixer en l'escenari de la Cimera de la Intel·ligència Artificial amb Propòsit de Múnich, a la qual va assistir ‘actius tech’. "Construir robots amb intel·ligència artificial ha de ser molt més fàcil", va proclamar. Eixe és el repte: entrenar-los utilitzant, en lloc de milers d'imatges, a penes una desena d'elles. I sense escriure ni una línia de codi, és a dir, cap d'eixes instruccions que solen utilitzar els informàtics per a programar tasques.

"La IA impulsarà el canvi més gran en la robòtica del segle XXI"

Kroeger va repassar a la ciutat alemanya molts dels continguts de la intervenció que va fer el mes de maig en l'automat Xou de Chicago, on va compartir escenari amb la CEO d'Intrinsic, Wendy Tan White, per a qui "el canvi més gran en la robòtica del segle XXI estarà impulsat per la intel·ligència artificial".

Coneixem ja el que la IA és capaç de fer amb textos, imatges i sons, qui no li ha formulat una pregunta a ChatGPT o li ha demanat que genere una representació? Però la gran revolució encara està per vindre, perquè "la intel·ligència artificial es traslladarà al món físic", va sentenciar: en lloc d'usar paraules i respondre a les nostres preguntes, "funcionarà amb accions físiques reals en el món real".

Reduir costos

El problema és que "recol·lectar dades per als robots és car", va subratllar Torsten a Múnich. Ho és, en efecte. Programar els sistemes d'intel·ligència artificial generativa, la que es troba darrere de fenòmens com ChatGPT, exigeix una enorme quantitat de temps i de personal. El desafiament és reduir costos acurtant terminis.

Intrinsic ha col·laborat mà a mà amb NVIDIA per a ensenyar als robots a agarrar objectes. Els han entrenats amb dades purament sintètiques, és a dir, sense un referent real, creats artificialment. Els moviments no es van programar manualment, no es va escriure ni una sola línia de codi. Tot això no era necessari perquè van aprendre gràcies a la intel·ligència artificial.

A continuació, després de desenrotllar el model, es va pujar com una habilitat a la plataforma d'Intrinsic, anomenada Flow State, i ja estava llesta per a implementar-se en els robots de qualsevol client. El primer a provar-ho va ser Trumpf, un dels proveïdors de màquina ferramenta líders del món. "L'avantatge actual és que amb el bessó digital pots canviar el robot, la pinça, l'entorn, i obtens molta flexibilitat", va explicar Kroeger. El robot de Trumpf agafa peces de xapa d'un contenidor i les classifica acuradament en un altre contenidor. I si canvia l'entorn, no fa falta reprogramar-lo, basta només amb modificar el model en el bessó digital.

Un altre dels reptes per a traslladar la intel·ligència artificial al món físic és la planificació del moviment de múltiples robots. Google Deepmind es va fer popular a tot el món en véncer al campió mundial de *go, un joc de taula ancestral xinés. "Estem usant els algorismes que es van desenrotllar en aquell joc per a la planificació del moviment dels robots", va detallar el director científic de *Intrinsic. "En un parell d'hores, pots entrenar un model amb quatre robots. El procés és de mitjana el 25% més ràpid que el que aconsegueixen els enginyers humans".

Robomotion va mecanitzar una màquina en un parell d'hores amb Flow State, "abans els costava diversos dies programar aquests moviments en la forma tradicional", apunta Wendy Tan White. La italiana Comau va detindre un procés de fabricació de frigorífics en plena execució, va fer que algú s'acostara i moguera el refrigerant, "i tot el procés es va readaptar en temps real, és el tipus de flexibilitat que la intel·ligència artificial pot proporcionar a les aplicacions en el futur", afegeix.

Model de llenguatge

En la Cimera de la Intel·ligència Artificial amb Propòsit, l'empresa emergent NXAI va presentar el primer gran model de llenguatge (LLM) europeu, sobre el qual es pot articular el desenrotllament d'intel·ligències artificials. Han triat una via alternativa a la que va donar lloc a ChatGPT, que es basa en una tecnologia denominada transformers, difosa en 2017 per Google. Albert Ortig i Johannes Brandstetter, fundadors de NXAI, van detallar que es pot "iniciar una revolució en la simulació similar a la del plegament de proteïnes biològiques" que va encimbellar fa uns anys a DeepMind. La simulació és la clau per a entrenar ràpidament a la IA en el món físic.

El director de relacions de negoci de Bayerische KI-Agentur, Andreas Preisser, va remarcar per la seua part que ningú "pot fer això només": "Necessitem posar les dades de diferents sectors en comú, hui més que mai". Una idea que Kroeger va secundar: "No podem fer això només. És una oportunitat per a treballar junts com a comunitat, per a habilitar més i més aplicacions".

Una de les coses que falten en el mapa del nou món per a entrenar a la intel·ligència artificial són imatges de qualitat del món físic. Florian Bohne, cap d'enginyeria assistida per ordinador d'Inpro, usa la intel·ligència artificial per a crear imatges sintètiques. No són reals, però han de semblar-ho perquè l'entrenament dels robots calga. Entre els reptes figura produir-les en 3D, "és més desafiador, perquè la llum, la posició, el reflex… són coses més difícils de controlar".

Les empreses hauran d'orquestrar diferents intel·ligències artificials en les seues organitzacions de la forma més eficient possible. Rainer Brehm, CEO d'automatització industrial de Siemens, va relatar el que ha costat introduir Copilot, una intel·ligència artificial generativa de Microsoft, en els processos de producció. Per a això van decidir aliar-se amb el fabricant de braços robòtics Schaeffler. Els operaris hui poden parlar amb la màquina, consultar-li dubtes sobre el manual tècnic i esbrinar en conversa amb ella si necessita manteniment.

"Els problemes tècnics apareixen quan vols demostrar que funciona a escala", va manifestar Brehm. Per què hauria d'haver-hi pantalles, si podem relacionar-nos amb un assistent de veu intel·ligent? Canvien totes les regles del joc de l'automatització. "Hem de qüestionar-nos tot el que féiem en el passat - va sentenciar el directiu de Siemens-, hem de repensar tots els patrons, necessitarem automatitzar, però d'una forma completament diferent".