Bastano 5 ore per insegnare a un robot a giocare a tennis: il sistema LATENT riscrive le regole della robotica

Un team di ricerca cinese ha addestrato il robot umanoide Unitree G1 con sole 5 ore di video, raggiungendo il 90% di successo nei colpi di diritto. Ecco come funziona il metodo che potrebbe cambiare il modo in cui le macchine imparano dai movimenti umani.

* Un robot con la racchetta: cosa ha fatto il team cinese * LATENT: come funziona il sistema di apprendimento * Cinque ore di video e il 90% di precisione * Il quadro più ampio: dove sta andando la robotica

Un robot con la racchetta: cosa ha fatto il team cinese {#un-robot-con-la-racchetta-cosa-ha-fatto-il-team-cinese}

Cinque ore. Il tempo di una partita particolarmente combattuta tra due professionisti del circuito ATP è bastato per trasformare un robot umanoide in un discreto giocatore di tennis. Non siamo ancora al livello di Sinner, certo, ma il risultato ottenuto da un team di ricerca cinese con il sistema LATENT rappresenta un salto qualitativo che merita attenzione.

Il protagonista meccanico di questa storia è l'Unitree G1, un robot umanoide già noto nella comunità scientifica per la sua versatilità e il costo relativamente contenuto rispetto ai concorrenti. Quello che i ricercatori sono riusciti a fare, però, va ben oltre le capacità dimostrate finora da questa piattaforma: gli hanno insegnato a impugnare una racchetta, leggere la traiettoria di una pallina e rispondere con un colpo di diritto efficace.

E lo hanno fatto senza anni di programmazione manuale, senza migliaia di ore di simulazione e senza un esercito di ingegneri dedicati alla calibrazione di ogni singolo movimento articolare.

LATENT: come funziona il sistema di apprendimento {#latent-come-funziona-il-sistema-di-apprendimento}

Il cuore dell'innovazione si chiama LATENT, un framework che combina due approcci in modo particolarmente elegante: un sistema di motion capture semplificato e un meccanismo di apprendimento autonomo del robot.

Tradizionalmente, insegnare a un robot umanoide un gesto atletico complesso richiede una catena lunga e costosa. Si parte dalla cattura del movimento umano con tute sensorizzate e studi attrezzati con decine di telecamere, si passa alla traduzione di quei dati in comandi compatibili con l'architettura meccanica del robot, e infine si affronta l'infinito lavoro di fine tuning per adattare il movimento teorico alle limitazioni fisiche reali della macchina.

Il team cinese ha tagliato gran parte di questa catena. Il motion capture utilizzato è definito "semplificato" perché non richiede l'apparato tradizionale: stando a quanto emerge dalla documentazione del progetto, il sistema estrae i dati di movimento direttamente da registrazioni video di partite e allenamenti di tennis. Niente tute, niente marcatori riflettenti.

Ma la vera novità sta nel secondo ingrediente. Una volta acquisiti i pattern di movimento di base, LATENT non si limita a replicarli meccanicamente. Il robot entra in una fase di apprendimento autonomo in cui, attraverso tentativi ripetuti, affina la propria tecnica tenendo conto delle sue specifiche caratteristiche fisiche: la lunghezza delle braccia, i limiti di rotazione delle articolazioni, il baricentro diverso da quello umano.

È un po' come la differenza tra copiare la calligrafia di qualcuno e imparare a scrivere con il proprio stile. Il risultato è un movimento che non è una copia imperfetta del gesto umano, ma un adattamento funzionale ed efficace.

Chi segue il settore dell'intelligenza artificiale applicata alla robotica sa che questo tipo di approccio ibrido è una delle frontiere più promettenti. Non è l'unico ambito in cui l'IA sta producendo risultati sorprendenti: basti pensare agli sviluppi nel campo delle infrastrutture con l'asfalto autoriparante di Google, dove il machine learning viene applicato a problemi molto diversi ma con una filosofia simile, quella di ridurre drasticamente i tempi e i costi dell'intervento umano.

Cinque ore di video e il 90% di precisione {#cinque-ore-di-video-e-il-90-di-precisione}

I numeri parlano chiaro. Con appena 5 ore di materiale video utilizzato come base di addestramento, il robot Unitree G1 equipaggiato con il sistema LATENT ha raggiunto un tasso di successo del 90% nei colpi di diritto.

È un dato che va contestualizzato. Non significa che il robot sia in grado di sostenere uno scambio prolungato o di gestire situazioni tatticamente complesse. Il diritto è il colpo più naturale e lineare del tennis, quello che richiede la minore complessità cinematica. Ma un tasso di successo così elevato, ottenuto con un investimento di dati così ridotto, è comunque notevole.

Per dare un termine di paragone: i precedenti tentativi di insegnare gesti atletici a robot umanoidi richiedevano tipicamente centinaia o migliaia di ore di dati, settimane di addestramento in simulazione e poi lunghe fasi di trasferimento nel mondo reale, con percentuali di successo spesso molto inferiori.

La rapidità dell'apprendimento suggerisce che l'architettura di LATENT sia particolarmente efficiente nell'estrarre le informazioni rilevanti dal materiale video, scartando il rumore e concentrandosi sugli elementi biomeccanici essenziali del gesto.

Il quadro più ampio: dove sta andando la robotica {#il-quadro-piu-ampio-dove-sta-andando-la-robotica}

La ricerca robotica cinese sta attraversando una fase di accelerazione impressionante. Aziende come Unitree, ma anche laboratori universitari e centri di ricerca statali, stanno producendo risultati che fino a pochi anni fa sarebbero stati considerati fantascienza. E il tennis, va detto, è solo un banco di prova.

La vera portata di un sistema come LATENT non sta nel creare robot tennisti, ma nel dimostrare che è possibile insegnare competenze motorie complesse a macchine umanoidi con una frazione delle risorse finora necessarie. Se funziona con un colpo di racchetta, potrebbe funzionare con i gesti della chirurgia, con le operazioni di assemblaggio industriale, con i movimenti necessari nell'assistenza agli anziani.

La capacità di apprendere da semplici video, senza infrastrutture costose di _motion capture_, abbassa radicalmente la barriera d'ingresso. Significa che potenzialmente qualsiasi registrazione video di un'attività umana potrebbe diventare materiale didattico per un robot.

È una prospettiva che solleva domande importanti, non solo tecniche. In un'epoca in cui la potenza computazionale cresce esponenzialmente, come dimostrano anche le discussioni sul quantum computing e le sue reali applicazioni, la questione non è più se i robot impareranno dai nostri movimenti, ma quanto velocemente lo faranno.

Con LATENT, la risposta sembra essere: molto più velocemente di quanto chiunque avesse previsto.

Bastano 5 ore per insegnare a un robot a giocare a tennis: il sistema LATENT riscrive le regole della robotica

Un robot con la racchetta: cosa ha fatto il team cinese {#un-robot-con-la-racchetta-cosa-ha-fatto-il-team-cinese}

LATENT: come funziona il sistema di apprendimento {#latent-come-funziona-il-sistema-di-apprendimento}

Cinque ore di video e il 90% di precisione {#cinque-ore-di-video-e-il-90-di-precisione}

Il quadro più ampio: dove sta andando la robotica {#il-quadro-piu-ampio-dove-sta-andando-la-robotica}

Articoli Correlati

Shopping emotivo: perché gli italiani comprano con le emozioni online

Airbnb oltre gli alloggi: tutti i nuovi servizi disponibili nel 2026 nell'App

Polimi e FAO sulla GeoAI: il banco di prova è la fame in 84 Paesi