Recentemente, il modello di mondo incarnato WoW sviluppato dal Centro per l’Innovazione dei Robot Umanoidi di Beijing (X-Humanoid) ha conquistato la vetta della classifica di valutazione del WorldArena Challenge Track 2 (Data Engine). In questa valutazione pratica dell’IA globale, alla quale hanno partecipato le migliori università nazionali e internazionali, questo "cervello del robot" proveniente da Beijing E-Town ha raggiunto un livello leader nel settore nella capacità chiave di "comprendere il mondo fisico reale e generare dati".

WorldArena è la prima piattaforma di benchmark unificata e completa, lanciata congiuntamente da università come Tsinghua, Peking University, Shanghai Jiao Tong e Princeton, per valutare la percezione e la praticità funzionale dei modelli di mondo incarnato. Nel WorldArena Challenge, le prestazioni nella valutazione pratica nel Track 2 (Data Engine) dipendono principalmente dalla capacità dei dati sintetici generati dal modello di migliorare realmente l'efficacia dell'addestramento delle strategie robotiche a valle.

Il modello di mondo incarnato WoW fornisce ai robot un "cervello" capace di comprendere e prevedere le leggi fisiche, può simulare le leggi della fisica del mondo reale e generare autonomamente dati di interazione di alta qualità e conformi alla logica fisica, risolvendo il problema della carenza di dati nel settore dell'intelligenza incarnata. A conquistare il primo posto questa volta è il modello WoW 1.3B, il più piccolo della serie. Come "atleta leggero", le prestazioni di WoW 1.3B hanno superato quelle di molti modelli video generici e modelli incarnati dedicati di dimensioni maggiori.

A livello tecnologico, il modello WoW ha realizzato tre importanti innovazioni, possedendo capacità di generazione a livello di motore fisico e potendo apprendere le traiettorie di interazione dei robot e prevedere con precisione scenari futuri; attraverso il paradigma auto-riflessivo SOPHIA, introdotto per la prima volta, crea un ciclo chiuso di dati "auto-evolutivo" capace di derivare milioni di dati di interazione di alta qualità da un piccolo numero di traiettorie reali; può realizzare un ragionamento a ciclo chiuso "dallo schermo all'azione", il che equivale a dotare l’algoritmo di "mani" per toccare il mondo reale. I dati generati da WoW, nel guidare i robot a completare esperimenti come la presa, il posizionamento e compiti a lungo termine, hanno mostrato prestazioni significativamente migliori rispetto ai modelli baseline di punta nazionali e internazionali.

Fonte: ETOWN TIMES