BALMIX - Unitree vezérigazgatója a kínai robotforradalomról

„A humanoid robotok még életünkben forradalmasítani fognak minden iparágat”

A hangcsoui székhelyű Unitree Robotics a kínai robotikai ipar vezető szereplői közé tartozik, és a legkelendőbb civil négylábú és humanoid robotokat fejleszti.

A Unitree H1 humanoidjai több mint egymilliárd embert bűvöltek el egy hagyományos néptáncbemutatóval a 2025-ös kínai tavaszi fesztivál gáláján. Néhány héttel később a Unitree vezérigazgatója volt a legfiatalabb első sorban ülő résztvevője a pekingi, nagy érdeklődéssel várt magánszektorbeli csúcstalálkozónak.

Hogy jobban megértsük a kínai robotikai iparágat és azt, hogy merre tart, lefordítottuk és kommentáltuk a qan interjút a Unitree alapítójával és vezérigazgatójával, WangXingxing王兴兴. Az interjú eredetileg 2024 áprilisában készült a Titanium Media (TMT) által:

Miért nem elég az LLM-ek a robotikai ipar számára, és miért jósolja Wang, hogy 2025 végére megjelenik egy nagyméretű AI-modell az általános célú robotika számára,
Melyek a humanoid robotok globális boomjának mozgatórugói, és hogy miért van Kína egyedülállóan jó helyzetben ahhoz, hogy sikeres legyen ebben az iparágban,
A jövő gazdaságának techno-optimista víziója, amelyet humanoid robotok, valamint alternatív formájú gépek hajtanak,
A mesterséges intelligenciával működő általános célú robotok tömeges elterjedésének ütemterve,
az Unitree stratégiája a külföldi és hazai robotikai cégekkel való versenyben.

Az Ön szórakoztatására néhány szerkesztői megjegyzést is csatoltunk, többek között egy névtelen robotikai PhD és a KL Divergence jelenlegi iparági szereplőjének kommentárját.

Szeretne többet megtudni? A korábbi ChinaTalk-közleményeket lásd Angela munkáját Kína ipari robotikába való belépéséről és a kínai humanoid robotiparról.

A fordítás

Eredeti cikk | Archívum | Cím: „WangXingxing: A humanoid robotok még az én életemben átformálják az összes iparágat | Szerző: WangXingxing: A humanoid robotok még az én életemben átformálják az összes iparágat: RaoXiangyu饶翔宇forTitanium Media (TMT) 钛媒体APP | Editor: ZhongYi钟毅

2025. február 17-én Pekingben nagy érdeklődéssel várt magánvállalkozói szimpóziumot tartottak.

Az eseményen Wang Xingxing, az Unitree Robotics alapítója és a 90-es évek utáni vállalkozó jelenléte vonzotta a piac figyelmét. Wang az első sorban foglalt helyet az üzleti élet képviselői között, olyan iparági óriások mellett, mint Zeng Yuqun, Jack Ma, Ren Zhengfei, Wang Chuanfu, Lei Jun és Pony Ma. Közülük Ren Zhengfei, Wang Chuanfu, Liu Yonghao, Yu Renrong, Wang Xingxing és Lei Jun mondott beszédet.

Az Unitree Robotics és Wang Xingxing startup vállalkozásként „rakétaszerű ugrásként” jellemezhető növekedést tapasztalt.

[KL Divergencia:Talán.Bár vegyük figyelembe, hogy a Unitree már 10 éve befutott szereplő, különösen a négylábú robotok terén.Keményen dolgoztak és centiről centire kaparták fel magukat, kiszolgálva a termékük számára létező kis piacokat (főként kutatókat). A közelmúltban a humanoid robotok iránti érdeklődés hullámát meglovagolva, olcsó, könnyen használható, de nem különösebben fejlett humanoid robotok létrehozásával váltak ismertté a kutatás számára.]

A nyilvános feljegyzések szerint Wang Xingxing a Zhejiang Sci-Tech Egyetemen szerzett alapdiplomát. Gyenge angol nyelvtudása miatt nem sikerült felvételt nyernie a Zhejiang Egyetemre a mesterképzésre, helyette a Sanghaji Egyetemre került. Egy interjúban Wang egyszer megemlítette: „A középiskolában töltött három év alatt összesen csak háromszor sikerült angolból vizsgáznom”.

2013 és 2015 között, miközben folytatta diplomamunkáját, Wang a korlátozott erőforrások és finanszírozás ellenére önállóan tervezett hardvert és vezérlő algoritmusokat, és ipari motorokkal kombinálva fejlesztette ki az XDog robotkutyát. Ez a projekt második díjat nyert a sanghaji robottervezési versenyen. A diploma megszerzése után Wang vállalkozói útra lépett, amelynek középpontjában a robotkutyák álltak.

[KL Divergencia:Valójában a hardver és a vezérlő algoritmusok nagy része nyugati kutatók, például Sangbae Kim (MIT) és Dan Koditschek (UPenn) által közzétett, nyilvánosan elérhető robot- és működtetőszerkezetekből származott. Az Unitree igazán kiemelkedő teljesítményt nyújtott (1) a nagy teljesítményű működtető elemek, robottervek és kutatási szintű vezérlőalgoritmusok iterálásában, valamint (2) a kínai beszállítói lánc kihasználásában, hogy e kulcsfontosságú technológiák alacsony költségű, nagy teljesítményű és nagy megbízhatóságú kombinációit hozza létre. Más szóval, a kutatást produktivizálták.]

A 2016-ban alapított Unitree Robotics kezdetben négylábú robotkutyák fejlesztésére szakosodott, és sikeresen értékesítette őket világszerte, a termékszállítások tekintetében az iparág egyik vezető szereplőjévé vált. A vállalat 2023-ra a humanoid robotikába is belevágott, és gyorsan a terület egyik legjobban figyelt vállalatává vált. 2025-ben a Unitree Robotics legújabb humanoid robotja megjelent a CCTV Tavaszi Fesztivál Gála színpadán , széles körű közfigyelmet keltve.

2024 áprilisában Wang Xingxing, a Unitree Robotics alapítója exkluzív interjút adott a Titanium Media APP-nek. A vonatkozó tartalom az alábbiakban olvasható.

Wang a TMT APP-nek elmondta, hogy a humanoid robotika boomjának alapvető oka a nagy AI modellek megjelenése. Korábban egy humanoid robotnak egy-két évbe telt, mire megtanult járni, de ma már az AI-algoritmusok segítségével ez akár egy hónap alatt is elérhető.

Ami a humanoid robotok jövőbeli fejlődését illeti, Wang erős optimizmusának adott hangot. Úgy véli, hogy 2025 végére világszerte legalább egy vállalat kifejleszt egy általános célú mesterséges intelligenciájú robotmodellt. Ez az alapmodell - magyarázta - olyan, mint egy teljes építőelem-készlet, amelynek a nagy nyelvi modellek csak az egyik darabja. A többi kulcsfontosságú összetevő a vizuális érzékelés, a tapintásérzékelés, a döntéshozatal és az interakciós rendszerek.

Wang a TMT-nek nyilatkozva még hosszabb távlatokra tekintve elmondta: „Még a mi életünkben a humanoid robotok képesek lesznek forradalmasítani minden iparágat, a gyártástól a mezőgazdaságon át a szolgáltatásokig és az ipari ágazatokig. Egy lépéssel továbbmenve, a kormányok potenciálisan 100 000 humanoid robotot is bevethetnek egy egész város felépítéséhez. Kisebb léptékben a robotok akár sejtméretűre is zsugorodhatnak, átalakítva természeti környezetünk minden aspektusát.”

Az alábbiakban a TMT és az Unitree Robotics alapítója, Wang Xingxing közötti teljes interjú olvasható, kisebb szerkesztői módosításokkal.

„A humanoid robotok fordulópontja még nem érkezett el”

TMT: Néhány nappal a találkozónk előtt a Boston Dynamics, a robotika egyik sztárvállalata bejelentette, hogy a hidraulikus meghajtású humanoid robotját kivonják a forgalomból, és a jövőbeni fejlesztések az elektromos meghajtású termékekre koncentrálnak. Mit gondol erről?

WangXingxing: A Boston Dynamics már évek óta gyárt robotokat, és régóta dolgoznak a kereskedelmi forgalomba hozatalon is.

Ami a hidraulikus meghajtási rendszereket illeti, már 2013 előtt is úgy gondoltam, hogy ez a megközelítés nem kerülhet kereskedelmi forgalomba. Az ok egyszerű: teljes mértékben precíziós mechanikai alkatrészekre támaszkodik, és ha egyszer ilyen alkatrészeket vonunk be, a költségek soha nem fognak csökkenni. Ráadásul minden hidraulikus rendszerből szivárog az olaj. Ezért alig látni már hidraulikus rendszereket a fogyasztói járművekben - ezeket mind felváltották az elektromos meghajtású rendszerek.

Ha tehát a Boston Dynamics továbbra is humanoid robotokat akar fejleszteni, akkor az elektromos meghajtásra való áttérés mindenképpen a helyes út. Az egyetlen meglepő dolog számomra az, hogy 2018 körül azt feltételeztem, hogy már elkezdtek dolgozni egy elektromos változaton. De később, amikor már nem történt kimutatható előrelépés, egyszerűen nem figyeltem tovább.

TMT: A hidraulikus rendszerekhez képest az elektromos hajtás jobban megfelel a nagyméretű AI modelleknek?

Wang Xingxing: A hidraulikus rendszerekhez képest az elektromos meghajtásnak minden előnye megvan, és nincs hátránya. Ami azt illeti, hogy az elektromos rendszerek alkalmasabbak-e a mesterséges intelligenciához, azt nehezebb megmondani. Az elektromos meghajtások azonban alacsonyabb gyártási költségekkel rendelkeznek, nagyobb mozgásbeli rugalmasságot kínálnak, biztonságosabbak és könnyebbek is.

TMT: Most, hogy a Boston Dynamics átállt az elektromos meghajtású robotokra, a meglévő képzési adataikkal kombinálva, úgy gondolja, hogy gyorsabban tudnak iterálni, mint a versenytársak ebben az új hullámban?

Wang Xingxing: Nehéz megmondani. Azonban továbbra is eléggé magabiztosak vagyunk, mivel évek óta dolgozunk négylábú robotokon, és az általunk kifejlesztett algoritmusok és alkatrészek nagy része közvetlenül alkalmazható a humanoid robotokra.

Egy másik fontos szempont, hogy az Egyesült Államokban a legjobb AI-tehetségek többsége nem a Boston Dynamicsnál dolgozik - ők a Google-nál, az NVIDIA-nál és az Open AI-nál vannak. A Boston Dynamics erőssége valószínűleg a hardverfejlesztés és a hagyományos humanoid robotok vezérlőrendszerei.

TMT: Tehát, azt mondaná, hogy a nagy AI modellek megjelenése jelentős fordulópontot jelent a humanoid robotok számára?

WangXingxing: Nem hiszem, hogy még nem értük el ezt a fordulópontot. Jelenleg ez inkább egy kezdő irány. Van egy gyakori tévhit - sokan azt gondolják, hogy a ChatGPT-hez hasonló nagy nyelvi modellek közvetlenül alkalmazhatók robotokra, de a valóságban ez nem így van.

TMT: Miért nem?

WangXingxing: Mert az LLM-eket eleve nem a robotikára tervezték. A ChatGPT tisztán szöveges logikával működik, és a teljes képzési adathalmaza szöveges adatokon alapul. Nem teljesít jól a robotok környezetérzékelésében - ez egy globális kihívás, nem csak egy vállalat problémája.

Bár a humanoid robotika használja a mesterséges intelligenciát, a technológia valójában nagyon különbözik a nagy modellek technológiájától.

TMT: De néhány vállalat azt állítja, hogy a nagy AI modellek már képesek felismerni a különböző típusú tányérokat, lehetővé téve a robotok számára, hogy azonosítsák és felvegyék azokat.

WangXingxing: Ezt nem tudjuk ellenőrizni. Ez csak egy videó volt, és senki sem erősítette meg a hitelességét. Emellett nincsenek adatok arra vonatkozóan, hogy ha a tányért almára, körtére vagy valami másra cserélnénk, a robot akkor is képes lenne felismerni és helyesen kezelni azt. Én személy szerint nem látok bizonyítékot arra, hogy a Szilícium-völgyből valódi technikai áttörés jönne - ez még mindig eléggé konvencionálisnak tűnik (中规中矩).

TMT: Tehát a nagy AI modellek nem jelentik a humanoid robotok fejlesztésének kulcsfontosságú fordulópontját? Kevésbé fontosak, mint azt az emberek gondolják?

WangXingxing: A modellek önmagukban nem fontosak a robotok számára, de az általuk képviselt mögöttes technológiai irány nagyon fontos. Jelenleg a nagy modellek főként a nyelvi modellekre koncentrálnak - de még senki sem fejlesztett ki igazi nagyméretű modellt kifejezetten a robotika számára.

TMT: Ezzel el is érkeztünk a nagy kérdéshez - mi váltotta ki a 2023-as humanoid robotikai startup-boomot?

WangXingxing: Az ok valójában nagyon egyszerű: A Tesla elkezdett dolgozni humanoid robotokon. Elon Musk már megzavarta az olyan iparágakat, mint az autóipar és a rakéták, és hatalmas ágazatokká növesztette őket. Most, hogy belépett a humanoid robotokba, a kormányok és a különböző intézmények korán szeretnének belevágni, ahelyett, hogy megvárnák, amíg Musk először sikerrel jár, és utána próbálnának felzárkózni.

[KL Divergencia: Szerintem ez egy kicsit túlságosan is csak-csak és a közönségnek játszik. Az alapok sokkal fontosabbak. Elon és az Optimus mindenképpen a szikra, ami lángra lobbantotta a futótüzet. De a gyújtószerkezetet az akkumulátorok és az elektromos motorok teljesítménysűrűsége terén elért évekig tartó lassú és folyamatos fejlődés jelentette, ami végül lehetővé tette, hogy 2020-21 körül praktikus (azaz elég erős és könnyű) elektromos humanoid robotokat hozzanak létre. Elon csapata kicsit korán rájött erre, mert ezek olyan technológiák, amelyekbe a Tesla történetesen mélyen befektetett. De mások már korábban is csinálták, csak csendben].

Ugyanakkor a ChatGPT és más LLM-ek kitágították a közvélemény képzeletét a mesterséges intelligenciában rejlő lehetőségekről. Mondhatni, ezek a modellek az egész iparágban lángra lobbantották az izgalmat és a lelkesedést. Jelenleg, amit látunk, még csak a kezdet - a lendület csak erősödni fog.

Ahogy a hardver és az AI technológia évről évre fejlődik, a humanoid robotika hatása a világra hatalmas és átalakító lesz.

„Ez egyszerű, valójában nem is olyan bonyolult, mint ahogy azt a legtöbben gondolják”

TMT: A jelenlegi nagy AI modellek csak a kezdetet jelentik. Mi az iparág jövőbeli iránya, illetve hová kellene mindenkinek összpontosítania az erőfeszítéseit?

Wang Xingxing: Sokféle irány létezik. Az első lépés az AI adaptálása a robotokhoz - a robotok látásának, észlelésének, megértésének, végrehajtás-tervezésének és különböző műveleteknek a fejlesztése.

Én is izgatott vagyok, mint mindenki más. Személy szerint úgy érzem, hogy ez az iparág gyorsan fog fejlődni, beleértve a robotokat, a nagy modelleket és az AI-t. Úgy vélem, hogy 2025 végére legalább egy vállalat globálisan legalább egy viszonylag általános célú robot nagymodellt fog kifejleszteni.

A mi cégünk reméli, hogy mi magunk is kifejlesztjük, de reálisan nézve nagyobb a valószínűsége annak, hogy egy amerikai cég fogja ezt először elérni.

[Angela: Wang optimista. Attól függően, hogy milyen céltáblákat állítunk fel, egy robot „alapmodell” kiképzéséhez nagy, multimodális adathalmazokravan szükség, amelyek összegyűjtése vagy szintetizálása időt és tőkét igényel - beleértve a látást, a hangot, az érintést, a mozgást, a szociális és környezeti interakciókat stb. is. Wang jóslata bizonyos szempontból jól illeszkedik a kínai kormány azon kinyilvánított céljához, hogy 2025-re tömegesen gyártsanak humanoidokat, 2027-re pedig világelsők legyenek.Ugyanakkor reálisan felismeri az amerikai innováció erejét. A fő tanulság az, hogy Wang számára - és valószínűleg sok iparági kollégája számára is - a humanoid robotok versenye néhány döntő pillanat felé gyorsul.]

TMT: Ez felveti a nyílt forráskód kontra zárt forráskód kérdését.

Wang Xingxing: Ha mi fejlesztjük ki, akkor biztosan nem lesz nyílt forráskódú.

TMT: Létezik egységes modell a nagy robotmodellek és a robotkutyák között?

WangXingxing: A legtöbb robotkutyát megerősített tanulással valósítják meg, ami egy viszonylag érett technológia.

A robot nagy modellek vagy robot világmodellek minden robotra alkalmazhatók, nem feltétlenül humanoid vagy kutya alakú robotokra - ezek univerzális eszközök. Mindig is úgy gondoltam, hogy a robotoknak nem feltétlenül kell humanoidnak lenniük; a humanoid alak csak egy a sok lehetséges forma közül. Soha nem ragaszkodtam ahhoz, hogy humanoidnak kell lenniük.

TMT: De a mainstream nézet szerint a humanoid formák jobbak, mert az egész társadalmunk ember alakú vázakra épül.

Wang Xingxing: Lehet, hogy ezt szeretnék mondani, de én ezt soha nem hittem el.

Teljesen új fizikai világokat lehet építeni. Miért lenne szükséged humanoid formára a bányászathoz? Miért lenne szükséged feltétlenül emberi alakra a házépítéshez? Természetesen a humanoid formák fontosak, vagy viszonylag fontosak, de nem minden.

Otthon például az emberek talán jobban kedvelik a humanoid robotokat, ha forgatókönyveket kell végrehajtaniuk, vagy elkísérniük téged az utazásokon. De házépítéshez vagy szállításhoz - fizikai munkához - nem szükséges, hogy humanoidok legyenek. Ráadásul a humanoid formák az emberekben azt az érzést kelthetik, hogy rabszolgát birtokolnak, ha kellemetlen munkát kell végezniük, ami miatt a tulajdonosuk kényelmetlenül érzi magát.

TMT: Sajnálnád őket?

Wang Xingxing: A jelenlegi mesterséges intelligencia még nem érte el ezt a szintet; nem képes érzékelni az ilyen dolgokat.

De ha a mesterséges intelligenciája érzékelné a fájdalmat vagy a negatív érzelmeket, akkor igen, az problémás lehet. De most nincs szükség sajnálatra, mert ez még mindig csak egy élettelen tárgy [死物, szó szerint egy „halott dolog”], korlátozott intelligenciával.

TMT: Kíváncsi vagyok valamire - annak ellenére, hogy az intelligenciájuk korlátozott, amikor meglököd őket, miért mutatnak emberhez hasonló, tántorgó mozdulatokat?

Wang Xingxing: Azért, mert a mesterséges intelligenciát erre képezték ki a megerősítő tanulás révén.

TMT: Tehát az emberi viselkedést utánozza?

https://youtu.be/Y4z3psSbMEo

Wang Xingxing: Néhány viselkedés nem utánzás; ezeket a természeti törvények határozzák meg. Mondhatnánk, hogy a fizikai törvények arra kényszerítik ezeket a robotokat, hogy bizonyos módon mozogjanak. Ha egy idegen lénynek emberi alakja lenne, valószínűleg a mozgása is ugyanilyen lenne.

TMT: Jelenleg az emberek a robotokat agyvelőre, kisagyra és fizikai testre bontják. Mi a véleményed erről?

Wang Xingxing: Soha nem szerettem az agyvelőt és a kisagyat ennyire különválasztani. Egy modell elég - miért kellene kettéosztani? Nem hiszem, hogy ez szükséges.

Természetesen lehetnek különböző modulok a modellen belül, de összességében jobban szeretem egyetlen modellként kezelni. A járástól a finomszemcsés műveletekig mindent a mesterséges intelligencia segítségével valósítunk meg, teljesen végponttól végpontig. A vizuális érzékeléstől a lábak végrehajtásáig egyetlen modell kezeli az egészet - semmilyen köztes matematikai képlet nélkül.

TMT: A hardveres képességek képesek lépést tartani?

Wang Xingxing: A robotok esetében csak néhány ízületről van szó - ez tényleg nem olyan nehéz. Csak az érzékelők táplálják a modellt, majd a modell kiadja az ízületeket. Ennyi az egész.

TMT: Úgy tűnik, a humanoid robotok megértése egyszerűbb, mint másoké.

Wang Xingxing: Ez egyszerű, nem olyan bonyolult.

TMT: Mások például azt gondolhatják, hogy az ügyes kezek nehézkesek a finom műveletekhez, mert pontosabb felismerést és finomabb mozgásvezérlést igényelnek.

Wang Xingxing: Nagyon nehéz, ha hagyományos technológiát használunk, ezért nem támaszkodhatunk a hagyományos megközelítésekre. Technológiai innováció nélkül nincs értelme ezen a területen dolgozni. Persze, ezt nem lehet ilyen közvetlenül kifejezni - jobb, ha nem megyek túl messzire a közérthetőségen, különben valószínűleg kiátkoznának (骂死).

TMT: Mit értesz konkrétan a nem hagyományos alatt?

Wang Xingxing: Ez egy új mesterséges intelligencia, végponttól végpontig. Azt jelenti, hogy nem kell kézzel írni sok szoftverprogramozási szabályt a kettő között, és nem kell hagyományos képfelismerést végezni.

TMT: Hogyan valósítja ezt meg?

Wang Xingxing: Módosítjuk a modellt. A mögöttes AI ugyanaz, de a teljes modellstruktúrája és az algoritmusai mások. Ezt nem tudom túl konkrétan elmagyarázni - nehéz lenne megérteni. Például egyáltalán nincs szükséged hagyományos képmagyarázatra vagy képmegértésre. Képeket és videókat adhatsz be egy modellbe, és a kimenet közvetlenül a robot közös pályái, majd csak edzed azt. Továbbra is végezhetsz képjegyzetelést, például almákról készült képek címkézését. De az annotációnak csak egy funkciója van: az emberekkel való interakció, ami segít neki jobban megérteni az embereket. Maguk a robotok számára nincs különbség egy alma és egy körte között.

TMT: A mainstream véleményekhez képest az Ön logikája és iparági megítélése egyedülálló.

Wang Xingxing: A mainstream álláspontnak még mindig sok problémája van. Induló vállalkozásként, ha a gondolkodásod csak a mainstream, egyszerűen nem fog jól működni számodra. Látnod kell a következő évek fejlődési irányát, és ha már látod, ennek megfelelően tervezz előre - akkor biztos, hogy nyersz, vagy legalábbis nem veszítesz. Ha csak azt látod, amiről mindenki más beszél, mások biztosan jobban tudnak nálad - hogyan tudnál kitűnni?

TMT: Ön szerint milyen lesz a következő néhány év?

Wang Xingxing: Az biztos, hogy az iparág rendkívül gyorsan fog fejlődni.

TMT: Milyen gyorsaságról beszélünk itt?

Wang Xingxing: Alapvetően minden képzeletet felülmúl. A mesterséges intelligencia gyári bevezetésének jelenlegi üteme - globálisan, a technológiai fejlődés rendkívül gyors és szinte már életképesnek bizonyult.

TMT: Jelenleg egyetlen vállalat sem tudja teljes mértékben kihasználni a robotok munkáját.

Wang Xingxing: De az egész logika már majdnem bebizonyosodott. Ez nem azt jelenti, hogy a robotok mindent meg tudnak csinálni, de a munkára képes, végig használható robotok közelednek az érettséghez. Egy általánosabb célú robotmodellt valószínűleg még 2025 vége előtt globálisan is ki fog fejleszteni egy vállalat.

TMT: Ilyen gyorsan?

Wang Xingxing: Még ennél is gyorsabb lehet. Néhányan már látták, hogy hová fog ez vezetni - bár ez egy kicsit hencegésnek hangzik, de úgy érzem, én is láttam már. Ezt az irányt követve, némi plusz idővel, munkaerővel és pénzzel alapvetően fejleszthető.

„Minden technológiai áttörésben nagy szerepet játszik a szerencse”

TMT: Konkrétan mire vonatkozik a robotmodell?

Wang Xingxing: Gondolhatunk rá így: először is, erős mobilitási képességekkel rendelkezik, amelyek a legtöbb terepen alkalmazhatók, esetleg bizonyos, az embereket meghaladó mobilitási képességekkel. Például az akadályokon való átkelési képessége, sebessége, ugróképessége jobb lehet, mint az emberé. Egy másik szempont a gyárakban való munkavégzés - sok feladatot el tud végezni anélkül, hogy kézi programozást igényelne. A nagy modellképességek révén, egy kis tanítással, magától megtanulhat, majd jól teljesíthet.

TMT: Szükség van még a virtuális környezetben történő szimulációs képzésre?

Wang Xingxing: Valószínűleg nem annyira szükséges. Ha egyszer jól betanítottuk és validáltuk, akkor már nincs szükségünk szimulációra. Természetesen a hardver befejezése nem fog azonnal megtörténni, de szerintem ez csak idő kérdése. Ami a mesterséges intelligenciát illeti, még mindig van némi bizonytalanság. Bár az előbb azt mondtam, hogy én személy szerint optimista vagyok, hogy 2025 vége előtt megjelenik, lehet, hogy nem fog megtörténni - 3-5 évbe is beletelhet, mire kifejlesztik. Az emberiség kollektív szerencséjén múlik - néha csak a szerencsén múlik.

TMT: Hogyan érti ezt a fajta szerencsét?

Wang Xingxing: Sok technológiai áttörés a szerencsén múlik. Ha például Einstein nem létezett volna, valószínűleg valaki más fedezte volna fel az elméleteit. De lehet, hogy ez néhány évet, vagy akár évtizedeket késett volna. Úgy tekinthetjük, hogy minden technológiai áttörésben nagy szerepet játszik a szerencse.

TMT: Egy másik pont: az algoritmusok és modellek mellett a nagy modelleknek adatokra is szükségük van. Az adatgyűjtés jelenleg nagyon nehéz?

Wang Xingxing: Valóban sok mindenre van szükség, de vannak módszerek ezek kezelésére. Nem olyan bonyolult, mint ahogy az emberek gondolják - sok probléma nem olyan összetett, mint ahogy azt az emberek elképzelik. Tudja, a jelenlegi technológiai területeken, ha igazán megnézzük, semmi sem igazán bonyolult; minden viszonylag közvetlen és egyszerű.

TMT: Tehát az önök iparága is két táborra oszlik - optimistákra és pesszimistákra? Ön például optimistább, azt gondolja, hogy az egész nem is olyan bonyolult.

Wang Xingxing: Mindenképpen időt és szellemi befektetést igényel, de ezek a dolgok megoldhatók és fejleszthetők. Ezek nem olyanok, mint a szobahőmérsékletű szupravezetők vagy a szabályozott magfúzió. A legnagyobb probléma a szobahőmérsékletű szupravezetőkkel és a szabályozott magfúzióval az, hogy kérdéses, hogy fizikailag lehetségesek-e. Lehet, hogy az univerzum egyszerűen nem engedi meg, hogy ilyen dolgok létezzenek, és az emberek talán soha nem érik el őket, bármennyi időt és erőfeszítést is fektetünk bele. A mesterséges intelligenciájú robotok hétköznapi dolgok, nem valami rendkívüli - csak egy csomó ember és állat intelligenciája. Az intelligencia széles körben elterjedt jelenség. Egyes állatok nagyon okosak és sok mindent megértenek abból, amit az emberek mondanak, csak beszélni nem tudnak. És a varjak - néhány varjú még közvetlenül is tud szerszámokat használni. Az intelligenciának tehát nincs sok korlátja vagy fizikai korlátja; megismételhető.

TMT: Mi motiválja leginkább a munkádat?

Wang Xingxing: Hogy őszinte legyek, engem személy szerint a mesterséges intelligencia mozgat.

Néhány évvel ezelőtt egy befektető megkérdezte tőlem, hogy a cégünk valaha is fog-e humanoid robotokat fejleszteni, mire én azt mondtam neki: „Soha nem tennénk ilyet, még akkor sem, ha belehalnánk”.

[KL Divergencia:Diverzió: Nagyszerű őszinteség. Ez igaz. Gyakorlatilag az egész szakma reménytelen ponyvának tartotta a humanoid robotokat, amelyek minden időt és pénzt felemésztenének, és nem tennének előrelépést. Még a robotikai kutatásban is a humanoidok egy furcsa mellékvágánynak számítottak, amely a különcöknek és a túlzottan optimistáknak volt fenntartva].

Akkoriban a humanoid robotok túlságosan összetettek voltak. A hagyományos algoritmusok egyszerűen nem tudták kezelni az ilyen bonyolult gépeket. A humanoid robotok kiképzésének hagyományos megközelítése magasan képzett mérnökökre támaszkodott, akik kézzel írtak matematikai egyenleteket a mozgás modellezésére. Ezeket az egyenleteket aztán megoldották, hogy meghatározzák a robot mozgási pályáját. Ennek a módszernek azonban komoly korlátai voltak: ha a környezet megváltozott, az egyenletek gyakran érvénytelenné váltak, így teljesen új modelleket kellett tervezni a semmiből.

Ez a megközelítés emellett túl sok kódot eredményezett, és ahogy a rendszer egyre összetettebbé vált, szinte lehetetlenné vált a kézi karbantartása. A mesterséges intelligencia azonban mindent megváltoztat. Amíg a modell jól strukturált és folyamatosan adatokkal és számításokkal táplált, a mesterséges intelligencia iteratív módon, próba és hiba útján optimalizálhatja önmagát. A megerősítő tanulás és a jutalmazási mechanizmusok kihasználásával a mesterséges intelligencia automatikusan képes megtartani a sikeres képzési eredményeket, és elvetni a nem hatékonyakat, drámaian javítva a képzés hatékonyságát.

A mesterséges intelligencia technológiában a közelmúltban bekövetkezett fejlődés - mind a képességek, mind a sebesség tekintetében - messze felülmúlta személyes várakozásaimat. Ezért van az, hogy annak ellenére, hogy alig több mint egy éve dolgozunk humanoid robotokon, a teljesítményünk máris kivételesen jó. Az ok, amiért ilyen gyorsan tudtunk haladni, egyszerű: a mesterséges intelligencia fejlődésének köszönhetően.

A mesterséges intelligencia előnye, hogy ha már felépítettünk egy erős modellt, a többi már csak számítás kérdése - nem kell mindent kézzel finomhangolni. Ha tesztelnie kell egy forgatókönyvet, akkor csak annyi a dolga, hogy több adatot táplál a rendszerbe. Ez az oka annak is, hogy a Tesla autonóm vezetési csapata lényegesen kisebb, mint a kínai autonóm vezetési csapatok. Biztosan tudom, hogy a Tesla csapatában csak néhány száz ember dolgozik, míg egyes kínai cégeknél több ezer fős csapatok vannak.

TMT: Ez az oka annak is, hogy az újabb szereplők képesek voltak megelőzni a Boston Dynamics-ot?

Wang Xingxing: Pontosan. Ha pusztán hagyományos algoritmusok segítségével versenyeznénk a Boston Dynamics-szal, esélyünk sem lenne. Az ok egyszerű: A Boston Dynamics-nak egy egész csapatnyi doktorandusza van az MIT-ről, és Kína semmiképpen sem tudná őket felülmúlni ezen a területen.

TMT: Ha a jövőre tekintünk, mit gondol, mi lesz a legfontosabb megkülönböztető tényező a humanoid robotok között?

Wang Xingxing: A robotika egy integrált termék. Ellentétben az üzemanyaggal működő és az elektromos járművekkel, ahol a mögöttes technológiák alapvetően különböznek, a humanoid robotok esetében a különbségek inkább inkrementálisak lesznek - elsősorban a konkrét mérnöki optimalizálásban, például a motor méretezése, a motor elhelyezése, a munkaterület méretei, a szerkezeti kialakítás és a lábak konfigurációja terén.

Ugyanez az elv érvényes a mesterséges intelligenciára is. Vegyük a nagy nyelvi modelleket - ezek alapvetően nagyon hasonlóak. A legnagyobb különbségek inkább a részletekben, mintsem az alapvető tervezésben vannak; az OpenAI GPT-architektúrája még mindig viszonylag tiszta.

„Még a mi életünkben a humanoid robotok újra feltalálhatják az összes iparágat és a természeti környezetet.”

TMT: A kereskedelmi forgalomba hozatal is fontos. Hogyan maradhatnak életben a startupok az egyre élesedő versenyben?

Wang Xingxing: Az üzleti logika nagyon egyszerű. Amíg a terméked minden dimenzióban jobb, mint a versenytársaidé, addig profitálni fogsz. Marad a kérdés, hogy mekkora a teljes piac? Jelenleg vállalatunk erős piaci pozícióval rendelkezik, így a könnyen elérhető bevételi lehetőségek nagy részét már megragadtuk.

TMT: Mit ért a „könnyen elérhető bevétel” alatt?

Wang Xingxing: Abból, hogy nagy szállítási volumenekkel rendelkezünk. Tavaly elég sok négylábú és humanoid robotot adtunk el.

TMT: Hányat adtak el?

Wang Xingxing: Nehéz pontosan megmondani, de néhány száz alatt van. A legtöbbet azonban egyértelműen a hazai piacon adtuk el.

TMT: Ki vette meg őket?

Wang Xingxing: Különböző vásárlók, köztük kutatóintézetek, AI-vállalatok és valós alkalmazásokat folytató vállalkozások.

TMT: Hogyan tudtok ilyen gyorsan haladni, és hogyan sikerül eladni a termékeket?

Wang Xingxing: Mert erős alapokkal rendelkezünk. A robotkutyák és a humanoid robotok között jelentős átfedés van. Vállalatunk előnyökkel rendelkezik a műszaki K+F, az AI-algoritmusok, a gyártás és az értékesítési csatornák terén. Már megalapozott ügyfélkörrel és piackész termékekkel rendelkezünk. Más cégeknek mindent a nulláról kell felépíteniük, ami időbe telik.

TMT: Elégséges a bevételük a kutatás-fejlesztés támogatására?

Wang Xingxing: Vállalatunk egészséges bruttó haszonkulcsot tart fenn, amit folyamatos finanszírozás egészít ki.

TMT: A humanoid robotokkal foglalkozó startupok számára a finanszírozás biztosítása alapvető előny?

Wang Xingxing: Jelenleg nehéz megítélni az iparágat, mert túl forró. Sok alapítványi alapokkal rendelkező vállalat szerzett némi forrást, ami legalább ahhoz elég, hogy a felszínen tartsa őket.

Ebben az iparágban biztosan nincs hiány pénzeszközökből. Amikor mi kezdtük, szegények voltunk. Az akkoriakhoz képest most teljesen más a helyzet. Most néhány cég csak egy éve van jelen, és már 1 milliárd jüanra értékelik őket. Ez elképesztő. Az iparág nem szűkölködik tőkében, és ők sem.

De úgy gondolom, hogy mielőtt az iparág igazán felpörögne, a túl sok pénznek nincs értelme. Nehéz hatékonyan elosztani, és ha válogatás nélkül költjük el, könnyen elpazarolhatjuk. Ebben a szakaszban még sem a technológia, sem az üzleti modellek nincsenek teljesen validálva, ezért nem lenne bölcs dolog a pénzzel szórni.

Vegyük például a kerékpármegosztást. Azért működött, mert az üzleti modellnek volt értelme. Ha ez bebizonyosodott, már csak a méretnövelés van hátra, és nincs más hátra, mint a finanszírozás.

TMT: Mire gondol, amikor azt mondja, hogy a technológia és az üzleti modell még nem teljesen validált?

Wang Xingxing: Ez azt jelenti, hogy sem a technikai keret, sem a kereskedelmi stratégia nincs teljesen kidolgozva.Még ha meg is van a tőke, nem feltétlenül tudja, hogyan kell azt hatékonyan felhasználni.

TMT: Melyek a fő technikai kihívások?

Wang Xingxing: A humanoid robotok esetében a legnagyobb kérdés az, hogyan integrálhatóak a mesterséges intelligencia modellekkel - erre még nincs végleges válaszunk.

TMT: Egy másik megfigyelés - a legtöbb humanoid robotokkal foglalkozó vállalkozó ma meglehetősen fiatal (WangXingxing a 90-es évek generációjából származik.) Miért van ez?

Wang Xingxing: Ez egyszerű. Az idősebb generációkat egyszerűen nem érdekli annyira ez a terület. A mesterséges intelligencia technológia soha nem látott ütemben fejlődik, és a régebbi tudás elavul - az öt évvel ezelőtti technológiával kapcsolatos tudás gyakorlatilag irreleváns. A fiatalabb generáció tanulja meg és alkalmazza a leggyorsabban az új fejlesztéseket. A hagyományos internetes startupoknál alacsony volt a belépési korlát - gyakorlatilag bárki lehetett termékmenedzser. De a humanoid robotika nem egy hagyományos iparág.

[Angela: Korábban már írtunk arról, hogy a feltörekvő technológia ezen generációja teret ad a fiatal, lelkes tehetségeknek, hogy hatást gyakoroljanak - a DeepSeekjó példa erre.Érdekes lenne tudni, hogy a DeepSeek-hez hasonlóan az Unitree is a kínai hazai tehetségekből meríti-e sikerét.WangXingxing maga soha nem tanult vagy dolgozott külföldön.]

TMT: Korábban említette az áttörést jelentő innováció lehetőségét. Arra utalt, hogy a humanoid robotok és a mesterséges intelligencia modellek hogyan integrálhatók?

Wang Xingxing: Igen, többé-kevésbé.

TMT: De az AI-modellek nem csak moduláris elemek, amelyeket össze lehet rakni, mint az építőelemeket?

Wang Xingxing: Az AI-modellek közötti különbségek ennél sokkal mélyebbek. Vegyük például a Transformer architektúrákat - ezek optimalizálására és finomítására még mindig végtelen sok lehetőség van. A kutatók még a Transformer-alapú modellek alternatíváit is vizsgálják. A mesterséges intelligencia területe tele van a technikai áttörések lehetőségeivel, és az innovációnak még mindig hatalmas tere van.

Várakozásaim szerint 2025-re jelentősen továbbfejlesztett mesterséges intelligencia-modelleket láthatunk majd az általános célú humanoid robotok számára. Amikor ez megtörténik, az iparág lendülete még inkább felgyorsul, olyannyira, hogy a világ minden tájáról próbálnak majd belépni cégek.

TMT: Ön szerint ekkor a hardver vagy a szoftver lesz az első, amely áttörést hoz?

Wang Xingxing: A szoftver lesz a fő hajtóerő. Nem számít, hogy mennyire fejlett a hardver, a megfelelő szoftver nélkül csak egy drága fémkupac.

TMT: Tehát a fejlődés jelenlegi ütemét tekintve, amint megjelenik a megfelelő szoftver, a hardver is képes lesz lépést tartani vele?

Wang Xingxing: Természetesen. A hardver nem lesz szűk keresztmetszet. Ha most tényleg szükség van rá, agresszív tőkekihelyezéssel gyorsan meg tudjuk növelni a termelést. Ha szükséges, a gyártási kapacitást a végletekig ki tudjuk terjeszteni - a mérnököknek a szokásos fizetésük tízszeresét fizetjük, éjjel-nappal dolgozunk, és megvásároljuk az összes szükséges berendezést. Elegendő befektetéssel akár néhány hónap és egy év alatt is beindíthatnánk a tömeggyártást.

TMT: Hogyan viszonyul Kína hardveres képességei más országokéhoz képest?

Wang Xingxing: Kína jelentős előnnyel rendelkezik a hardverek terén. Az ár-érték arány sokkal magasabb.

TMT: Miért van ez így?

Wang Xingxing: Az USA-ban a hardverfejlesztés nem kap akkora figyelmet - a legtöbb vezető tehetség a szoftverekre koncentrál. Másodszor, az USA-ban a gyártási és munkaerőköltségek sokkal magasabbak, mint Kínában.

TMT: Úgy tűnik, mintha a szoftvereket helyeznék előtérbe, míg a mi erősségünk a hardverekben rejlik.

Wang Xingxing: Pontosan. A legtöbb nagy amerikai vállalat elsősorban a szoftverekre összpontosít. De mi a Unitree Robotics-nál a szoftvert és a hardvert is fejlesztjük, mert a versenyképesség fenntartásához teljes körű képességekre van szükség. Viszonylag kisebb vállalatként nem engedhetjük meg magunknak, hogy csak egy területre koncentráljunk. A nagyvállalatok megúszhatják a szoftverekre való specializálódást és a hardverek kiszervezését, de számunkra a hardverfejlesztés feladása nem lenne bölcs stratégiai lépés.

TMT: Miért érik gyorsabban a robotkutyás technológia, mint a humanoid robotika?

Wang Xingxing: Az egyik ok az, hogy a robotkutyák már hosszabb ideje fejlesztés alatt állnak, és a formájuk stabilabb. Nincs szükségük összetett ügyes manipulációra, például tárgyak megfogására és kezelésére.

A másik fő ok az, hogy a múltban sokkal nagyobb volt a robotkutyákon dolgozó fejlesztők közössége, míg mára ez a szám csökkent. A mesterséges intelligenciában egy technológia érettsége gyakran közvetlenül összefügg azzal, hogy hány kutató dolgozik rajta aktívan.

Például a nagy nyelvi modellek sokkal gyorsabban fejlődtek, mint a robotikai mesterséges intelligencia, egyszerűen azért, mert több ember vesz részt a fejlesztésükben. Tíz évvel ezelőtt a számítógépes látás - különösen az arcfelismerés - aranykorát élte, mert nagyon sok kutató dolgozott rajta. A képalapú mesterséges intelligencia azért indult be, mert viszonylag könnyű volt vele kísérletezni; csak egy tisztességes számítógépre volt szükség.

A robotika azonban más tészta. Ehhez hardveres szimulációra és valós tesztelésre van szükség, ami sokkal nehezebbé teszi az egyének számára a részvételt. Ez az oka annak, hogy ez a terület lassabban fejlődik. Azonban, ahogy korábban említettem, az iparág most felgyorsult, mert egyre több ember lép be a területre. Ha több elme dolgozik egy problémán, az természetesen gyorsabb áttörésekhez vezet.

TMT: Van az UnitreeRobotics-nak világos termék-ütemterve és ütemterve?

Wang Xingxing: Minden évben új termékeket fogunk piacra dobni.

TMT: Mit képzel el a Unitree következő generációs robotjai számára?

Wang Xingxing: A következő generáció kétségtelenül felül fogja múlni a jelenlegi modelleket minden szempontból - megjelenés, teljesítmény, AI képességek és így tovább.

TMT: Tudna egy konkrét példát mondani?

Wang Xingxing: A célunk az, hogy a humanoid robotok valódi ipari feladatokat lássanak el- gyárakban dolgozzanak, segítsenek a gyártás összeszerelésében és a logisztikában.

TMT: Van már megjelenési ütemtervük a robotok következő generációjára?

Wang Xingxing: Xingxing: Ezt jelenleg nem célszerű nyilvánosságra hozni.

TMT: A Unitree Robotics már nyolc finanszírozási fordulón van túl. Számít arra, hogy a forrásgyűjtés felgyorsul a továbbiakban?

Wang Xingxing: Szerintem rendben leszünk. Ahogy az iparág egyre nagyobb figyelmet kap, egyre nagyobb érdeklődést tapasztalunk a befektetők részéről.

TMT: Ön szerint mi lesz a humanoid robotika végső jövője?

Wang Xingxing: A jövőben a humanoid robotok egész iparágakat definiálhatnak újra - a gyártástól és a szolgáltatásoktól kezdve a mezőgazdaságig, a bányászatig és az építőiparig.

Elképzelem a távoli jövőt, amelyben a kormányok humanoid robotok tízezreit vethetik be, hogy egész városokat építsenek az alapoktól kezdve. Ekkor az infrastruktúra teljesen automatizált lesz, a lakhatást ingyenesen biztosítják, és az embereknek nem kell többé dolgozniuk, mert a robotok tartják fenn az egész gazdaságot. Ez teljesen a lehetőségek között van.

Amikor jelenleg humanoid robotokról beszélünk, akkor nagyjából emberméretű gépeket képzelünk el. A valóságban azonban a humanoid robotok kisebb robotokat is tudnának építeni, és ezek a kisebb robotok még kisebbeket tudnának építeni. Ez a folyamat a végtelenségig folytatódhat, és mikroszkopikus méretű robotokhoz vezethet.

Végül olyan kicsi robotokat láthatunk majd, mint a biológiai sejtek. Ki tudja, mi fog akkor történni? Amit mi baktériumnak látunk, az valójában apró robotikus egység lehet. Az egész természeti környezetet az alapoktól kezdve átstrukturálhatnánk. Ha ez megtörténik, a kormányoknak szabályozásokra lesz szükségük, hogy megakadályozzák az ellenőrizetlen elszaporodást, különben ezek a robotok ellenőrizhetetlenül felemésztenék az erőforrásokat.

[Angela: Valóban nagyon sci-fi vízió.Wang fantáziája a robotgazdaságról azonban egybecseng Pekingnek az ipari robotikába, a gazdasági fejlődés útjábatörténő beruházásával.A ChinaTalk továbbra is nyomon követi a robotika ilyen jellegű fejlesztéseit].

TMT: Gondolja, hogy még a mi életünkben láthatunk ilyen szintű technológiai fejlődést?

WangXingxing: Természetesen. Az egyetlen hiányzó darab a mesterséges intelligencia. Amint megtörténik az AI áttörése, minden más természetesen követni fogja.

Ez alapvetően át fogja alakítani a világot. Mindig is úgy gondoltam, hogy ha az általános célú mesterséges intelligencia és a humanoid robotok megjelenése után visszatekintünk a mai társadalomra, az olyan távoli és primitív lesz, mint a kőkorszak.

Szerzők: //substack.com/@angelash">Angela Shenés //substack.com/@voidpoliticstaiwan">Lily Ottinger2025. március 12.

Forrás: https://www.chinatalk.media/p/unitree-ceo-on-chinas-robot-revolution?utm_source=share&utm_medium=android&r=2cxqch&triedRedirect=true

Fordította: Naetar-Bakcsi Ildikó