埃隆·馬斯克在得克薩斯超級(jí)工廠的CNBC專訪中再次強(qiáng)調(diào),Optimus人形機(jī)器人將成為特斯拉產(chǎn)品線中的一顆璀璨明珠。為了支撐這一雄心勃勃的聲明,特斯拉官方Optimus社交媒體賬號(hào)發(fā)布了一段視頻,展示了Optimus在日常生活場(chǎng)景中的卓越表現(xiàn),這段視頻無疑是其能力展示中的巔峰之作。
視頻中,Optimus在家庭環(huán)境中大顯身手,無論是扔垃圾、使用清潔工具,還是撕紙巾、烹飪輔助,甚至是家居管理如開關(guān)窗簾,都顯得游刃有余。更令人驚嘆的是,它還能輕松地將一輛Model X的前連桿搬移到手推車上,展現(xiàn)了其強(qiáng)大的物理操作能力和精準(zhǔn)度。
值得注意的是,Optimus執(zhí)行這些復(fù)雜任務(wù)的基礎(chǔ)是一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)。特斯拉Optimus團(tuán)隊(duì)通過向機(jī)器人輸入大量人類執(zhí)行類似任務(wù)的第一人稱視頻數(shù)據(jù),使其能夠直接學(xué)習(xí)和模仿這些動(dòng)作。這一創(chuàng)新方法不僅提高了機(jī)器人的學(xué)習(xí)效率,更為其快速掌握和完善新技能奠定了堅(jiān)實(shí)基礎(chǔ)。
特斯拉Optimus項(xiàng)目副總裁Milan Kovac在社交媒體上分享了團(tuán)隊(duì)的最新進(jìn)展和未來規(guī)劃。他透露,團(tuán)隊(duì)正致力于讓Optimus能夠直接從互聯(lián)網(wǎng)視頻中學(xué)習(xí)人類執(zhí)行任務(wù)的方式,這包括第一人稱視角、第三人稱視角以及隨機(jī)攝像頭拍攝的內(nèi)容。這一能力的實(shí)現(xiàn),標(biāo)志著Optimus在智能學(xué)習(xí)方面取得了重大突破。
Kovac進(jìn)一步解釋說:“我們最近在將人類視頻知識(shí)轉(zhuǎn)移到機(jī)器人上取得了顯著進(jìn)展,目前雖然僅限于第一人稱視角,但這已經(jīng)讓我們能夠比僅依賴遠(yuǎn)程操作數(shù)據(jù)更快地開展新任務(wù)。遠(yuǎn)程操作不僅復(fù)雜,而且數(shù)據(jù)獲取有限。”他強(qiáng)調(diào),通過這一過程,Optimus正迅速涌現(xiàn)出眾多新技能,這些技能可以通過自然語(yǔ)言(無論是語(yǔ)音還是文本)進(jìn)行調(diào)用,并由機(jī)器人上的單一神經(jīng)網(wǎng)絡(luò)統(tǒng)一處理。
展望未來,特斯拉Optimus團(tuán)隊(duì)計(jì)劃進(jìn)一步擴(kuò)大其學(xué)習(xí)范圍,將第三人稱視頻的轉(zhuǎn)移學(xué)習(xí)納入其中,即利用隨機(jī)互聯(lián)網(wǎng)視頻作為學(xué)習(xí)材料。同時(shí),他們還將通過在真實(shí)世界或合成世界(模擬/世界模型)中進(jìn)行自我強(qiáng)化學(xué)習(xí),進(jìn)一步提升機(jī)器人的可靠性和性能。這一系列舉措無疑將推動(dòng)Optimus向更高層次的智能和實(shí)用性邁進(jìn)。