ClutterGen:用于機(jī)器人學(xué)習(xí)的雜亂場(chǎng)景生成器 原創(chuàng)
模擬在推動(dòng)機(jī)器人學(xué)習(xí)方面發(fā)揮了重要作用,通過提供一個(gè)受控而多變的環(huán)境來開發(fā)和測(cè)試算法。特別是數(shù)據(jù)驅(qū)動(dòng)方法通常將機(jī)器人部署到仿真環(huán)境中,在各種多樣化和隨機(jī)化的設(shè)置中進(jìn)行廣泛訓(xùn)練,以實(shí)現(xiàn)可泛化和適應(yīng)性強(qiáng)的行為。通過隨機(jī)化物體形狀、紋理和動(dòng)態(tài)特性,機(jī)器人學(xué)習(xí)取得了顯著進(jìn)展。然而,盡管物體屬性是一個(gè)關(guān)鍵因素,但物體布局仍然具有挑戰(zhàn)性,難以實(shí)現(xiàn)完全開放式的隨機(jī)化。與可以在不干擾其他物體的情況下輕松指定范圍的物體屬性不同,物體布局必須考慮其他物體的存在和物理可行性。例如,在場(chǎng)景中布置物體需要確保它們不重疊,并且放置在穩(wěn)定的位置,而不是從空中掉落。現(xiàn)有的努力通常通過固定物體的基礎(chǔ)來解決這個(gè)問題,但這種策略對(duì)于像瓶子或杯子等許多物體并不適用。隨著物體數(shù)量在有限空間內(nèi)的增加,生成隨機(jī)化而又穩(wěn)定的物體布局變得指數(shù)級(jí)困難。圖(a)展示了使用廣泛采用的隨機(jī)采樣和拒絕失敗軌跡的方法在桌子上放置七個(gè)物體時(shí)遇到的挑戰(zhàn)。其他方法需要人工手動(dòng)指定物體區(qū)域以進(jìn)行局部隨機(jī)化,或者將可能的放置空間離散化以避免碰撞。然而,導(dǎo)航和操作混亂環(huán)境是將機(jī)器人學(xué)習(xí)應(yīng)用于現(xiàn)實(shí)世界的重要挑戰(zhàn)。
近日,杜克大學(xué)研究人員提出了ClutterGen,一個(gè)物理上可適應(yīng)的仿真場(chǎng)景生成器,能夠生成多樣化、混亂且穩(wěn)定的場(chǎng)景,用于機(jī)器人學(xué)習(xí)。生成這樣的場(chǎng)景具有挑戰(zhàn)性,因?yàn)槊總€(gè)物體都必須遵守重力和碰撞等物理法則。隨著物體數(shù)量的增加,找到有效的姿勢(shì)變得更加困難,需要大量的人工工程工作,這限制了場(chǎng)景的多樣性。為了克服這些挑戰(zhàn),研究人員提出了一種強(qiáng)化學(xué)習(xí)方法,可以利用仿真器提供的基于物理的獎(jiǎng)勵(lì)信號(hào)進(jìn)行訓(xùn)練。ClutterGen是一個(gè)自回歸仿真場(chǎng)景生成器,用于創(chuàng)建物理合規(guī)且高度多樣化的混亂場(chǎng)景。通過將混亂場(chǎng)景生成視為強(qiáng)化學(xué)習(xí)問題,ClutterGen從3D觀測(cè)中學(xué)習(xí)閉環(huán)策略,無需預(yù)先存在的數(shù)據(jù)集或人工規(guī)范。一旦訓(xùn)練完成,ClutterGen可以應(yīng)用于原始環(huán)境的各種變化,無需進(jìn)行精細(xì)調(diào)整。實(shí)驗(yàn)表明,ClutterGen可以在有限的桌面表面上生成包含多達(dá)十個(gè)物體的混亂物體布局。此外,該策略設(shè)計(jì)明確鼓勵(lì)生成場(chǎng)景的多樣性,以支持開放式生成。真實(shí)機(jī)器人實(shí)驗(yàn)結(jié)果表明,ClutterGen可以直接用于混亂重新排列和穩(wěn)定放置策略的訓(xùn)練。
譯自(有刪改):http://www.generalroboticslab.com/blogs/blog/2024-07-06-cluttergen/index.html
本文轉(zhuǎn)載自公眾號(hào)AIGC最前線
原文鏈接:??https://mp.weixin.qq.com/s/85u-GzpTesyko-Ma7dO-QQ??
