一種動(dòng)態(tài)環(huán)境下空間機器人的快速路徑規劃方法
摘要:針對動(dòng)態(tài)環(huán)境下空間機器人采用深度強化學(xué)習進(jìn)行路徑規劃時(shí)存在的收斂速度慢問(wèn)題,采用遷移學(xué)習算法設計了一種適應動(dòng)態(tài)環(huán)境的快速路徑規劃器.首先,綜合考慮空間機器人運動(dòng)過(guò)程中存在的避障、時(shí)間和擾動(dòng)約束,在靜態(tài)環(huán)境下對深度神經(jīng)網(wǎng)絡(luò )進(jìn)行預訓練.其次,將上述訓練后的權值作為動(dòng)態(tài)環(huán)境下深度神經(jīng)網(wǎng)絡(luò )的初始權值,再經(jīng)過(guò)動(dòng)態(tài)環(huán)境下的訓練進(jìn)行參數微調.最后,以平面五自由度空間機器人為例對所設計的方法進(jìn)行了驗證,并與直接訓練方法進(jìn)行了比較.實(shí)驗結果表明,該方法能夠將訓練收斂時(shí)間從1033回合縮短到450回合,在保證規劃路徑準確率的前提下,提高訓練的收斂速度.
注: 保護知識產(chǎn)權,如需閱讀全文請聯(lián)系空間控制技術(shù)與應用雜志社