本發(fā)明一種基于優(yōu)勢函數(shù)引導(dǎo)注意力機(jī)制的機(jī)器人運(yùn)動控制方法及系統(tǒng),該方法步驟包括:S1.從離線數(shù)據(jù)集中提取多條歷史運(yùn)動軌跡數(shù)據(jù)構(gòu)成訓(xùn)練數(shù)據(jù)集,輸入至轉(zhuǎn)換器中進(jìn)行訓(xùn)練;S2.根據(jù)生成的動作集合以及狀態(tài)集合構(gòu)建雙狀態(tài)動作值網(wǎng)絡(luò)與價(jià)值網(wǎng)絡(luò),通過...