本發(fā)明公開(kāi)了一種融合Q?學(xué)習(xí)與雙線權(quán)值算法的多機(jī)器人協(xié)同任務(wù)分配方法,包括:設(shè)定多機(jī)器人系統(tǒng)雙線無(wú)權(quán)值任務(wù)分配實(shí)例;構(gòu)建馬爾可夫決策過(guò)程,設(shè)定訓(xùn)練參數(shù),根據(jù)Q?學(xué)習(xí)算法對(duì)多機(jī)器人系統(tǒng)雙線無(wú)權(quán)值任務(wù)分配實(shí)例進(jìn)行訓(xùn)練,不斷更新Q值表,找到完...