一、自主機器人的系統組成
1、視覺系統
負責感知球(qiu)場(chang)上(shang)的態(tai)勢,視覺系統(tong)獲得球(qiu)場(chang)上(shang)的實時(shi)圖像,對圖像進行顏色(se)分割,識別(bie)出球(qiu)場(chang)上(shang)的各個目(mu)標,然后(hou)進行距離校(xiao)正,將結果發給決策程序。
2、決策系統
接收視覺(jue)系(xi)統的辨(bian)識結果,對球場(chang)態勢(shi)進行(xing)分析,然后(hou)做(zuo)出(chu)合(he)理決策,將命令發送給底層控制(zhi)系(xi)統。
3、底層控制系統
通過串口接收(shou)上位機(ji)的命令,控制(zhi)各輪走(zou)行電機(ji)按照(zhao)指定(ding)速度(du)運(yun)行,控制(zhi)彈射和持(chi)球電機(ji),將(jiang)底層(ceng)傳感(gan)器的數據通過串口發(fa)送給(gei)上位機(ji) 。
4、通信系統
通過無線(xian)網絡聯系場內機器人和場外(wai)計算機,進行遙控測試,參數設(she)置等(deng)操作以及控制比賽的開始和終(zhong)止。
二、自主機器人如何實現學習
絕大(da)多數的(de)(de)基于行(xing)為(wei)的(de)(de)實現方法(fa)都是對(dui)(dui)(dui)不同的(de)(de)任務(wu)進(jin)行(xing)手工編程的(de)(de),這(zhe)需要編程人(ren)員(yuan)能(neng)(neng)充分地考慮(lv)到各(ge)種可能(neng)(neng)出(chu)現的(de)(de)情況,對(dui)(dui)(dui)機器人(ren)與環(huan)境(jing)之間的(de)(de)交互(hu)有充分的(de)(de)理解,雖然有些設計出(chu)的(de)(de)系統(tong)對(dui)(dui)(dui)于很多任務(wu)和環(huan)境(jing)而言性能(neng)(neng)都是魯(lu)棒的(de)(de),但(dan)系統(tong)對(dui)(dui)(dui)環(huan)境(jing)并(bing)不具有適應(ying)性。
人不能(neng)窮盡一切可能(neng)。機器人能(neng)否通過學習(xi)獲得不能(neng)由程序(xu)員手工編(bian)碼進去的知識,比如構建一個未知環境(jing)的地圖,在任何環境(jing)的性質隨(sui)時間變化的任務中都是(shi)必要的。
當機(ji)器(qi)人元件老化后,機(ji)器(qi)人的(de)傳(chuan)感(gan)器(qi)和執行機(ji)構的(de)性質是可能(neng)會發生改變的(de)。
機器人(ren)在(zai)多機器人(ren)的(de)(de)(de)環境中(zhong)執行,由于需要對其(qi)他(ta)機器人(ren)作出反應,它(ta)(ta)的(de)(de)(de)策略是需要改變的(de)(de)(de)。學習方法(fa)(fa)在(zai)這(zhe)些情況下都能(neng)發(fa)揮重要的(de)(de)(de)作用。用學習方法(fa)(fa)為機器人(ren)進行編(bian)程(cheng),而無(wu)須告(gao)訴它(ta)(ta)怎(zen)樣達到(dao)它(ta)(ta)的(de)(de)(de)目標(biao),只(zhi)要告(gao)訴它(ta)(ta)目標(biao)是什么,讓它(ta)(ta)通過學習去(qu)滿足這(zhe)個目標(biao),無(wu)疑,這(zhe)種方法(fa)(fa)具有很大的(de)(de)(de)吸(xi)引(yin)力。它(ta)(ta)是提高機器人(ren)的(de)(de)(de)適應性(xing),降低編(bian)程(cheng)人(ren)員編(bian)程(cheng)強度的(de)(de)(de)必由之路。
分類
機器(qi)人(ren)有不(bu)同層次的(de)行為,它們由(you)不(bu)同層次的(de)信(xin)息表達所決定,因此就存在(zai)著不(bu)同類型(xing)的(de)學(xue)習。Broo ks和Mataric總結出了(le)以下類型(xing)的(de)學(xue)習:
1、為傳感設備標定或(huo)則參數(shu)調節進行學(xue)習(xi)。這種類(lei)型的(de)學(xue)習(xi)只(zhi)在一個特定行為結(jie)構中優(you)化操(cao)作參數(shu)。
2、學(xue)習真實世(shi)(shi)界的知識。這種(zhong)類型(xing)的學(xue)習構建與修改(gai)機(ji)器(qi)人(ren)(ren)對(dui)于真實世(shi)(shi)界的內部表(biao)達,以利于機(ji)器(qi)人(ren)(ren)作出(chu)行為規劃(hua)和決策等高層(ceng)的智能行為。
3、學(xue)習已有(you)行(xing)為的(de)(de)協調。這種類型的(de)(de)學(xue)習中通過(guo)協調已經(jing)存在的(de)(de)行(xing)為被觸發和被執行(xing)的(de)(de)順序來改(gai)變它(ta)們(men)對(dui)世界(jie)的(de)(de)作用。
4、學習新的行為。這種類型的學習建立新的行為結構。
實際問題
機器人(ren)領域對(dui)任何(he)學習算法而言都是一個挑戰。在構建擁有學習能力,能自動進(jin)行知識獲取的(de)自主(zhu)機器人(ren)的(de)過程中必須面對(dui)許多煩瑣的(de)有關真實(shi)世界的(de)問題(ti)。
1、傳(chuan)(chuan)感器(qi)噪聲。大多數機器(qi)人的(de)傳(chuan)(chuan)感器(qi)是(shi)不可靠的(de)。于是(shi)由傳(chuan)(chuan)感器(qi)信號得到的(de)狀態(tai)描述注定是(shi)不精確的(de)。學習算法(fa)必須能夠(gou)處理噪聲,因此經常需要用統(tong)計平滑技術克服噪音的(de)影響。
算法(fa)(fa)的易駕馭性(xing)。機器人必(bi)(bi)須(xu)對(dui)不(bu)可預見的環境進行實時響應(ying)。因此學習算法(fa)(fa)必(bi)(bi)須(xu)不(bu)能過(guo)于復雜,算法(fa)(fa)的每一次迭代(dai)都必(bi)(bi)須(xu)能實時地完成。
2、增量(liang)式的算法。學(xue)習(xi)(xi)算法必(bi)須允許機器人邊學(xue)習(xi)(xi)邊改善(shan)自(zi)己(ji)的性(xing)能。因為機器人必(bi)須一邊收集經(jing)驗(yan)一邊進行學(xue)習(xi)(xi). 形成經(jing)驗(yan)的數據不能離線(xian)獲得(de)。
3、有限的(de)訓練時(shi)間。機器人(ren)的(de)訓練時(shi)間是(shi)非常有限的(de)。學習算法必須(xu)在合理(li)的(de)運算次數中(zhong)收斂,因(yin)為機器人(ren)需要完成任務,在真實的(de)機器人(ren)上進行(xing)上百萬次的(de)動作是(shi)極為困難的(de)。
堅實的(de)(de)信(xin)息(xi)來源。 所有機(ji)器人(ren)可以獲(huo)得的(de)(de)信(xin)息(xi)都必須最終(zhong)來至從它的(de)(de)傳感器抽取得到的(de)(de)信(xin)息(xi)或初始狀態時(shi)強行編碼進去的(de)(de)知識。由(you)于狀態信(xin)息(xi)是由(you)傳感器數據計算得到的(de)(de),學習算法必須能(neng)(neng)和感知設備的(de)(de)限制(zhi)一(yi)起工(gong)作(zuo).明顯地,能(neng)(neng)否解決(jue)以上提出的(de)(de)一(yi)些問題(ti)決(jue)定了用在真實機(ji)器人(ren)上的(de)(de)學習算法的(de)(de)成功與否。
學習方法
在(zai)機(ji)器(qi)人(ren)研究領(ling)域(yu)中有三種主(zhu)要(yao)的學(xue)習(xi)(xi)(xi)方法(fa)(fa)(fa)變(bian)得(de)越來越流行。它們(men)是強(qiang)化(hua)學(xue)習(xi)(xi)(xi)( RL) ,進化(hua)方法(fa)(fa)(fa)( GA和EP)和基(ji)于人(ren)工神經(jing)網(wang)絡( ANN )的方法(fa)(fa)(fa)。其(qi)中應用(yong)得(de)最為廣泛的方法(fa)(fa)(fa)是強(qiang)化(hua)學(xue)習(xi)(xi)(xi)方法(fa)(fa)(fa).在(zai)學(xue)習(xi)(xi)(xi)新(xin)的行為和學(xue)習(xi)(xi)(xi)協調已經(jing)存在(zai)的行為兩(liang)種情況下都可以(yi)用(yong)到強(qiang)化(hua)學(xue)習(xi)(xi)(xi)的方法(fa)(fa)(fa)。 強(qiang)化(hua)方法(fa)(fa)(fa)是一種無監(jian)督的學(xue)習(xi)(xi)(xi)算法(fa)(fa)(fa),它比較好地符合(he)人(ren)們(men)解決問題的心(xin)理習(xi)(xi)(xi)慣,和傳統人(ren)工智(zhi)能以(yi)及優化(hua)算法(fa)(fa)(fa)聯(lian)系(xi)緊(jin)密,有普遍適的用(yong)性,因此(ci)獲得(de)了最廣泛的關注。
申明:以上方法源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,證明有效,請注意甄別內容來源的真實性和權威性。