自主機器人的系統組成自主機器人如何實現學習

本文章由注冊用戶科技數碼行上傳提供評論發布反饋 0

摘要：自主機器人是其本體自帶各種必要的傳感器、控制器，在運行過程中無外界人為信息輸入和控制的條件下，可以獨立完成一定的任務的機器人。自助機器人主要由以下系統組成：視覺系統、決策系統、底層控制系統、通信系統。自助機器人最大的特點就是自主，但是對于自助機器人來說，如何學會學習和思考的方法才是最重要的。畢竟人類無法窮盡所有的問題，教會機器人自主思考才行。下面就一起看看自助機器人的知識吧！

一、自主機器人的系統組成

1、視覺系統

負責感知球(qiu)場(chang)上(shang)的態(tai)勢，視覺系統(tong)獲得球(qiu)場(chang)上(shang)的實時(shi)圖像，對圖像進行顏色(se)分割，識別(bie)出球(qiu)場(chang)上(shang)的各個目(mu)標，然后(hou)進行距離校(xiao)正，將結果發給決策程序。

2、決策系統

接收視覺(jue)系(xi)統的辨(bian)識結果，對球場(chang)態勢(shi)進行(xing)分析，然后(hou)做(zuo)出(chu)合(he)理決策，將命令發送給底層控制(zhi)系(xi)統。

3、底層控制系統

通過串口接收(shou)上位機(ji)的命令，控制(zhi)各輪走(zou)行電機(ji)按照(zhao)指定(ding)速度(du)運(yun)行，控制(zhi)彈射和持(chi)球電機(ji)，將(jiang)底層(ceng)傳感(gan)器的數據通過串口發(fa)送給(gei)上位機(ji) 。

4、通信系統

通過無線(xian)網絡聯系場內機器人和場外(wai)計算機，進行遙控測試，參數設(she)置等(deng)操作以及控制比賽的開始和終(zhong)止。

二、自主機器人如何實現學習

絕大(da)多數的(de)(de)基于行(xing)為(wei)的(de)(de)實現方法(fa)都是對(dui)(dui)(dui)不同的(de)(de)任務(wu)進(jin)行(xing)手工編程的(de)(de)，這(zhe)需要編程人(ren)員(yuan)能(neng)(neng)充分地考慮(lv)到各(ge)種可能(neng)(neng)出(chu)現的(de)(de)情況，對(dui)(dui)(dui)機器人(ren)與環(huan)境(jing)之間的(de)(de)交互(hu)有充分的(de)(de)理解，雖然有些設計出(chu)的(de)(de)系統(tong)對(dui)(dui)(dui)于很多任務(wu)和環(huan)境(jing)而言性能(neng)(neng)都是魯(lu)棒的(de)(de)，但(dan)系統(tong)對(dui)(dui)(dui)環(huan)境(jing)并(bing)不具有適應(ying)性。

人不能(neng)窮盡一切可能(neng)。機器人能(neng)否通過學習(xi)獲得不能(neng)由程序(xu)員手工編(bian)碼進去的知識，比如構建一個未知環境(jing)的地圖，在任何環境(jing)的性質隨(sui)時間變化的任務中都是(shi)必要的。

當機(ji)器(qi)人元件老化后，機(ji)器(qi)人的(de)傳(chuan)感(gan)器(qi)和執行機(ji)構的(de)性質是可能(neng)會發生改變的(de)。

機器人(ren)在(zai)多機器人(ren)的(de)(de)(de)環境中(zhong)執行,由于需要對其(qi)他(ta)機器人(ren)作出反應，它(ta)(ta)的(de)(de)(de)策略是需要改變的(de)(de)(de)。學習方法(fa)(fa)在(zai)這(zhe)些情況下都能(neng)發(fa)揮重要的(de)(de)(de)作用。用學習方法(fa)(fa)為機器人(ren)進行編(bian)程(cheng)，而無(wu)須告(gao)訴它(ta)(ta)怎(zen)樣達到(dao)它(ta)(ta)的(de)(de)(de)目標(biao)，只(zhi)要告(gao)訴它(ta)(ta)目標(biao)是什么，讓它(ta)(ta)通過學習去(qu)滿足這(zhe)個目標(biao)，無(wu)疑，這(zhe)種方法(fa)(fa)具有很大的(de)(de)(de)吸(xi)引(yin)力。它(ta)(ta)是提高機器人(ren)的(de)(de)(de)適應性(xing)，降低編(bian)程(cheng)人(ren)員編(bian)程(cheng)強度的(de)(de)(de)必由之路。

分類

機器(qi)人(ren)有不(bu)同層次的(de)行為，它們由(you)不(bu)同層次的(de)信(xin)息表達所決定,因此就存在(zai)著不(bu)同類型(xing)的(de)學(xue)習。Broo ks和Mataric總結出了(le)以下類型(xing)的(de)學(xue)習：

1、為傳感設備標定或(huo)則參數(shu)調節進行學(xue)習(xi)。這種類(lei)型的(de)學(xue)習(xi)只(zhi)在一個特定行為結(jie)構中優(you)化操(cao)作參數(shu)。

2、學(xue)習真實世(shi)(shi)界的知識。這種(zhong)類型(xing)的學(xue)習構建與修改(gai)機(ji)器(qi)人(ren)(ren)對(dui)于真實世(shi)(shi)界的內部表(biao)達，以利于機(ji)器(qi)人(ren)(ren)作出(chu)行為規劃(hua)和決策等高層(ceng)的智能行為。

3、學(xue)習已有(you)行(xing)為的(de)(de)協調。這種類型的(de)(de)學(xue)習中通過(guo)協調已經(jing)存在的(de)(de)行(xing)為被觸發和被執行(xing)的(de)(de)順序來改(gai)變它(ta)們(men)對(dui)世界(jie)的(de)(de)作用。

4、學習新的行為。這種類型的學習建立新的行為結構。

實際問題

機器人(ren)領域對(dui)任何(he)學習算法而言都是一個挑戰。在構建擁有學習能力,能自動進(jin)行知識獲取的(de)自主(zhu)機器人(ren)的(de)過程中必須面對(dui)許多煩瑣的(de)有關真實(shi)世界的(de)問題(ti)。

1、傳(chuan)(chuan)感器(qi)噪聲。大多數機器(qi)人的(de)傳(chuan)(chuan)感器(qi)是(shi)不可靠的(de)。于是(shi)由傳(chuan)(chuan)感器(qi)信號得到的(de)狀態(tai)描述注定是(shi)不精確的(de)。學習算法(fa)必須能夠(gou)處理噪聲,因此經常需要用統(tong)計平滑技術克服噪音的(de)影響。

算法(fa)(fa)的易駕馭性(xing)。機器人必(bi)(bi)須(xu)對(dui)不(bu)可預見的環境進行實時響應(ying)。因此學習算法(fa)(fa)必(bi)(bi)須(xu)不(bu)能過(guo)于復雜，算法(fa)(fa)的每一次迭代(dai)都必(bi)(bi)須(xu)能實時地完成。

2、增量(liang)式的算法。學(xue)習(xi)(xi)算法必(bi)須允許機器人邊學(xue)習(xi)(xi)邊改善(shan)自(zi)己(ji)的性(xing)能。因為機器人必(bi)須一邊收集經(jing)驗(yan)一邊進行學(xue)習(xi)(xi). 形成經(jing)驗(yan)的數據不能離線(xian)獲得(de)。

3、有限的(de)訓練時(shi)間。機器人(ren)的(de)訓練時(shi)間是(shi)非常有限的(de)。學習算法必須(xu)在合理(li)的(de)運算次數中(zhong)收斂，因(yin)為機器人(ren)需要完成任務，在真實的(de)機器人(ren)上進行(xing)上百萬次的(de)動作是(shi)極為困難的(de)。

堅實的(de)(de)信(xin)息(xi)來源。所有機(ji)器人(ren)可以獲(huo)得的(de)(de)信(xin)息(xi)都必須最終(zhong)來至從它的(de)(de)傳感器抽取得到的(de)(de)信(xin)息(xi)或初始狀態時(shi)強行編碼進去的(de)(de)知識。由(you)于狀態信(xin)息(xi)是由(you)傳感器數據計算得到的(de)(de)，學習算法必須能(neng)(neng)和感知設備的(de)(de)限制(zhi)一(yi)起工(gong)作(zuo).明顯地,能(neng)(neng)否解決(jue)以上提出的(de)(de)一(yi)些問題(ti)決(jue)定了用在真實機(ji)器人(ren)上的(de)(de)學習算法的(de)(de)成功與否。

學習方法

在(zai)機(ji)器(qi)人(ren)研究領(ling)域(yu)中有三種主(zhu)要(yao)的學(xue)習(xi)(xi)(xi)方法(fa)(fa)(fa)變(bian)得(de)越來越流行。它們(men)是強(qiang)化(hua)學(xue)習(xi)(xi)(xi)( RL) ，進化(hua)方法(fa)(fa)(fa)( GA和EP)和基(ji)于人(ren)工神經(jing)網(wang)絡( ANN )的方法(fa)(fa)(fa)。其(qi)中應用(yong)得(de)最為廣泛的方法(fa)(fa)(fa)是強(qiang)化(hua)學(xue)習(xi)(xi)(xi)方法(fa)(fa)(fa).在(zai)學(xue)習(xi)(xi)(xi)新(xin)的行為和學(xue)習(xi)(xi)(xi)協調已經(jing)存在(zai)的行為兩(liang)種情況下都可以(yi)用(yong)到強(qiang)化(hua)學(xue)習(xi)(xi)(xi)的方法(fa)(fa)(fa)。強(qiang)化(hua)方法(fa)(fa)(fa)是一種無監(jian)督的學(xue)習(xi)(xi)(xi)算法(fa)(fa)(fa)，它比較好地符合(he)人(ren)們(men)解決問題的心(xin)理習(xi)(xi)(xi)慣，和傳統人(ren)工智(zhi)能以(yi)及優化(hua)算法(fa)(fa)(fa)聯(lian)系(xi)緊(jin)密，有普遍適的用(yong)性，因此(ci)獲得(de)了最廣泛的關注。

申明：以上方法源于程序系統索引或網民分享提供，僅供您參考使用，不代表本網站的研究觀點，證明有效，請注意甄別內容來源的真實性和權威性。

標簽： 智能智能機器人科技數碼 ★

網站提醒和聲明

本站(zhan)為注冊(ce)用戶提供(gong)信(xin)息(xi)存儲空間(jian)服務，非“MAIGOO編輯(ji)上傳(chuan)(chuan)提供(gong)”的文章(zhang)/文字均是(shi)注冊(ce)用戶自主發布(bu)上傳(chuan)(chuan)，不(bu)代(dai)表(biao)本站(zhan)觀點，更不(bu)表(biao)示本站(zhan)支持購(gou)買(mai)和交易，本站(zhan)對(dui)網(wang)頁中內容的合法性、準確(que)性、真(zhen)實性、適(shi)用性、安(an)全性等概(gai)不(bu)負責。版權歸(gui)原作者所有(you)，如有(you)侵權、虛假信(xin)息(xi)、錯誤信(xin)息(xi)或任(ren)何問題，請及時聯系我(wo)們，我(wo)們將在第一時間(jian)刪除或更正。申請刪除>> 糾錯>> 投訴侵權>>

提交說(shuo)明：快速提交發布>> 查看提交幫助>> 注冊登錄>>