外文翻譯--機器人模仿控制論
《外文翻譯--機器人模仿控制論》由會員分享,可在線閱讀,更多相關(guān)《外文翻譯--機器人模仿控制論(10頁珍藏版)》請在裝配圖網(wǎng)上搜索。
遼寧科技大學(xué)本科生畢業(yè)設(shè)計 第 1 頁 4720, 510) 642a of as an to In we of in In we on of on of he of in of in to In we to as of a in an a in to a In 遼寧科技大學(xué)本科生畢業(yè)設(shè)計 第 2 頁 to a s to by on in c,f(et 1984;et 1988))as of by an In a is by at is to of to to of a of of et 1988;et 1989;992)). in is to an or to an In it’s of et 1984; et 1988)a as in it is at is in My in 987, as a of of a of my My in of he me to At in to be i (1986), 1987) en 1988). In of 遼寧科技大學(xué)本科生畢業(yè)設(shè)計 第 3 頁 in of on of or it it be at it in of or be of in be a us of in In of to it is to so of In of to be in In in is by in of of a of of of to of on i) In is of in at c,f(i,1987;987;989))of In in is of a is in is as is of a in in is It to us in to in of it to to of an 遼寧科技大學(xué)本科生畢業(yè)設(shè)計 第 4 頁 by We 990) of so In of we to by in a et 1990). as et 1988; et 1989; et 1990), of be in or in of in in as so et 1988;et 1989),of at of of is by to of at of of so is of a of in a so a of be by or a in a to a of a to a in I on of of to in to of at of do a at in be is at 遼寧科技大學(xué)本科生畢業(yè)設(shè)計 第 5 頁 of at a be as of to do of in us as an of In a of be in or in of in a of of a a to or of is in it is so to to to to in 987) of so (In an is to in an is by in to of to to in to be et 1991) we a of on in to of to In in of of of of by is in to of of in of in of 遼寧科技大學(xué)本科生畢業(yè)設(shè)計 第 6 頁 of of of to of it is to of we of in on on of in in 遼寧科技大學(xué)本科生畢業(yè)設(shè)計 第 7 頁 機器人 模仿控制 論 羅伯特霍洛維茨 機械工程學(xué)系 加州大學(xué)伯克利分校 伯克利分校,加州 94720 ,美國 電話: ( 510 ) 642子郵箱: 要 模仿 控制涵蓋了一類可編程機器 的 控制算法,如機器人 的動作 就是 通過一個互動的進程, 以及能讓 機器來執(zhí)行復(fù)雜任務(wù) 的機動馬達來實現(xiàn)的 。在本文中,我們討論了 機器人模仿 控制器功能的識別和自適應(yīng)控 制算法 的使用 。 我們 還特別 討論 了在積分變換基礎(chǔ)上 改 進 模仿 方案 ,重復(fù)控制器和自適應(yīng)模仿 方案 的 異同 , 突出 了在 積分變換 基礎(chǔ)上 自適應(yīng)模仿算法 的 穩(wěn)定性和收斂性 ,并 給 出 了 表明其中 一些特性 的 實驗結(jié)果。 關(guān)鍵詞:模仿控制,自適應(yīng)控制,重復(fù)控制,機器人 導(dǎo)言 機器人 技術(shù) 和 模仿 人類 的 人工智能 一直是最難以實現(xiàn)的追求和目標。 雖然關(guān)于 人 類許多方面 的 模仿 仍然沒有得到很好的 實現(xiàn) , 但是 在模仿 人類如何 獲得 執(zhí)行復(fù)雜的動 作所必 需 的運動技能 上, 機器人運動控制已經(jīng)取得了 很大 進展。在本文中,我們將參照 模仿控制器類的控制系統(tǒng), 生 成 一個 以 迭代方式 進行的控 制 動作,并 運 用功能適應(yīng)算法,以執(zhí)行規(guī)定的 動作 。在典型的 模仿 控制應(yīng)用 軟件中,測試系統(tǒng)測試出錯誤信號后 便 更新控制輸入,而 適應(yīng)算法 也因此不斷地 提高控制系統(tǒng)的性能 ,從而受控制的機器可以反復(fù) 執(zhí)行規(guī)定的任務(wù) 。 在 研究 機器人運動控制 的 領(lǐng)域里 ,模仿控制這一術(shù)語 也許是第一次 為 他的同事們 所 使用 (c,f(et 1984;et 1988))。 模仿控制定義為 通過 迭代 方式 改善進程 從而 達到零誤差漸近跟蹤 的一類 控制算法, 他也把它命名為 模仿。在這個過程中 , 機器人總 是從相同的初始條件 開始,在 一個單一的有限 度的范圍內(nèi)進行反復(fù)的任務(wù)追蹤 。 控制動作的 每 次測試 結(jié)果 相當于控制動作的 前 一次測試結(jié)果 再加上加上 條 件 比例跟蹤誤差及其時間導(dǎo)數(shù)。 遼寧科技大學(xué)本科生畢業(yè)設(shè)計 第 8 頁 與 模仿和改善控制 方案 并行發(fā)展的是 ,大量的研究已經(jīng) 直接 針對機器人軌跡跟蹤重復(fù)控制算法的應(yīng)用和其他運動控制問題 (et 1988;et 1989;992))。重復(fù)控制的基本目標是 消 除 不明 周期 干擾或 跟蹤 未知定期參考軌跡。在它最簡單的形式 中 ,許多重復(fù)控制算法 的 定期信號發(fā)生器 與 改善模仿 規(guī)律很 相似 (et 1984; et 1988)。然而,在模仿過程中的行為改善控制器有 時間界限 ,該行為不斷重復(fù)控制器 上調(diào)節(jié) 器 的動作 。此外, 對于 模仿 改善 的方法,假定 機器人 在 每一 次 模仿 試驗 中 總是 從相同的初始條件開始執(zhí)行任務(wù) 的 ,但是這不是重復(fù)控制方法那種情況 。 我 在 模仿和重復(fù)控制 方面的興趣開始于 1987 年, 是因為那時我和 我的 校友及 同事起 學(xué)習(xí)研究了 一類 有關(guān) 機器人 自適應(yīng)和重復(fù)控制器穩(wěn)定 性 的知識 。我的同事和朋友 重復(fù)控制 這塊領(lǐng)域里 一直 都 非常積極地 去 研究 , 也是 他 把 我 引入 了這個 課 題。當時機器人 技術(shù) 和控制 領(lǐng)域里有很多人都積極的為 機器人 尋找 能 漸近穩(wěn)定的 自適應(yīng)控制算法 ,所以 這些算法 都必須通過嚴格的 證 明 。 最近, i(1986), 987 以及 988)已經(jīng)通過運 用鈍性解決了這個問題。 與此相反 的是 , 在那 一時期大部分模仿和重復(fù)控制的的穩(wěn)定 性 成果 都是建立在 幾個不現(xiàn)實的假設(shè) 之上的,或者 是動態(tài)的機器人線性假定,或者 是 被認為可能是至少部分線性反饋控制。此外, 還 有人認為在大多數(shù)工程 中 ,即使 是 短暫的模仿 , 機器人 的 實際反應(yīng) 也 是定期或重復(fù)的,并 且還 可直接 測量出 聯(lián)合加速度 。 最近我 和 們的自適應(yīng)控制研究 中 已 證明了這種說法 ,并得出結(jié)論 ,我們 認為模仿控制器 可 使用類似的做法 進行 合成和分析。 我們覺得,模仿和控制器的主要優(yōu)點 在于它的簡單和直接。在 機器人軌跡控制 的其他方法中 , 還 包括參數(shù)自適應(yīng)控制, 但是 有必要計算 一下 所謂的 機器人 逆動力學(xué)方程。在許多 類似 的 方法中, 這些方程必須 以 實際 時間 計算 。 相反,在改善模仿和重復(fù)控制 的方法中 , 動作的控制是由 簡單功能 的自 適應(yīng) 算法相關(guān) 產(chǎn)生的 。此外 , 由于 在工業(yè) 應(yīng)用 的 大多數(shù)機器人涉及重復(fù)執(zhí)行同樣的任務(wù), 那么 實現(xiàn) 一個 不需要任何一個 有 經(jīng)驗或者具備一定 知識結(jié)構(gòu)的機器人運動方程 而僅 通過實踐 “ 模仿 ” 的 控制算法 的想法 ,也非常 具有吸引力 成模仿控制器的 方法 根 據(jù)如下見解:一)在模仿控制 方面 ,電機靈巧 度 不是通過使用獲得的反饋 來實現(xiàn)的 。這是 當時大部分 自適應(yīng)控制器采用的 方法 (c,f(i,1987; 987;989))。在這些自適應(yīng) 的方法中, 非線性控制 規(guī) 律和參數(shù)調(diào)整算法的 遞減都是 實 遼寧科技大學(xué)本科生畢業(yè)設(shè)計 第 9 頁 際機器人關(guān)節(jié)坐 標和速度 的性 能 。二)與此相反,在模仿控制算法 中 ,機動靈活 的 獲得是 通過使用一種前饋控制 的動作 ,這是存儲在內(nèi)存 中的,當執(zhí)行任務(wù)時便可以檢索出來。但是 模仿 的 過程中 要 涉及 到 調(diào)整前饋 動作后 功能 的適應(yīng)性 。三) 反饋信息在使 系統(tǒng) 穩(wěn)定和保證前饋功能誤差和跟蹤誤差 之間映射的 嚴格被動 中發(fā)揮著基礎(chǔ)性的作用 。因此,很明顯,我們認 為 為了 在 模仿和反復(fù)算法綜合和分析 中的 自適應(yīng)控制結(jié)果 的基礎(chǔ)上使用被動 ,有必要 計算 和證明自適應(yīng)控制法的穩(wěn)定, 即能 實現(xiàn)機器人動態(tài)線性的前饋控制,而不是 反饋控制 。我們 把 這些結(jié)果 寫 在 ( 990)并有 所謂的期望補償自適應(yīng)律( 的介紹 。在這 個自適應(yīng) 方案 中, 非線性控制律和參數(shù)自適應(yīng)算法 遞減都是改變后 運動軌跡和速度 的性能 。后來我們就可以 通過 運 用 重復(fù)控制法 (et 1990)代替 自適應(yīng)法的 合成重復(fù)控制器的機器人手臂 了 。 不幸的是, 正如在 (et 1988; et 1989; et 1990)討論的一樣 ,漸近收斂的基 礎(chǔ)的重復(fù)控制 系統(tǒng) 只有在機械 動態(tài)或 局限性 干擾信號 的嚴格限 制性條件下才能保證。這些條件一 般 不適合 應(yīng)用在機器人 的 控制中。 大 多數(shù)情況下,更新 方案 后有相應(yīng)的修改 ,如所謂的 Q 濾波器修改 (et 1988;et 1989), 可以 增強重復(fù)控制器 強度 , 但是要 以犧牲限制其跟蹤性能 為代價 。同樣,就 機器人開始時的每一個模仿 實驗的初始條件而言,在合理的假設(shè)下, 融合改善模仿 方案 已經(jīng)得到證明 。到目前為止 ,我們討論的 改善模仿和重復(fù)控制 方案 的 另一個缺點 ,就是這些算法是為單一任務(wù)的迭代模仿而提出的 。在這些領(lǐng)域 里 沒有任何研究工作 可 提供拓展 模仿 工序的 一個 這樣的 機制, 它能使機器同時模仿大量 家務(wù)工作 ,或提 是 供一個系統(tǒng)的機制, 即運用通過模仿特殊任務(wù)獲得的靈活性 去 執(zhí)行 稍微 有點不同 但具有類似性質(zhì)的工作 。 在 教員 后 ,我 和 這些問題 進行了研究 。 我們的研究表明,本 質(zhì)改變 和重復(fù)控制 規(guī)律的巨大局限性 和 這些用來模仿多樣任務(wù)的算法的失效在某種程度上 源于一個事實, 即 所有這些 方案 都是 使用點對點功能適應(yīng) 算法。這些 算法 僅僅只更新了 控制輸入在當前即時的時間 內(nèi)的實用性,但并 沒有提供一種可以在相鄰時間內(nèi) 更新控制輸入 的 機制。然而,大多數(shù)應(yīng)用中的必須查明 的 控制功能,通常至少 是 分段連續(xù) 的 。因此,在某一特定點 上控制的實用性 將 和附近的點的實用性幾乎一樣 ,而 點對點 的 功能更新 規(guī) 律不 能 充分利用這種情況。這個 焦點 已 經(jīng) 更廣泛 地 影響模仿 問題 和可尋址 內(nèi)容 存儲器 的問題 。讓我們考慮 把機器人的多 任務(wù)模仿控制算法 的情 遼寧科技大學(xué)本科生畢業(yè)設(shè)計 第 10 頁 況 作為一個例子。在此應(yīng)用程序 中 , 幾個功能變量必須確定,即機器人的逆動力學(xué) 參數(shù) 。在有限的時間 內(nèi)用于訓(xùn)練 改善控制 的 軌道不能訪問 到主函數(shù) 每一個點(或載體)。因此,在用 點至點更新的 規(guī) 律 時,執(zhí)行一次 任務(wù) 中 控制輸入功能 的精確識別 將不會提供生成控制輸入任務(wù) 的 任何信息,除非其他類似的軌道相 交,或 者使用了 某種插值 。類似地, 在可 尋址內(nèi)容存儲器 中 ,可取的做法是模仿算法 應(yīng) 有一個 “ 插值 “ 的 性能 ,因此,輸入向量是類似以前的經(jīng)驗 輸入向量, 但對系統(tǒng)來說還是新的向量 ,輸出向量 還是 類似以前的經(jīng)驗 輸出載體。 在 機器人模仿控制 的 插值 問題上, ( 987)一書 提出 了 利用所謂的 “ 小腦模型算術(shù)計算機 ” (解決辦法 。 在 該算法 中,一個 輸入向量 被 映射到 在 中間記憶的幾個點上,而 輸出向量 是由總結(jié)存儲在輸入向量被映射到的所有點的值算出的 。輸入向量的 映射有一個特性就是在中間記憶中彼此靠近的輸入向量將映射在重疊的區(qū) 域, 這能 導(dǎo)致插值 的 自動 進 行。 在 (et 1991)中 ,我們介紹了 基于 積分變換 的 模仿控制系統(tǒng) 的 一類功能識別算法,以便處理 在上文提到的 點對點 的 重復(fù)性和模仿改善控制器的 強度 和插值問題。在這種自適應(yīng)模仿算法 中, 未知函數(shù) 是以 第一類積分方程 的形式 定義 的,這種積分方程由 已知的和未知的 核心 功能影響 函數(shù)組成 。模仿過程中涉及 到通過估計影響函數(shù)對未知函數(shù)的間接估計 。整個影響函數(shù)被 調(diào)整 成 與每一個點的核心值成 比例。因此,在更新影響 函數(shù)和發(fā)生函數(shù) 的估計 中核心值的使用為 這些算法提供了理想 的 插值和平滑 的性能 ,并且 克 服 了前面點對點改善和重復(fù) 控制 方案 的有關(guān)多變函數(shù) 估計中 的 限制 問題 。此外,積分變換 的運 用 使得這些模仿算法表現(xiàn)出強大的穩(wěn)定性和收斂性 成為可能 。 需要提醒的是,在 我們討論的 研究報告中 使用的機器人 環(huán)境 跟蹤模仿控制方面, 以及 強調(diào) 的 改善模仿 方案 和 重復(fù)控制 方案 及 模仿 方案 異同的 基礎(chǔ) 都是 積分變換。在這一領(lǐng)域一些未 得到解 決的問題 的 結(jié)論和思 考 將在后續(xù)介紹 。- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
6 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 外文 翻譯 機器人 模仿 控制論
鏈接地址:http://m.szxfmmzy.com/p-30309.html