دانلود پایان نامه : کنترل ربات دو پا در حال جابجایی جسم به وسیله الگوریتم امپدانس چندگانه

در این فصل به تحقیقات صورت گرفته در زمینه رباتهای دوپا پرداخته میشود. اینکه چگونه مدل دو درجه آزادی Golliday وHemami[1] در سال 1976 به مدلهائی کاملتر و روشهای کنترل نیرو یا موقعیت به الگوریتمهای امپدانسی تبدیل شدهاند، مورد بحث قرار میگیرد. دیدگاه بهینهسازی و روشهای کنترل هوشمند به صورت خلاصه آورده شدهاند. سپس به نمونههائی از رباتهای دوپا که تاکنون ساخته شدهاند میپردازیم. در انتها هدف از انجام پروژه معرفی شده و مساًلهای را که به آن پرداختهایم تعریف میکنیم.

1-2-تلاشهای اولیه
اولین تلاشها برای شناخت دینامیک رباتهای دوپا جهت کنترل آنها به دهه 70 باز میگردد. در سال 1976 Golliday وHemami، از فیدبک[1] خطی جهت پایدارسازی مدل دو درجه آزادی و تعیین موقعیت قطبها جهت تحمیل مشخصات مطلوب به سیستم استفاده نمود. فیدبک خطی به طور کلی شامل فیدبک کردن تمام متغیرهای حالت به تمام عملگرها در سیستم است. در همین سال Hemami وCamana[2]، پایدارسازی ایستادن و حرکت پریودیک را با استفاده از فیدبک غیرخطی ارائه نمودند. پس از آن Hemami وCvetkovic[3]، با ترکیبی از فیدبکهای خطی و غیرخطی ناحیه بزرگتری از پایداری را به وجود آورد. عدم وجود مدلهای با درجات آزادی بالاتر که شباهت بیشتری به انسان داشته باشند Golliday وHemami[4]، را بر آن داشت تا با در نظر گرفتن یک مدل سهدرجه آزادی و با استفاده از تکنیکهای شناخته شده تا آن زمان روابط مورد نیاز برای کنترل مدل بدون زانوی خود را استخراج نمایند. آنها ابتدا به وسیله معادلات لاگرانژ دینامیک سیستم را شناختند و پس از خطیسازی روابط را به فرم معادلات حالت درآوردند تا روی پایداری، کنترلپذیری و مشاهدهپذیری سیستم مطالعه نمایند. در کنترلر، فیدبک چند متغیره برای دیکوپله کردن معادلات دینامیک رسته 6 به سیستمهایی جدا و با رسته 2 اعمال شد. این عمل نقش عمدهای در سادهسازی طراحی کنترلر دارد. در بخش بعدی با اعمال فیدبک حرکتی با طول گام و سرعتی مشابه انسان تولید نمودند.
Hemami و همکاران [5]، آزمایشاتی روی مدلهایی از مجاری نیمدایره و اتولیت[2]ها که به وسیله Nashner و با تخمین توابع انتقال این اندامها ارائه شده بود، انجام دادند. هدف اصلی از این کار تشخیص کفایت این مدلها در پایداری رباتهای پادار بود. هدف دیگر نزدیک کردن آنالیز حرکت به واقعیت بود به گونهای که به جای فیدبک حالت از فیدبک خروجی اتولیت استفاده شود. نتایج بیان میداشتند که برای پایداری مدل پاندول معکوس نیاز به فیدبکهایی از سرعت و موقعیت میباشد. همچنین مقادیر کوچک و مختلفی از بهره در نظر گرفته شد که بعضی از آنها پس از اعمال به حلقه کنترلی، شباهت زیادی به نتایج آزمایشگاهی Nashner نشان میداد.
به طور کلی مطالعات انجام گرفته در این دهه و حتی اوایل دهه 80 به دلیل در نظر گرفتن درجات آزادی کم و عدم پیادهسازی روی یک ربات، نمیتوانند پاسخگوی نیازهای کنونی محققین جهت ساخت وکنترل رباتهایی که در تعامل با انسان و محیط پیرامون خود، بتوانند از عهده وظایف پیچیده برآیند، باشند.
1-3- دیدگاه بهینهسازی
رباتهای دوپا ناچار به استفاده از منابع انرژی محدود هستند. در شرایطی که راه رفتن در یک سیکل تکرارشونده در حال انجام است، توجه به مصرف مینیمم انرژی می تواند بسیار سودمند باشد. در راستای بسط روش راه رفتن با مصرف مینیمم انرژی در سطوح صاف و

شیبدار Channon و همکاران [6]،Rostami و همکاران [7] و Roussel و همکاران [8]، روشهایی از تولید مسیر را با مینیممسازی تابع هزینه انرژی مصرفی ارائه نمودند. Hardt و همکاران [9]، مساله مصرف مینیمم انرژی در ربات را مورد توجه قرار دادند. حل معادلات پیچیده حاصله به وسیله روشهای عددی و مدل دینامیک بازگشتی آسان شده است. در سال 1997Fujimoto و Kawamura[10]، روش جدیدی از حرکت ربات را بر اساس توزیع بهینه نیروی پا به وسیله برنامهریزی غیرخطی (Quadratic Programming)، ارائه نمودند. کنترلر شامل کنترل مقاوم نیرو در پای تکیهگاه، کنترل مقاوم موقعیت در پای غیر تکیهگاه، یک کنترلر وضعیت (Attitude Control) و یک قسمت طراحی حرکت پای آزاد میباشد. ورودی به کنترلر وضعیت نیروی عکسالعمل است. روش به کار رفته در اینجا میتواند وضعیت کل ربات در برخورد پا و زمین را علیرغم وجود اصطکاک کم پایدار نماید. در سال 2002 ، Ono و Liu [11]، مسیر بهینه ربات را با مینیممسازی مربعات گشتاورهای ورودی طراحی کرد. پس از آن Wollherr و همکاران [12]، کنترل بهینه مسیر را با یک روش همزمان جبرانسازی ژاکوبینها ترکیب نمودند. آنها برای جبران انحرافات در شرایط پایداری یا قیود موجود که در اثر عواملی چون اغتشاشات خارجی و یا اشکالات سخت افزاری ممکن است به وجود آید، از روشی به نام جبران ژاکوبی استفاده نمود. در این روش با جابجایی محورهای مختصات متصل به بدن ربات انحرافات ایجاد شده جبران میشود.

1-4 –روشهای کنترل هوشمند
راه رفتن روی سطوح دارای شیب و موانع مختلف و یا سطوح نامشخص ممکن است باعث ناپایداری ربات شود. این ناپایداری درنتیجه خطاهای تعیین موقعیت و ایجاد نیروهای نامتعادل در پاها میباشد. در شرایط واقعی یک ربات دوپا تنها برای راه رفتن روی سطوح هموار مورد نیاز نیست بلکه تطبیق با عدم قطعیتهای محیط، مطلوب نظر کاربر میباشد. یک ربات با شرایط عملکرد مطلوب میبایست بیش از پیش به انسان شبیه باشد. توانائی تغییر مسیر (Switching) و یادگیری مسیر زمانی که ربات با یک مسیر نامشخص از قبل روبرو میشود، دغدغههایی است که ذهن دانشمندان را سالها به خود مشغول نموده است. تحت این شرایط ترکیب تکنیکهای کنترل نیرو و موقعیت با الگوریتمهای آموزشی ضروری به نظر میرسد. Miller [13]، ِDoerschuk و همکاران [14]و Kun و Miller [15]، کارهای اولیه در زمینه اعمال شبکههای عصبی به ربات دوپا را انجام دادند. Salatan و همکاران [16] و Hu و همکاران [17]، از دیگر افرادی بودند که در این زمینه تلاشهایی انجام دادند. Kurematsu و همکاران [18] وJuang وLin [19]، به صورت موثری از شبکههای عصبی در طراحی مسیر استفاده کردند. پیش از اینها و در سال1992، Wang و همکاران [20] ، ساختار شبکه عصبی را برای کنترل یک مدل سه لینکی به کار بردند. کنترلر از مشخصههای محاسباتی مفید شبکههای عصبی از جمله مقاوم بودن و تطبیق پارامترها استفاده میکند. مقایسه عملکرد کنترلر با کنترلر حاصل از قانون کنترل بهینه کارایی بهتر آن را در حضور اغتشاشات بزرگ نشان میدهد.
به دلیل توانائیهای تکمیلی، روشهای هوشمند هیبرید جایگاهی قابل توجه در مطالعات مربوط به حرکت ربات پیدا کردهاند. درسال 2000 Juang[21] ، یک الگوریتم یادگیری بر اساس کنترلر نوروفازی[3] را معرفی کرد. این الگوریتم می تواند محدودیتها و شرایط مختلف از جمله طول گام و سرعت راه رفتن را به طور کامل ارضا نماید. الگوریتم ژنتیک[4] به صورت موثری در مفاهیم شبکههای عصبی در رباتها به کار گرفته شده است.Nagasaka و همکاران [22]، در ربات 16 درجه آزادی خود که هدایت بصری داشت، از یک کنترلر نوروژنتیک[5] استفاده کردند. آموزش حرکت چرخشی پا (Swing motion) به وسیله شبکه عصبی و به کمک اطلاعات بصری از یک محیط کار مجازی هدف اصلی این پژوهش بوده است. محیط کار مجازی به منظور شتابدهی به فرایند یادگیری موثر است. اختلافات موجود در فرایند یادگیری میان محیط کار مجازی و ربات واقعی به وسیله توانائیهای شبکه عصبی خنثی میشود.

1-5- کنترل امپدانس
پس از آشکار شدن مشکلات الگوریتمهای کنترل نیرو، کنترل موقعیت و حتی الگوریتمهای هیبریدی از این دو، ارائه روشی نوین که نقاط ضعف قبلی را پوشش دهد، امری مهم و تاثیرگذار تلقی میشد. روش کنترل امپدانس که به وسیله Hogan[23] ، ارائه شد، مفهوم جدیدی در کنترل بود که نه دقیقا به مفهوم کنترل نیرو بود و نه با کنترل موقعیت انطباق داشت، بلکه ترکیبی از هر دو بود. به کارگیری این مفهوم در رباتهای دوپا مدتها بعد و در سال،2001 به وسیله Park[24] ، انجام شد. او با بکارگیری این الگوریتم توانست کنترل پای چرخان (Swing motion) را به خوبی کنترل مفصل ران انجام دهد که از این جهت کاری قویتر از کارهای قبلی بود. پیش از آن و در سال1999 ، Park و Chung[25] ، از ترکیب روش گشتاور محاسبه شده و کنترل امپدانس برای کنترل حرکت ربات استفاده نمود. نقش کنترل امپدانس کنترل پای چرخان (Swing motion) و به طور خاص کنترل ضربه حاصل از فرود آمدن پا بود. شبیهسازی انجام شده، کیفیت بهتر عملکرد کنترلر را نسبت به زمانی که تنها الگوریتم گشتاور محاسبه شده استفاده شده بود، نشان میدهد.
الگوریتم کنترل امپدانس به روش کنترلی که انسان در حرکت خود به کار میبرد، بسیارشبیه است. ما در هر گام ماهیچههای خود را منقبض و منبسط میکنیم. این عمل به خصوص در پاها بسیار مهم است. انقباض و انبساط ماهیچهها به نوعی همان تغییر ضرائب امپدانس است. انسان قبل از گذاشتن پا روی زمین، پا را ریلکس میکند تا ضربه را جذب کند و پس از آن برای حفظ پایداری عضلات را منقبض میکند. وقتی انسان راه میرود، دقیقا مسیر حرکت بالاتنه را کنترل نمیکند، بلکه نیروی پاها که جابجایی بالاتنه را موجب میشوند، کنترل میکند. همچنین انسان مسیر پای متحرک را به منظور جلوگیری از برخورد پا با موانع کنترل مینماید.
Lim و همکاران [26] ، در همان زمان، کنترل امپدانس را در ربات WABIAN-R III با موفقیت به کار بردند. در این تحقیق ضریب دمپینگ بالائی برای امپدانس در نظر گرفته شده بود تا اثر ضربه پا کاهش یابد. همین طور سختی بالائی برای نیمه اول مرحله یک تکیهگاهی به منظور افزایش ممان داده میشود. پارامترهای کنترل امپدانس به صورت همزمان (Real Time) و در طول حرکت، تنظیم میشوند.

1-6- کنترل جابجائی جسم
در راستای کنترل نیروهای عمل و عکس العملی در فرایندهائی که مسألهی برخورد با محیط را شامل میشوند، الگوریتمهای کنترل نیرو و امپدانس استخراج شدهاند. در سال 1981، (Raibert & Craig) الگوریتم هیبریدی نیرو و موقعیت را ارائه نمودند که در آن نیرو در بعضی راستاها و موقعیت در راستاهای دیگر کنترل میشد [37] .(Nakamura et al) در سال 1987، جابجائی جسم توسط چند بازو به صورت هماهنگ را مورد مطالعه قرار دادند و در آن دینامیک جسم را هم ملاحظه نمودند [38]. اما به جهت اینکه کنترل نیرو و موقعیت هر دو در یک راستا امکانپذیر نبود، Hogan، مفهوم کنترل امپدانس را به منظور رفع این معضل در سال 1985 ارائه نمود [23]. از آن پس مفهوم امپدانس مبنای کنترل در فرایندهائی که در آن ربات به نوعی با محیط اطراف خود تماس دارد قرار گرفت، به طوری که بخش عمدهای از تحقیقات مربوط به این زمینه را ترکیب کنترل امپدانس با سایر الگوریتمهای کنترلی شامل میشود. در سال 1988 ((Goldenberg، با اعمال همزمان کنترل امپدانس و کنترل نیرو، چگونگی اعمال نیروی دلخواه به محیط و همزمان برقراری رابطه میان این نیرو و موقعیت نقطهی تماس نسبت به موقعیت بازو را مورد مطالعه قرار داد [39]. در سال 1993،(Seraji & Coulbagh)، تلاش کردند تا با اعمال نیروی دلخواه تماسی در قالب کنترل امپدانس، چگونگی تعامل با محیطهای ناشناخته برای ربات را مورد بررسی قرار دهند [40]. در سال 2001،(Nagchaudhuri &Garg)، ترکیبی از کنترل تطبیقی و امپدانس را به منظور جابجائی یک جسم سنگین به وسیلهی دو بازوی کارگر ارائه نمودند[41]. در همین سال (Cacavalle & Villani)، با اعمال کنترل مقاوم، به دلیل اغتشاشات وارده و دینامیک مدل نشده، و همزمان اعمال کنترل امپدانس به هر یک از بازوها و همچنین جسم، روشی را برای کنترل جابجائی جسم به وسیلهی چند بازو را ارائه نمودند[42].
پیش از آنها و در سال 1992،(Shneider & Cannon)، با اعمال کنترل امپدانس بر جسم، OIC را معرفی نمودند [43]. این روش به دلیل عدم وجود پسخوراند از حرکت مجری نهائی، ممکن است موجب بروز مشکلاتی شود. به عنوان مثال، زمانی که جابجائی یک جسم منعطف مورد نظر باشد، به کار بردن این الگوریتم موجب ناپایداری میشود. این مسأله را (Meer &Rock)، در سال 1995 نشان دادند [44].
اما راه حل معضلات موجود در روشهای قبلی با ارائهی روش کنترل امپدانس چندگانه توسط (Moosavian & Papadopolus)، در سال 1997 منتشر شد[45]. در این روش با اعمال کنترل امپدانس در تمام سطوح، به یک حرکت هماهنگ برای رسیدن به هدف تعقیب جسم دست مییابیم. این روش توسط این دانشمندان بر مدلی از یک موشک فضانورد با موفقیت اعمال شده است [46]. هماکنون کاربردهای دیگری از آن در دست مطالعه و بررسی است. این پروژه نیز در همین راستا و با هدف گسترش کاربرد این روش در رباتهای دوپا تعریف و انجام شده است.

1-7- نمونههائی از رباتهای ساخته شده
بیشک هدف اصلی از ارائه تمامی این تئوریها و آزمایشات، تکامل هر چه بیشتر الگوریتمهای کنترلی جهت پیادهسازی در ربات دوپاست. در این میان مروری بر دو نمونه از رباتهای ساخته شده خالی از لطف نیست.
در سال 2005Verrelst و همکاران [27] ، رباتی ساختند که عملگرهای آن همگی نیوماتیکی بودند. دراین ربات که Lucy نام دارد، برای یک مسیر طراحی شده روش گشتاور محاسبه شده و کنترل بنگبنگ برای فشار استفاده شده است.
ربات P2 از سری رباتهای تولیدی شرکت هندا در مراحل زیر کنترل میشود (Hirai و همکاران [28]):
1-کنترل نیروی عکسالعمل سطح
2-کنترلرZMP مدل، در مسیر حرکت ربات به گونهای که ZMP به نقطهای مناسب جابجا شود، تغییر ایجاد میکند.