دانلود پایان نامه ارشد : بهبود ساخت و ترکیب قوانین فازی با استفاده از الگوریتم رقابت استعماری

تاکنون دانشمندان حوزه داده کاوی تلاشهای بسیاری برای جداسازی صحیح نمونههای مشابه کردهاند. استخراج طبقهبندهای عام[1] و قابل فهم از داده، نقش مهمی در بسیاری از حوزهها و مسائل است. تاکنون روشهای متعددی برای طبقهبندی[2] و تشخیص الگو[3] معرفی شدهاست. یکی از شیوههای موفق و منحصربهفرد در حوزه طبقهبندی و تشخیص الگوی دادههای ورودی، استفاده از تکنیکهای فازی برای تقسیمبندی نرم فضای ویژگی و بالطبع استفاده از یک معماری مؤثر در متصل کردن این زیرفضاها برای تصمیمگیری و طبقهبندی بهصورت فازی میباشد. طبقهبندی فازی پروسه گروه بندی عناصر داخل مجموعههای فازی با یک تابع عضویت[4] است[1]. در واقع، ابتدا فضای جستجو به بخشهایی قسمت بندی میشود به گونه ای که تمام فضا پوشش داده شود و سپس بر روی هرکدام از این زیرفضاها مجموعه فازی قرار میگیرد. اجتماعی از مجموعههای فازی که فضای فازی نامیده میشود، مقادیر زبانی فازی یا کلاسهای فازی را تعریف میکند که یک شی میتواند به آنها تعلق داشته باشد. پس از آن قوانین فازی اگر و آنگاه[5] با توجه به نحوه تخصیص تولید میشوند. مدلسازی سیستمهای فازی بصورت مجموعهای از این قوانین نمایش داده میشود.

انگیزه

طبقهبندیکنندههای فازی دارای ویژگی منحصربفرد تفسیرپذیری هستند و قادرند دانش چگونگی تشخیص الگوها را برای یک فرد خبره بصورت یک دستورالعمل بازنمایی کنند. طبقهبندیکنندههای فازی چهار هدف اساسی را دنبال میکنند. دقت طبقهبندیکننده را بیشینه کنند، طبقهبندیکنندهی با بیشترین قابلیت تفسیرپذیری را ایجاد نمایند، پایداری طبقهبندیکننده را بیشینه کنند و حساسیت به نویز را کاهش دهند. تاکنون روشهای متفاوتی برای ایجاد قوانین، نحوه تخصیص زیرفضاها، نحوه استنتاج در هر قانون و در نهایت ادغام قوانین ارائهشده است. بدیهی است زبان طبیعی[6] محور بودن ساختار قوانین فازی علیرغم استخراج دانش، مشکل اثبات ریاضی کارایی طبقهبندیکننده از جمله ارائه یک کران بالا[7] برای خطای آموزش[8] و خطای تست[9] است. بهعبارتی افزایش عمومیسازی[10] این طبقهبندیکنندهها بصورت ریاضی مانند طبقهبندی کننده تقویتی گروهی[11] کار بسیار دشواری است. از اینرو اغلب از روشهای مکاشفهای[12] و فوق مکاشفهای[13] بهصورت سعی و خطا در تدوین قوانین و ادغام آنها استفاده میگردد، به این دلیل که زیرفضا را برای بهدستآوردن بهترین ترکیب قوانین جستجو میکنند [2]-[4] . ایشیبوشی[14][5] روشی را برای تخصیص فضا بهصورت تقسیمبندی منظم و تکراری ارائه کرد که میتوان از این روش بهعنوان یکی از موثرترین روشهای طبقهبندیکننده فازی که مبنای بسیاری از تحقیقات

بعدی در این زمینه نیز شد، نام برد.

شرح مسئله

پروسه یادگیری یک سیستم طبقهبندی فازی باید مسایل مختلفی را حل کند تا یک سیستم طبقهبندی زبانی را با یک رفتار صحیح ایجاد نماید. از جمله اینکه بتواند، 1- مجموعهای از قوانین فازی را ایجاد کند که دارای یک سطح لازم همکاری بین این قوانین فازی باشد. 2- انتخاب یک تابع استنتاج که روشی را برای ترکیب اطلاعات بهدست آمده از قوانین فازی در کلاسهبندی نمونهها انتخاب میکند. 3- در مسایل با ابعاد بالا، قوانین فازی از رشد نمایی در سایزشان رنج میبرند. دو مسئله اول، مربوط به پروسه استخراج دانش میشود که با پردازشهای یادگیری مختلف براساس الگوریتمهای تکرارشونده مانند شبکههای عصبی مصنوعی[5-6] یا الگوریتم ژنتیک [2-4]قابل حل است. گزینه سوم از دو جهت میتوان مدیریت کرد: با فشردهسازی و کاهش مجموعه قوانین، قوانین غیرضروری را با هدف ایجاد یک سیستم طبقهبندی با کارایی بالاتر حذف کرد. و راهکار دوم با پروسه انتخاب ویژگی انجام میگیرد.

به طور کلی، هدف مسئله، فراهم کردن یک چارچوب کلی برای تکامل قوانین فازی است. راهکارهای بسیاری در این زمینه ارائه شده، اما همه آنها حداقل در یکی از موارد زیر تفاوت دارند، تعداد قوانینی که در هر عضو جمعیت کد میشود، نوع بیان قوانین کدشده در هر عضو و نوع و هدف پروسه تکاملی .[7-8] این الگوریتم‌ها شامل الگوریتم‌های ژنتیک[15]، بهینه‌سازی گروه ذرات[16]، گداختگی شبیه‌سازی شده[17] و… می‌باشند.

از آنجایی که الگوریتمهای تکاملی[18] بهصورت چندعاملی[19] جستجو را در فضای ویژگی انجام میدهند، نحوه گردش آنها تا حد ممکن بهصورت تصادفی میباشد. این خواص، الگوریتمهای تکاملی را به ابزار قوی برای انواع مسائل بهینهسازی تبدیل نموده است.[2], [4] از جمله مسائل مطرح در زمینه بهینهسازی، بهینهسازی ساختار و پارامترهای طبقهبندیکنندهها میباشد. بدیهی است هرچه یک طبقهبندیکننده پارامترهای بیشتری داشته باشد، تنظیم بهینه این پارامترها بهصورت دستی کاری بسیار دشوار، و در بعضی حالات غیرممکن میباشد. بدین خاطر از الگوریتمهای تکاملی برای یادگیری پارامترها و تعیین ساختار طبقهبندیکنندههای متفاوت بهصورت فراوان استفاده شده است. از جمله این تحقیقات میتوان به بهبود ساختار شبکه عصبی توسط الگوریتم ژنتیک اشاره کرد [9] که الگوریتم ژنتیک سعی در هرس کردن ارتباط بین نورونها و بهنوعی لایهبندی آنها به منظور بهبود کارایی طبقهبندی، دارد.

مزیت ترکیب قوانین فازی و الگوریتمهای تکاملی این است که مجموعه قوانین ایجادشده دارای تفسیرپذیری بیشتری هستند و میتوانند با عدم قطعیت[20] و ابهام مقابله کنند و همچنین میتوانند به صورت اکتشافی فضای ویژگی را جستجو کنند. به عنوان مثال در بخش ورودی نحوه تخصیصبندی فضاها و همچنین تعیین پارامترهای توابع عضویت (مانند شیب و واریانس)، از الگوریتمهای تکاملی استفاده شده است[10].

چالشها

با توجه به این که اغلب روشهای عمده و شناخته شده محاسبات تکاملی، شبیه‌سازی کامپیوتری فرایندهای طبیعی و زیستی هستند، در این نوشتار، از یک روش ترکیبی برای بهبود طبقهبندیکنندههای فازی ارائه میشود که برای بهبود یادگیری پارامترهای آن الگوریتم تکاملی رقابت استعماری [11] اقتباس شده است. این پایاننامه، الگوریتم رقابت امپریالیستی [21]را برای هدف استخراج کلاسهبندهای عام و قابل فهم از داده در شکل یک سیستم قانون ارائه میکند. در این تحقیق سعی در ارائه ساختار جدیدی بر روی بستر فازی هستیم که در آن ساختار، توزیع قوانین از الگوریتم رقابت استعماری[22] اقتباس شده و لیکن روح قوانین بهصورت فازی است. ضمنأ بهدلیل ایجاد هارمونی مناسب در بهینهسازی ساختار قوانین و همچنین ادغام قوانین، استفاده از الگوریتم بهینهسازی رقابت استعماری پیشنهاد میشود.

در این الگوریتم چند نمونه که دارای میزان برازندگی[23] بالایی میباشند (امپریالیست[24]) و مرکز امپراطوریها هستند، سعی در کشاندن بقیه نمونهها (مستعمره)[25] به سمت خود دارند. این الگوریتم را میتوان نوع بهبود یافته الگوریتم ازدحام ذرات در نظر گرفت. لازم به ذکر است که الگوریتم ازدحام ذرات علیرغم سرعت همگرایی بالای آن، احتمال بایاس شدن آن بسیار زیاد میباشد. چون میزان تصادفی بودن[26] آن در حین جستجو پایین بوده و بسیار بایاسدار حرکت میکند. درصورتیکه الگوریتم رقابت استعماری این مسئله را به این شیوه حل کرده است که هر نمونه بهجای حرکت در جهت برآیند دو نقطه با برازندگیهای مناسب، به یکی از چند نقطهای اختصاص داده میشود که بهینه محلی (امپریالیست) اطلاق میشوند.

از آنجا که ساختار این الگوریتم بهصورت چندحوزهای میباشد، بکارگیری آن برای ساختاربندی قوانین فازی این خاصیت را بههمراه خواهد داشت که یک مجموعه قوانین بر روی یک زیرفضا کار کند نه تنها روی یک قانون. بهعبارت دیگر استفاده از یک قانون برای تصمیمگیری درمورد یک زیرفضا حتی با داشتن همپوشانی[27] با زیرفضاهای همسایه باعث خاص[28] شدن آن قانون و بهنوعی بایاس قانون و آن زیرفضای خاص شده و در مورد سایر نمونههایی که دور از آن زیرفضا هستند، نمیتواند تصمیمگیری مناسبی را بهعمل آورد که همین امر باعث بیشسازگاری[29]و کمبود عمومیسازی توابع فازی میگردد. در مقابل، الگوریتم یادگیری استعماری از تخصیص یک قانون به یک زیرفضای خاص جلوگیری کرده و حتی زیرفضاهایی که یک مستعمره از قوانین درباره آن تصمیم میگیرند، دارای ابعاد بسیار وسیعتری نسبت به زیرفضای تخصیصشده به هر قانون در مقایسه با روشهای قبلی دارد. ضمنأ هنگامیکه قوانین بهصورت دستههای مختلفی از مستعمرههای متفاوت بر روی کل فضا عمل میکنند، میتوان آن را جزو الگوریتمهای توزیعشده در نظر گرفت. توانایی بهینهسازی این الگوریتم نسبت به الگوریتمهای بهینهسازی پیشین همتراز و یا حتی بالاتر است و سرعت رسیدن به جواب بهینه نیز مناسب است.

اهداف پایاننامه

در این رساله میخواهیم یک مجموعه از قوانین انعطافپذیر فازی را با استفاده از الگوریتم رقابت استعماری که پیش از این ذکر شد، ایجاد نماییم. با این هدف که کارایی طبقهبندیکننده و تفسیر پذیری قوانین تولید شده حداکثر شود و در عینحال نویز پذیری کمینه نسبت به طبقهبندیکنندههای آماری و نیز عمومیسازی بسیار مناسبی را ارائه نماید. در واقع در این مسئله میخواهیم مجموعهای از بهترین قوانین با انعطاف پذیری بالا که بیانگر انتخاب بهترین ویژگیهاست را با استفاده از الگوریتم نوپای رقابت استعماری بهدست آوریم. نکته مهم در این رساله، نحوه تخصیص زیرفضا، ساخت قوانین و در نهایت ادغام آنها در یک پروسه بهینهسازی استعماری است. بهطورکلی در این پژوهش:

چندین طرح کلی کدگذاری برای نمایش قوانین به شکل رشتهای از بیتها ارائه میدهد.
یک تابع برازش برای ارزیابی کارایی اعضا یا همان قوانین فازی تعریف میکند.
تصحیحی در عملگرهای الگوریتم رقابت استعماری برای استفاده بهینه در سیستمهای فازی ارائه میدهد.
زیرفضای تخصیصدادهشده برای هر قانون را توسعه میدهد و درنتیجه افزایش نسبی عمومیسازی را منجر میشود.

مطالب مربوط به این رساله در پنج فصل به شرح زیر می‌باشد.

فصل دوم. در این فصل تحقیقات انجام شده را بحث میکند و برای هر روش مزایا و معایب آنها را بهصورت جداگانه برمیشمرد.‌

فصل سوم. در این فصل متدولوژی که عبارتند از روشهای ارائه شده و روشهای پیشین را به صورت فرمولی و شبه کد توضیح میدهد.

فصل چهارم. در فصل چهارم نتایج بهدست آمده ارائه میشود.

فصل پنجم. کارهای پیش رو و اهداف آینده بررسی میشود.

بدون موضوع