دانلود پایان نامه ارشد : خوشه‌بندی مبتنی بر انتخاب بر اساس نظریه خرد جمعی

1-1. خوشه‌بندی

 

به عنوان یکی از شاخه‌های وسیع و پرکاربرد هوش مصنوعی[1]، یادگیری ماشین[2] به تنظیم و اکتشاف شیوه‌ها و الگوریتم‌هایی می‌پردازد که بر اساس آن‌ها رایانه‌ها و سامانه‌های اطلاعاتی توانایی تعلم و یادگیری پیدا می‌کنند. طیف پژوهش‌هایی که در مورد یادگیری ماشینی صورت می‌گیرد گسترده ‌است. در سوی نظر‌ی آن پژوهش‌گران بر آن‌اند که روش‌های یادگیری تازه‌ای به وجود بیاورند و امکان‌پذیری و کیفیت یادگیری را برای روش‌هایشان مطالعه کنند و در سوی دیگر عده‌ای از پژوهش‌گران سعی می‌کنند روش‌های یادگیری ماشینی را بر مسائل تازه‌ای اعمال کنند. البته این طیف گسسته نیست و پژوهش‌های انجام‌شده دارای مؤلفه‌هایی از هر دو رو‌یكرد هستند.

 

مقالات و پایان نامه ارشد

 امروزه، داده‌كاوی[3] به عنوان یك ابزار قوی برای تولید اطلاعات و دانش از داده‌های خام، در یادگیری ماشین شناخته‌شده و همچنان با سرعت در حال رشد و تكامل است. به طور كلی می‌توان تکنیک‌های داده‌كاوی را به دو دسته بانظارت[4] و بدون نظارت[5] تقسیم كرد [29, 46].

 

در روش بانظارت ما ورودی (داده یادگیری[6]) و خروجی (كلاس[7] داده) یك مجموعه داده را به الگوریتم هوشمند می‌دهیم تا آن الگوی[8] بین ورودی و خروجی را تشخیص دهد در این روش خروجی كار ما مدلی[9] است كه می‌تواند برای ورودی‌های جدید خروجی درست را پیش‌بینی[10] كند. روش‌های طبقه‌بندی[11] و قوانین انجمنی[12] از این جمله تكنیك‌ها می‌باشد. روش‌های با نظارت كاربرد فراوانی دارند اما مشكل عمده این روش‌ها این است كه همواره باید داده‌ای برای یادگیری وجود داشته باشد كه در آن به ازای ورودی مشخص خروجی درست آن مشخص شده باشد. حال آنكه اگر در زمینه‌ای خاص داده‌ای با این فرمت وجود نداشته باشد این روش‌ها قادر به حل این‌گونه مسائل نخواهند بود [29, 68]. در روش بدون نظارت برخلاف یادگیری بانظارت هدف ارتباط ورودی و خروجی نیست، بلکه تنها دسته‌بندی ورودی‌ها است. این نوع یادگیری بسیار مهم است چون  خیلی از مسائل (همانند دنیای ربات‌ها) پر از ورودی‌هایی است که هیچ برچسبی[13] (كلاس) به آن‌ها اختصاص داده نشده است اما به وضوح جزئی از یک دسته هستند [46, 68]. خوشه‌بندی[14] شاخص‌ترین روش در داده‌كاوی جهت حل مسائل به صورت بدون ناظر است. ایده اصلی خوشه‌بندی  اطلاعات، جدا کردن نمونه‌ها از یكدیگر و قرار دادن آن‌ها در گروه‌های شبیه به هم می‌باشد. به این معنی كه نمونه‌های شبیه به هم باید در یك گروه قرار بگیرند و با نمونه‌های گروه‌های دیگر حداكثر متفاوت را دارا باشند [20, 26]. دلایل اصلی برای اهمیت خوشه‌بندی عبارت‌اند از:

 

اول، جمع‌آوری و برچسب‌گذاری یك مجموعه بزرگ از الگوهای نمونه می‌تواند بسیار پركاربرد و باارزش باشد.

 

دوم، می‌توانیم از روش‌های خوشه‌بندی برای پیدا کردن و استخراج ویژگی‌ها[15] و الگوهای جدید استفاده كنیم. این كار می‌تواند كمك به سزایی در كشف دانش ضمنی[16] داده‌ها انجام دهد.

 

سوم، با خوشه‌بندی می‌توانیم یك دید و بینشی از طبیعت و ساختار داده به دست آوریم كه این می‌تواند برای ما باارزش باشد.

 

چهارم، خوشه‌بندی می‌تواند منجر به كشف زیر رده‌های[17] مجزا یا شباهت‌های بین الگوها ممكن شود كه به طور چشمگیری در روش طراحی طبقه‌بندی قابل استفاده باشد.

هیچ نظری هنوز ثبت نشده است
نظر دهید

آدرس پست الکترونیک شما در این سایت آشکار نخواهد شد.

URL شما نمایش داده خواهد شد.
بدعالی
This is a captcha-picture. It is used to prevent mass-access by robots.