دانلود پایان نامه ارشد: ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means
داده و الگو یکی از شاخصهای بسیار مهم در دنیای اطلاعات هستند و خوشهبندی یکی از بهترین روشهایی است که برای کار با دادهها ارائه شده است. قابلیت آن در ورود به فضای داده و تشخیص ساختار آنها باعث گردیده که خوشه بندی یکی از ایدهآلترین مکانیزمها برای کار با دنیای عظیم دادهها باشد.
در خوشهبندی، نمونهها به دستههایی تقسیم میشوند که از قبل معلوم نیستند. بنابراین، خوشهبندی یک روش یادگیری است که بدون
دانش پیشین و مشاهده نمونههای از قبل تعریف شده، دادهها را به صورت خود مختار و مستقل دسته بندی میکند.
خوشه بندی در واقع یافتن ساختار در مجموعه دادههایی است که طبقه بندی نشدهاند. به بیان دیگر خوشهبندی قراردادن دادهها در گروههایی است که اعضای هر گروه از زاویهی خاصی به هم شباهت دارند. در نتیجه شباهت بین دادههای درون هر خوشه حداکثر و شباهت بین دادههای درون خوشههای متفاوت حداقل میباشد. معیار شباهت در اینجا، فاصله بوده یعنی نمونههایی که به یکدیگر نزدیکترهستند، در یک خوشه قرار میگیرند. لذا محاسبهی فاصلهی بین دو داده در خوشهبندی بسیار مهم میباشد؛ زیرا کیفیت نتایج نهایی را دستخوش تغییر قرار خواهد داد.
فاصله که همان معرف عدم تجانس است حرکت در فضای دادهها را میسر میسازد و سبب ایجاد خوشهها میگردد. با محاسبهی فاصلهی بین دو داده، میتوان فهمید که چقدر این دو داده به هم نزدیک هستند و در یک خوشه قرار می گیرند یا نه؟ توابع ریاضی مختلفی برای محاسبهی فاصله وجود دارند؛ فاصله اقلیدسی، فاصله همینگ و ….
1-1-بیان مسأله
خوشهبندی یافتن ساختار، درون مجموعهای از دادههای بدون برچسب است و میتوان آن را به عنوان مهمترین مسأله در یادگیری بدون نظارت در نظر گرفت. ایدهی خوشهبندی اولین بار در دههی 1935 مطرح شد و امروزه با پیشرفتها و جهشهای عظیمی که در آن بهوجود آمده در کاربردها و جنبههای مختلفی حضور یافته است. یک جستجوی ساده در وب یا حتی در پایگاه داده یک کتابخانه، کاربرد شگفت انگیز آن را برای ما آشکار میسازد. الگوریتمهای خوشهبندی در زمینههای مختلفی کاربرد دارد که به عنوان نمونه میتوان موارد زیر را برشمرد:
· داده کاوی[1]: کشف اطلاعات و ساختار جدید از دادههای موجود
· تشخیص گفتار[2]: در ساخت کتاب کد از بردارهای ویژگی، در تقسیم کردن گفتار بر حسب گویندگان آن یا فشردهسازی گفتار
· تقسیمبندی تصاویر[3]: تقسیمبندی تصاویر پزشکی یا ماهوارهای
· وب (WWW): دستهبندی اسناد و یا دستهبندی سایتها و …
· زیستشناسی[4]: دستهبندی حیوانات و گیاهان از روی ویژگیهای آنها
· برنامه ریزی شهری[5]: دستهبندی خانهها بر اساس نوع و موقعیت جغرافیایی آنها
· مطالعات زلزلهنگاری[6]: تشخیص مناطق حادثهخیز بر اساس مشاهدات قبلی
· کتابداری: دستهبندی کتابها
· بیمه: تشخیص افراد متقلب
· بازاریابی[7]: دستهبندی مشتریان به دستههایی بر حسب نیاز آنها از طریق مجموعه آخرین خریدهای آنان.
با توجه به کاربرد روزافزون خوشهبندی، امروزه شاهد ارائهی روشهای جدید و کارآمدتری هستیم که هر یک برای کاربردی خاص ارائه میشود. ولی با همه این تلاشها هنوز خوشهبندی در بسیاری از علوم آنچنان که باید مورد استفاده قرار نگرفته است و قابلیت گسترش بسیار زیادی برای آن وجود دارد.
نسخه قابل چاپ | ورود نوشته شده توسط نجفی زهرا در 1399/10/26 ساعت 02:28:00 ب.ظ . دنبال کردن نظرات این نوشته از طریق RSS 2.0. |