نام و نام خانوادگی:محسن خمیرگیران فارسانی
عنوان پایان نامه: خوشه بندی داده با استفاده از الگوریتم بهینه سازی تکاملی تجمع پرندگان در سیستم های آموزشی
رشته تحصیلی:مهندسی کامیپوتر -شبکههای کامیپوتری
مقطع تحصیلی: کارشناسی ارشد ناپیوسته
استاد راهنما: دکتر حسین مرادی
چکیده:
قبل ازاین که به توضیح خوشه بندی بپردازم بهتره که کمی با کاربرد های اون آشنا بشیم. از جمله کاربرد های خوشه بندی میشه به استفاده از الگوریتم های این روش در مدل سازی های مربوط به دسته بندی مشتریان جهت به کارگیری در مدیریت ارتباط با مشتری، کشف تقلب در بیمه جهت کاهش زیان شرکت های بیمه، دسته بندی کارمندان جهت کمک به واحد منابع انسانی سازمان ها، متن کاوی جهت تحلیل داده های شبکه های اجتماعی و … اشاره کرد. خوشه بندی کاربرد های خیلی مختلف داره که خیلی جا ها ازش استفاده میشه و قطعا این مثال هایی که زدم فقط بخشی ازین کاربرد ها رو بازگو کرده. در تجزیه و تحلیل خوشه یا خوشه بندی، گروه بندی مجموعهای از اشیاء انجام میشه. این کار به این صورته که اشیائی که در یک گروه (به نام خوشه) قرار دارند، در مقایسه با اشیاء دیگر دستهها (خوشه ها) مشابهتر هستند. این وظیفه اصلی داده کاوی اکتشافی هست و یک روش معمول برای تجزیه و تحلیل دادههای آماریه. خوشهها شامل گروه هایی با فاصله های کم بین اعضای خوشه، مناطق متراکم فضای داده، فواصل و یا توزیع های آماری خاص هستند. بنابراین خوشه بندی میتونه به عنوان یک مسئله بهینه سازی چند هدفه صورت بگیره. انتخاب الگوریتم خوشه بندی مناسب و تنظیمات پارامتر (از جمله پارامترهایی مانند تابع فاصله مورد استفاده، آستانه تراکم یا تعداد خوشه مورد انتظار) بستگی به تنظیم مجموعه دادهها توسط فرد و استفاده خاص فرد از نتایج داره. تجزیه و تحلیل خوشهای یک روش اتوماتیک نیست، بلکه یک فرآیند تکراری از کشف دانش یا بهینه سازی چند هدفه تعاملی هست که در اون آزمایش و شکست وجود داره. توی خوشه بندی اغلب لازم الگوریتم PSO یا (Particle swarm optimization) بهینه سازی ازدحام ذرات (PSO) یک روش بهینه سازی تصادفی مبتنی بر جمعیت است که توسط دکتر کندی Dr. Eberhart و دکتر ابراهارت Dr. Kennedy در سال 1995 طراحی شده است که الهام گرفته از رفتار اجتماعی ازدحام پرندگان و پرورش ماهی است. الگوریتم PSO شباهت زیادی با تکنیک های محاسباتی تکاملی مانند الگوریتم ژنتیک (GA) دارد. این سیستم با جمع آوری راه حل های تصادفی و جستجو برای بهینه سازی با به روز رسانی نسل ها آغاز می شود.
با این حال، بر خلاف GA الگوریتم PSO هیچ اپراتور تکاملی مانند CrossOver و جهش ندارد. در PSO، راه حل های بالقوه، ذرات نامیده می شوند که از طریق فضای مشکل با دنبال کردن ذرات بهینه مطلوب پرواز می کنند. اطلاعات دقیق در بخش های زیر داده می شود. در مقایسه با الگوریتم ژنتیک، الگوریتم PSO آسان است و چند پارامتر برای تنظیم آن وجود دارد. این الگوریتم در بسیاری از زمینه ها به طور موفقیت آمیزی مورد استفاده قرار گرفته است: بهینه سازی عملکرد، آموزش شبکه های عصبی مصنوعی، کنترل سیستم فازی و سایر زمینه ها می تواند استفاده شود.ه که داده ها پیش پردازش بشه و پارامترهای مدل اصلاح بشه تا نتیجه حاصل، همان نتیجهی دلخواه باشه.
یادگیری بدون نظارت یا Unsupervised learning نوعی یادگیری ماشین است که کاربران لازم نیست بر مدل آن نظارت کنند. در عوض، مدل کنونی روی خود کار میکند تا الگوها و اطلاعات شناسایی نشده را کشف کند. اغلب کار این مدل با دادههای برچسبنخورده است.
کاربران با استفاده از الگوریتمهای یادگیری بدون نظارت میتوانند کارهایی با پردازش پیچیدهتر را در مقایسه با یادگیری با نظارت انجام دهند. گرچه که یادگیری بدون نظارت نسبت به دیگر شیوههای یادگیری طبیعی پیشبینیناپذیرتر است. الگوریتمهای یادگیری بدون نظارت شامل خوشهبندی، شناسایی ناهنجاری، شبکههای عصبی و غیره میشود.
خوشهبندی یکی از مفاهیم پراهمیت در حوزه یادگیری بدون نظارت است. این مفهوم بیشتر با پیداکردن ساختار و الگو در مجموعهای از دادههای دستهبندی نشده کار دارد. الگوریتمهای خوشهبندی یادگیری بدون نظارت، دادههای شما را پردازش کرده و در صورت وجود خوشههای (گروهها) طبیعی، آنها را پیدا میکند. همچنین، میتوانید تعداد خوشههایی را که الگوریتمهای شما باید آن را پیدا کنند، تغییر دهید. خوشهبندی انواع مختلفی دارد که میتوان آنها را بهکار گرفت.
الگوریتمهای تکاملی از روش ها و عملیات ابتدایی برای حل مسئله استفاده میکنند و در طی یک سری از تکرارها به راهحل مناسب برای مسئله میرسند. این الگوریتمها غالباً از یک جمعیت حاوی راهحلهای تصادفی شروع میکنند و در طی هر مرحله تکرار سعی در بهتر کردن مجموعه راهحلها دارند. در آغاز کار تعدادی از اعضای جامعه بهصورت تصادفی حدس زدهشده، سپس تابع هدف یا برازندگی برای هر یک از این اعضا محاسبه و نخستین نسل ایجاد خواهد شد. اگر هیچیک از معیارهای خاتمه بهینهسازی دیده نشوند، ایجاد نسل جدید آغاز خواهد شد.
اعضا برحسب میزان شایستگیشان برای تولید فرزندها انتخاب میشوند. این افراد بهعنوان والدین محسوب میشوند و بازترکیب فرزندان را تولید مینمایند. سپس تمامی فرزندها با یک مقدار معینی از احتمال، یعنی همان جهش، تغییر ژنتیکی مییابند. اکنون میزان شایستگی (برازندگی) فرزندان تعیین و در اجتماع جایگزین والدین شده و نسل جدید را ایجاد مینمایند. این چرخه آنقدر تکرار میشود تا یکی از معیارهای پایان بهینهسازی کسب شود.
کلیدواژه: خوشه بندی ، الگوریتم تکاملی ، بهینه سازی ، الگوریتم تجمع پرندگان