نام و نام خانوادگی:محسن خمیرگیران فارسانی
عنوان پایان نامه: خوشه بندی داده با استفاده از الگوریتم بهینه سازی تکاملی تجمع پرندگان در سیستم های آموزشی
رشته تحصیلی:مهندسی کامیپوتر -شبکه‌های کامیپوتری
مقطع تحصیلی: کارشناسی ارشد ناپیوسته
استاد راهنما: دکتر حسین مرادی
چکیده:

قبل ازاین که به توضیح خوشه بندی بپردازم بهتره که کمی با کاربرد های اون آشنا بشیم. از جمله کاربرد های خوشه بندی میشه به استفاده از الگوریتم های این روش در مدل سازی های مربوط به دسته بندی مشتریان جهت به کارگیری در مدیریت ارتباط با مشتری، کشف تقلب در بیمه جهت کاهش زیان شرکت های بیمه، دسته بندی کارمندان جهت کمک به واحد منابع انسانی سازمان ها، متن کاوی جهت تحلیل داده های شبکه های اجتماعی و … اشاره کرد. خوشه بندی کاربرد های خیلی مختلف داره که خیلی جا ها ازش استفاده می‌شه و قطعا این مثال هایی که زدم فقط بخشی ازین کاربرد ها رو بازگو کرده. در تجزیه و تحلیل خوشه یا خوشه بندی، گروه بندی مجموعه‌ای از اشیاء انجام می‌شه. این کار به این صورته که اشیائی که در یک گروه (به نام خوشه) قرار دارند، در مقایسه با اشیاء دیگر دسته‌ها (خوشه ها) مشابه‌تر هستند. این وظیفه اصلی داده کاوی اکتشافی هست و یک روش معمول برای تجزیه و تحلیل داده‌های آماریه. خوشه‌ها شامل گروه ‌هایی با فاصله‌ های کم بین اعضای خوشه، مناطق متراکم فضای داده، فواصل و یا توزیع ‌های آماری خاص هستند. بنابراین خوشه بندی می‌تونه به عنوان یک مسئله بهینه سازی چند هدفه صورت بگیره. انتخاب الگوریتم خوشه بندی مناسب و تنظیمات پارامتر (از جمله پارامترهایی مانند تابع فاصله مورد استفاده، آستانه تراکم یا تعداد خوشه مورد انتظار) بستگی به تنظیم مجموعه داده‌ها توسط فرد و استفاده خاص فرد از نتایج داره. تجزیه و تحلیل خوشه‌ای یک روش اتوماتیک نیست، بلکه یک فرآیند تکراری از کشف دانش یا بهینه سازی چند هدفه تعاملی هست که در اون آزمایش و شکست وجود داره. توی خوشه بندی اغلب لازم الگوریتم PSO یا (Particle swarm optimization) بهینه سازی ازدحام ذرات (PSO) یک روش بهینه سازی تصادفی مبتنی بر جمعیت است که توسط دکتر کندی Dr. Eberhart و دکتر ابراهارت Dr. Kennedy در سال 1995 طراحی شده است که الهام گرفته از رفتار اجتماعی ازدحام پرندگان و پرورش ماهی است. الگوریتم PSO شباهت زیادی با تکنیک های محاسباتی تکاملی مانند الگوریتم ژنتیک (GA) دارد. این سیستم با جمع آوری راه حل های تصادفی و جستجو برای بهینه سازی با به روز رسانی نسل ها آغاز می شود.

با این حال، بر خلاف GA الگوریتم PSO هیچ اپراتور تکاملی مانند CrossOver و جهش ندارد. در PSO، راه حل های بالقوه، ذرات نامیده می شوند که از طریق فضای مشکل با دنبال کردن ذرات بهینه مطلوب پرواز می کنند. اطلاعات دقیق در بخش های زیر داده می شود. در مقایسه با الگوریتم ژنتیک، الگوریتم PSO آسان است و چند پارامتر برای تنظیم آن وجود دارد. این الگوریتم در بسیاری از زمینه ها به طور موفقیت آمیزی مورد استفاده قرار گرفته است: بهینه سازی عملکرد، آموزش شبکه های عصبی مصنوعی، کنترل سیستم فازی و سایر زمینه ها می تواند استفاده شود.ه که داده ‌ها پیش پردازش بشه و پارامترهای مدل اصلاح بشه تا نتیجه حاصل، همان نتیجه‌ی دلخواه باشه.
یادگیری بدون نظارت یا Unsupervised learning نوعی یادگیری ماشین است که کاربران لازم نیست بر مدل آن نظارت کنند. در عوض، مدل کنونی روی خود کار می‌کند تا الگوها و اطلاعات شناسایی‌ نشده را کشف کند. اغلب کار این مدل با داده‌های برچسب‌نخورده است.
کاربران با استفاده از الگوریتم‌های یادگیری بدون نظارت می‌توانند کارهایی با پردازش پیچیده‌تر را در مقایسه با یادگیری با نظارت انجام دهند. گرچه که یادگیری بدون نظارت نسبت به دیگر شیوه‌های یادگیری طبیعی پیش‌بینی‌ناپذیرتر است. الگوریتم‌های یادگیری بدون نظارت شامل خوشه‌بندی، شناسایی ناهنجاری، شبکه‌های عصبی و غیره می‌شود.
خوشه‌بندی یکی از مفاهیم پراهمیت در حوزه یادگیری بدون نظارت است. این مفهوم بیشتر با پیداکردن ساختار و الگو در مجموعه‌ای از داده‌های دسته‌بندی‌ نشده کار دارد. الگوریتم‌های خوشه‌بندی یادگیری بدون نظارت، داده‌های شما را پردازش کرده و در صورت وجود خوشه‌های (گروه‌ها) طبیعی، آنها را پیدا می‌کند. همچنین، می‌توانید تعداد خوشه‌هایی را که الگوریتم‌های شما باید آن را پیدا کنند، تغییر دهید. خوشه‌بندی انواع مختلفی دارد که می‌توان آنها را به‌کار گرفت.
الگوریتم‌های تکاملی از روش ها و عملیات ابتدایی برای حل مسئله استفاده می‌کنند و در طی یک سری از تکرارها به راه‌حل مناسب برای مسئله می‌رسند. این الگوریتم‌ها غالباً از یک جمعیت حاوی راه‌حل‌های تصادفی شروع می‌کنند و در طی هر مرحله تکرار سعی در بهتر کردن مجموعه راه‌حل‌ها دارند. در آغاز کار تعدادی از اعضای جامعه به‌صورت تصادفی حدس زده‌شده، سپس تابع هدف یا برازندگی برای هر یک از این اعضا محاسبه و نخستین نسل ایجاد خواهد شد. اگر هیچ‌یک از معیارهای خاتمه بهینه‌سازی دیده نشوند، ایجاد نسل جدید آغاز خواهد شد.

اعضا برحسب میزان شایستگی‌شان برای تولید فرزندها انتخاب می‌شوند. این افراد به‌عنوان والدین محسوب می‌شوند و بازترکیب فرزندان را تولید می‌نمایند. سپس تمامی فرزندها با یک مقدار معینی از احتمال، یعنی همان جهش، تغییر ژنتیکی می‌یابند. اکنون میزان شایستگی (برازندگی) فرزندان تعیین و در اجتماع جایگزین والدین شده و نسل جدید را ایجاد می‌نمایند. این چرخه آن‌قدر تکرار می‌شود تا یکی از معیارهای پایان بهینه‌سازی کسب شود.

کلیدواژه: خوشه بندی ، الگوریتم تکاملی ، بهینه سازی ، الگوریتم تجمع پرندگان