پاورپوینت خوشه بندی (pptx) 25 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 25 اسلاید
قسمتی از متن PowerPoint (.pptx) :
خوشه بندی Clustering
فهرست مطالب
کلیات خوشه بندی
مفاهیم خوشه بندی
معیار های فاصله تشابه و عدم تشابه
روش های خوشه بندی سلسله مراتبی
روش های خوشه بندی تفکیکی
روش های خوشه بندی فازی
خ و ش ه ب ن د ی
خوشه بندی
Clustering
کلیات :
تحلیل خوشه ای از روش های مهم خوشه بندی محسوب می شود . در تحلیل خوشه ای تلاش می شود تا مشاهدات واقعی در هر خوشه بیشترین تشابه را از نظر متغیر های مورد نظر با هم داشته باشند و مشاهدات هر گروه از مشاهدات گروه های دیگر بیشترین فاصله را داشته باشند . به عبارت دیگر خوشه بندی اساسا به معنای گروه بندی نمونه های مشابه است .
تفاوت میان خوشه بندی و کلاس بندی :
در واقع خوشه بندی یک نوع کلاس بندی بدون نظارت است که در آن کلاس ها از قبل مشخص نیستند . به همین دلیل خوشه بندی نوعی یادگیری بوسیله داده ها و مشاهدات است .
در خوشه بندی هیچ دسته ای از قبل وجود ندارد و در واقع متغیر ها بصورت متغیر های وابسته یا مستقل تقسیم نمی شوند ، بلکه بدنبال گروه هایی ار داده ها هستیم که به هم شباهت دارند و با کشف این شباهت می توان رفتارها را بهتر شناسایی می کند .
نکته :
برای پژوهشگران و کاربران خوشه بندی ، خوشه بندی هدف پایانی نیست بلکه آغازی است بر کارهای دیگر . مثلا در بازاریابی ابتدا مشتریان بر اساس شاخص های مختلف بخش بندی می شوند .سپس رفتار هر بخش را شناسایی و برای خدمت مناسبتر به هر بخش برنامه ریزی می شود .
مفاهیم خوشه بندی :
شی :
به هر داده ، رکورد ، شخص و یا موردی که قصد داریم خوشه بندی در آن انجام دهیم شی می گویند .
شاخص :
عبارتند از متغیرهای (کمی یا کیفی) که بر اساس آنها اشیا طبقه بندی می شوند .
برای نمایش داده ها و شاخص هایشان از ماتریس داده استفاده می شود که هر سطر را یک شی و هر ستون را یک شاخص در نظر می گیریم .تعداد اشیا را با n و تعداد شاخص ها را با d نشان می دهیم . ماتریس داده ها بصورت زیر خواهد بود که در آن Xij داده مربوط به شی i از نظر شاخص j است .
فاصله و تشابه :
در ادبیات تحلیل خوشه ای معیار های تشابه ، معیارهای عدم تشابه یا فاصله برای این منظور به کار می روند تا شباهت یا فاصله دو شی یا دو خوشه را بصورت کمی اندازه گیری کنند . برای نمونه فاصله اقلیدسی بین دو شی X و Y را با d(X,Y) نشان داده و با رابطه زیر محاسبه می شود .
خوشه :
مجموعه اشیایی است که فاصله آنها نسبت به یکدیگر کم و نسبت به اعضای دیگر زیاد است .که اعضای هر خوشه باید دارای خصوصیات زیر باشند :
ویژگی های آنها نسبت به یکدیگر یکسان و یا نزدیک به هم باشد .
فاصله یا عدم تشابه میان دو به دو آنها ، کم است .
با حداقل یکی از اعضای همان گروه روابط یا تماس هایی دارد .
به روشنی از مجموعه اعضای دیگر خوشه ها جداپذیر باشد .
شاخص های اعتبار : به دلیل اینکه خوشه بندی فرایند بدون نظارتی است و بسیاری از روش های آن به شدت تحت تاثیر مفروضات اولیه شان هستند ، لازم است ارزیابی ای در مورد نتایج خوشه بندی در تحقیقات صورت پذیرد تا اعتبار آن تایید شود .شاخص های اعتبار ، معیارهایی هستند که نتایج خوشه بندی را مورد سنجش و ارزیابی قرار می دهند .
شکل خوشه ها :
خوشه های توپی :
خوشه های کرمی شکل :
خوشه هایی کاملا مجزا نیستند :
فرایند های خوشه بندی :
تهیه و ارائه ماتریس داده ها
استاندارد کردن ماتریس داده ها
محاسبه ماتریس فاصله یا تشابه
اجرای روش خوشه بندی
محاسبه معیارهای اعتبار
روش های خوشه بندی :