تحقیق خوشه بندی و روشهای آن و خوشه بندی ترکیبی

تحقیق خوشه بندی و روشهای آن و خوشه بندی ترکیبی

دسته: رشته مهندسی فناوری اطلاعات

فرمت : word | صفحات : 74

قیمت: 8000 تومان
476 views

پیشینه تحقیق خوشه بندی و روشهای آن و خوشه بندی ترکیبی دارای ۷۴ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

۱-داده کاوی و خوشه بندی و روشهای خوشه بندی   ۵
۱-۱ مقدمه ای بر داده‌کاوی   ۵
۱-۲ تکنیکهای داده‌کاوی   ۷
۱-۳ مقدمه‌ای بر خوشه‌بندی   ۸
۱-۴ تفاوت خوشه بندی و دسته بندی   ۸
۱-۵ یادگیری با نظارت در مقابل یادگیری بدون‌نظارت   ۹
۱-۶ کاربردهای خوشه بندی   ۱۰
۱-۷ تقسیم‌بندی روش‌های خوشه‌بندی از جنبه های گوناگون   ۱۰
۱-۸ طبقه بندی دیگری از روشهای اصلی خوشه بندی   ۱۱
۱-۸-۱ روش افرازبندی   ۱۱
۱-۸-۱-۱ روش خوشه‌بندی K-Means (C-Means یا C-Centeriod)   ۱۳
۱-۸-۱-۲ الگوریتم خوشه‌بندی LBG   ۱۴
۱-۸-۲ روشهای سلسله مراتبی   ۱۵
۱-۸-۲-۱ خوشه‌بندی با روش Single-Link   ۱۸
۱-۸-۲-۲ خوشه‌بندی با روش Complete-Link   ۱۹
۱-۸-۲-۳ خوشه‌بندی با روش Average-Link   ۲۰
۱-۸-۲-۴ دیگر روشهای خوشه بندی سلسله مراتبی   ۲۰
۱-۸-۳ روش مبتنی بر چگالی   ۲۲
۱-۸-۳-۱ الگوریتم خوشه‌بندی براساس چگالی DBSCAN   ۲۵
۱-۸-۳-۲ الگوریتم سلسله مراتبی خوشه‌بندی براساس چگالی OPTICS :   ۲۶
۱-۸-۴ روشهای مبتنی بر شبکه های مشبک (Grid based)   ۲۷
۱-۸-۵ روشهای مبتنی بر مدل   ۲۷
۱-۸-۶ روش های فازی   ۲۷
۱-۹ هدف خوشه بندی   ۲۸
۱-۱۰ اندازهگیری کیفیت خوشه بندی   ۲۹
۱-۱۱ بررسی تکنیکهای اندازه‌گیری اعتبار خوشه‌ها   ۳۰
۱-۱۲ شاخصهای اعتبارسنجی   ۳۱
۱-۱۲-۱ شاخص دون (Dunn Index)   ۳۲
۱-۱۲-۲ شاخص دیویس بولدین (Davies Bouldin Index)   ۳۳
۱-۱۲-۳ شاخص‌های اعتبارسنجی ریشه میانگین مربع انحراف از معیار (RMSSDT) و ریشه R (RS):   ۳۴
۱-۱۲-۴ شاخص اعتبار‌سنجی SD   ۳۵
۱-۱۲-۵ شاخص اعتبارسنجی S_Dbw   ۳۶
۱-۱۲-۶ آزمایش ومقایسه کارایی شاخص‌های اعتبار سنجی   ۳۷
۱-۱۳ خوشهبندی ترکیبی   ۴۰
۱-۱۳-۱ ایجاد پراکندگی در خوشه‌بندی ترکیبی   ۴۱
۱-۱۳-۲ تابع توافقی   ۴۳
۱-۱۳-۳ مشکلات پیش روی خوشه‌بندی ترکیبی   ۴۴
۲- الگوریتم های خوشه بندی فازی   ۴۵
۲-۱ مقدمه   ۴۵
۲-۲ خوشه بندی فازی   ۴۶
۲-۳ الگوریتم خوشه بندی c میانگین (Fuzzy c-mean)   ۴۸
۲-۴ الگوریتم PFCM   ۵۲
۲-۵ الگوریتم AFCM   ۵۴
۲-۶ الگوریتم FPCM   ۵۵
۲-۷ الگوریتم خوشه بندی c میانگین برای داده های نویزی:   ۵۶
۲-۸ الگوریتم خوشه بندی c میانگین با استفاده از نمونه های برچسب گذاری شده:   ۵۷
۲-۹ توابع ارزیابی خوشه   ۵۸
۲-۹-۱ تابع ارزیابی ضریب افراز   ۵۹
۲-۹-۲ تابع ارزیابی آنتروپی افراز   ۵۹
۲-۹-۳ تابع Fukuyama and Sugeno   ۶۰
۲-۹-۴ تابع Beni Xie and   ۶۱
۲-۹-۵ تابع N.Zahid   ۶۱
۲-۹-۶ تابع M.Ramze Rezaee   ۶۲
۲-۱۰ خوشه‌بندی ترکیبی   ۶۴
مراجع   ۷۱

منابع

[۱] Baumgartner R., Somorjai R., Summers R., Richter W., Ryner L., and Jarmasz M. (2000), Resampling as a Cluster Validation Technique in fMRI, JOURNAL OF MAGNETICRESONANCE IMAGING 11: pp. 228–۲۳۱

[۲] Breckenridge J. (1989), Replicating cluster analysis: Method, consistency and validity, Multivariate Behavioral research.

[۳] Parvin H., Alizadeh H. and Minaei-Bidgoli B. (2009), Using Clustering for Generating Diversity in Classifier Ensemble, International Journal of Digital Content: Technology and its Application, JDCTA, ISSN: 1975-9339, Vol. 3, No.1, pp. 51-57.

[۴]Alizadeh H., Amirgholipour S.K., Seyedaghaee N.R. and Minaei-Bidgoli B. (200a),Nearest Cluster Ensemble (NCE): Clustering Ensemble Based Approach for Improving the performance of K-Nearest Neighbor Algorithm, 11th Conf. of the International Federation of Classification Societies, IFCS09, March 13–۱۸٫ (in press).

[۵] Alpaydin E., “Introduction to Machine Learning”, The MIT Press, 2004

[۶] Web A. R., “Statistical Pattern Recognition”, John Wiley & Sons, 2002

[۷] Keller F., “Clustering”, Computer University Saarlandes, Tutorial Slides

[۸] Sander J., “Principles of Knowledge Discovery in Data: Clustering I”, Department of Computing Science University of Alberta, Tutorial Slides, 2003

[۹] Duda R. O., Hart P. E., Stork D. G., “Pattern Classification And Scene Analysis”, John Wiley & Sons, 2000

[۱۰] Huang X., Acero A., Hon H.W., “Spoken Language Processing”, Printice Hall, 2000

[۱۱] Fred A. and Jain A.K. (2006), Learning Pairwise Similarity for Data Clustering, In Proc. Of the 18th Int. Conf. on Pattern Recognition (ICPR’06).

[۱۲] Kuncheva L.I. and Hadjitodorov S. (2004). Using diversity in cluster ensembles. In Proc. Of IEEE Intl. Conference on Systems, Man and Cybernetics, pages 1214–۱۲۱۹٫

[۱۳] Vega-Pons S. and Ruiz-Shulcloper J., A survey of clustering ensemble algorithms, International Journal of Pattern Recognition and Artificial Intelligence Vol. 25, No. 3 (2011) 337_372

[۱۴] Liu J., Xu M., Kernelized fuzzy attribute C-means clustering algorithm, Fuzzy Sets and Systems 159 (2008) 2428 – ۲۴۴۵

[۱۵] Adriaans P. and Zantinge D., Introduction to Data Mining and Knowledge Discovery، Third Edition ، Data Mining New York: Addison Wesley ۱۹۹۶

۱-داده کاوی و خوشه بندی و روشهای خوشهبندی

۱-۱ مقدمه ای بر داده‌کاوی

در دو دهه قبل توانایی های فنی بشر در تولید و جمع آوری داده ها به سرعت افزایش یافته است . عواملی نظیر به خدمتگرفتن کامپیوتر در کسب و کار، علوم ، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند. بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را با حجم وحشتناکی ازداده و اطلاعات مواجه می‌کند. این رشد انفجاری در داده های ذخیره شده، نیاز مبرمی برای تکنولوژی های جدید و ابزارهای خودکاری ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند.

داده کاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه داده های عظیم، انباره داده و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.

داده‌کاوی، پایگاه‌ها و مجموعه‌های حجیم داده‌ها را در پی کشف واستخراج دانش، مورد تحلیل و کند و کاوهای ماشینی (و نیمه‌ماشینی) قرار می‌دهد. این گونه مطالعات و کاوش‌ها را به واقع می‌توان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینه‌ها و کاربردها، و نیز ابعاد و اندازه‌های داده‌های امروزین است که شیوه‌های ماشینی مربوط به یادگیری، مدل‌سازی، و آموزش را طلب می‌نماید. [۴]

اصلی ترین دلیلی که باعث شد داده کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، مساله در دسترس بودن حجم وسیعی از داده ها و نیاز شدید به اینکه از این داده ها اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بدست آمده در کاربردهای وسیعی از مدیریت کسب و کار وکنترل تولید و تحلیل بازار تا طراحی مهندسی و تحقیقات علمی مورد استفاده قرار می گیرد.

داده کاوی را می توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده می باشد، نظیر عملیات: جمع آوری داده ها وایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده ها. تکامل تکنولوژی پایگاه داده و استفاده فراوان آن در کاربردهای مختلف سبب جمع آوری حجم داده فراوان شده است .این داده های فراوان باعث ایجاد نیاز برای ابزارهای قدرتمند برای تحلیل داده ها گشته، زیرا در حال حاضر به لحاظ داده ثروتمند هستیم ولی دچار کمبود اطلاعات می باشیم .شکاف موجود بین داده ها و اطلاعات سبب ایجاد نیاز برای ابزارهای داده کاوی شده است تا داده های بی ارزش را به دانشی ارزشمند تبدیل کنیم.

۱-۲ تکنیکهای داده‌کاوی

تکنیکهای استفاده شده در فرآیند داده کاوی تعیین می کند که چه نوع الگویی در کار داده کاوی قابل دستیابی است.کار داده کاوی دو نوع عملکرد خواهد داشت: توصیف کننده و پیش بینی کننده داده کاوی توصیف کننده، به توصیف مشخصه عمومی داده ها می پردازد و داده کاوی پیش بینی کننده بر اساس داده های موجود به پیش بینی روند آتی می پردازد. از آنجاییکه بعضی از الگوها برای همه داده های منبع داده، قابل اعمال نیست، همیشه باید یک معیار اطمینان بخشی یا “میزان صحت ” به هر الگوی کشف شده نسبت داد. تکنیکهای داده کاوی بسیاری موجود است که با توجه به هدفی که از داده کاوی داریم از میان آنها بر می گزینیم.این تکنیکها همانند قوانین انجمنی، دسته بندی ،خوشه بندی و…بوده که هر یک شامل الگوریتم های بسیاری می باشد. ما در اینجا به خوشه بندی می پردازیم و الگوریتم های آنرا مرور میکنیم وپیشرفتهای صورت گرفته در این تکنیک را بررسی مینماییم. [۵]

۱-۳ مقدمه‌ای بر خوشه‌بندی

خوشه‌بندی را می‌توان به عنوان مهمترین مسئله در یادگیری بدون نظارت در نظر گرفت. خوشه‌بندی با یافتن یک ساختار درون یک مجموعه از داده‌های بدون برچسب درگیر است. خوشه‌ به مجموعه‌ای از داده‌ها گفته می‌شود که به هم شباهت داشته باشند. در خوشه‌بندی سعی می‌شود تا دادهها به خوشه‌هایی تقسیم شوند که شباهت بین داده‌های درون هر خوشه حداکثر و شباهت بین داده‌های درون خوشه‌های متفاوت حداقل شود. [۶,۷]

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.

مطالب پیشنهادی:

تحقیق الگوریتم‌های خوشه‌بندی و خوشه بندی ترکیبی

تحقیق شبکه‌های حسگر بی‌سیم و مسیریابی و خوشه بندی در آن

تحقیق داده‌کاوی و خوشه بندی و روش های آن و الگوریتم خوشه بندی

تحقیق خوشه بندی اطلاعات و انواع روشهای خوشه بندی و روشهای بهینه سازی