تحقیق خوشه‌بندی و خوشه بندی ترکیبی و خوشه‌بندی ترکیبی مبتنی بر انتخاب

تحقیق خوشه‌بندی و خوشه بندی ترکیبی و خوشه‌بندی ترکیبی مبتنی بر انتخاب

دسته: رشته مهندسی فناوری اطلاعات

فرمت : word | صفحات : 86

قیمت: 8000 تومان
692 views

پیشینه تحقیق خوشه‌بندی و خوشه بندی ترکیبی و خوشه‌بندی ترکیبی مبتنی بر انتخاب دارای ۸۶ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

۲-۱٫ مقدمه   ۵
۲-۲٫ خوشه‌بندی   ۵
۲-۲-۱٫ الگوریتمهای خوشه بندی پایه   ۵
۲-۲-۱-۱٫ الگوریتم‌های سلسله مراتبی   ۶
۲-۲-۱-۱-۱٫ تعاریف و نماد‌ها   ۸
۲-۲-۱-۱-۲٫ الگوریتم پیوندی منفرد   ۹
۲-۲-۱-۱-۳٫ الگوریتم پیوندی کامل   ۱۰
۲-۲-۱-۱-۴٫ الگوریتم پیوندی میانگین   ۱۱
۲-۲-۱-۱-۵٫ الگوریتم پیوندی بخشی   ۱۲
۲-۲-۱-۲٫ الگوریتم‌های افرازبندی   ۱۲
۲-۲-۱-۲-۱٫ الگوریتم K-means   ۱۳
۲-۲-۱-۲-۲٫ الگوریتم FCM   ۱۴
۲-۲-۱-۲-۳٫ الگوریتم طیفی   ۱۶
۲-۲-۱-۲-۳-۱٫ الگوریتم برش نرمال   ۱۷
۲-۲-۱-۲-۳-۲٫ الگوریتم NJW   ۱۸
۲-۲-۱-۲-۴٫ الگوریتم خوشه‌بندی کاهشی   ۲۰
۲-۲-۱-۲-۵٫ الگوریتم خوشه‌بندی Median K-Flat   ۲۱
۲-۲-۱-۲-۶٫ الگوریتم خوشه‌بندی مخلوط گوسی   ۲۴
۲-۲-۲٫ معیارهای ارزیابی   ۲۶
۲-۲-۲-۱٫ معیار SSE   ۲۷
۲-۲-۲-۲٫ معیار اطلاعات متقابل نرمال شده   ۲۹
۲-۲-۲-۳٫ معیار APMM   ۳۲
۲-۳. خوشه‌بندی ترکیبی   ۳۳
۲-۳-۱٫ ایجاد تنوع در خوشه‌بندی ترکیبی   ۳۴
۲-۳-۱-۱٫ استفاده از الگوریتم‌های مختلف خوشه‌بندی ترکیبی   ۳۵
۲-۳-۱-۲٫ تغییر پارامترهای اولیه خوشه‌بندی ترکیبی   ۳۶
۲-۳-۱-۳٫ انتخاب یا تولید ویژگی‌های جدید   ۳۷
۲-۳-۱-۴٫ انتخاب زیرمجموعه‌ای از مجموعه داده اصلی   ۳۷
۲-۳-۲٫ ترکیب نتایج با تابع توافقی   ۳۷
۲-۳-۲-۱٫ روش مبتنی بر مدل مخلوط   ۳۸
۲-۳-۲-۲٫ روش مبتنی بر ابر گراف   ۴۶
۲-۳-۲-۲-۱٫ روش CSPA   ۴۸
۲-۳-۲-۲-۲٫ روش HGPA   ۴۹
۲-۳-۲-۲-۳٫ روش MCLA   ۵۰
۲-۳-۲-۳٫ روش‌های مبتنی بر ماتریس همبستگی   ۵۲
۲-۳-۲-۳-۱٫ الگوریتم‌های سلسله مراتبی تراکمی   ۵۳
۲-۳-۲-۳-۲٫ الگوریتم افرازبندی گراف با تکرار   ۵۴
۲-۳-۳٫ الگوریتم‌های خوشه‌بندی ترکیبی کامل   ۵۹
۲-۴٫ خوشه‌بندی ترکیبی مبتنی بر انتخاب   ۵۹
۲-۴-۱٫ خوشه‌بندی ترکیبی مبتنی بر انتخاب فرن و لین   ۶۰
۲-۴-۱-۱٫ تعریف معیار کیفیت در روش فرن و لین   ۶۰
۲-۴-۱-۲٫ تعریف معیار پراکندگی در روش فرن و لین   ۶۱
۲-۴-۱-۳٫ راهکار انتخاب خوشه‌ برای تشکیل نتیجه نهایی در روش فرن و لین   ۶۲
۲-۴-۲٫ الگوریتم هوشمند طبقه‌بندی مجموعه داده‌ها   ۶۳
۲-۴-۳٫ خوشه‌بندی ترکیبی طیفی مبتنی بر انتخاب بر اساس شباهت   ۶۴
۲-۴-۳-۱٫ معیار ارزیابی در روش پیشنهادی ژیا   ۶۵
۲-۴-۳-۲٫ انتخاب خوشه‌بندی بر اساس قانون نزدیک‌ترین همسایه در روش ژیا   ۶۶
۲-۴-۴٫ خوشه‌بندی ترکیبی انتخابی لی‌مین   ۶۸
۲-۴-۴-۱٫ انتخاب افراز مرجع در روش لی‌مین   ۶۸
۲-۴-۴-۲٫ راهکار انتخاب خوشه در روش‌ لی‌مین   ۷۰
۲-۴-۴-۳٫ چهارچوب الگوریتم خوشه‌بندی انتخابی لی‌مین   ۷۲
۲-۴-۵٫ خوشه‌بندی بر اساس معیار MAX با استفاده از مجموعه‌ای از خوشه‌های یک افراز   ۷۳
۲-۴-۵-۱٫ راهکار ارزیابی خوشهی MAX   ۷۳
۲-۴-۵-۲٫ روش انباشت مدارک توسعهیافته   ۷۴
۲-۴-۶٫ خوشه‌بندی بر اساس معیار APMM با استفاده از مجموعه‌ای از خوشه‌های یک افراز   ۷۵
۲-۵٫ روش بهترین افراز توافقی اعتبارسنجی شده   ۷۷
۲-۶٫ استفاده از نظریه خرد جمعی در علوم رایانه   ۷۸
منابع و مآخذ   ۸۰

منابع

[۱] حسین علیزاده، خوشه‌بندی ترکیبی مبتنی بر زیرمجموعه‌ای از نتایج اولیه، پایان‌نامه کارشناسی ارشد، دانشکده کامپیوتر دانشگاه علم و صنعت ایران، اسفند ۱۳۸۷

[۲] جواد عظیمی، بررسی پراکندگی در خوشه‌بندی ترکیبی، پایان‌نامه کارشناسی ارشد، دانشکده کامپیوتر دانشگاه علم و صنعت ایران، خرداد ۱۳۸۶

[۳] Ayad H.G. and Kamel M.S., “Cumulative Voting Consensus Method for Partitions with a Variable Number of Clusters”, IEEE Trans. On Pattern Analysis and Machine Intelligence, VOL. 30, NO. 1, 160-173, 2008.

[۴] Azimi J., Maani J. and Mozayyeni N., “Improved Clustering Ensembles”, 11th International CSI Computer Conference (CSICC06), Tehran, Iran, pp. 24-26, January 2006.

[۵] Azimi J., Mohammadi M., Analoui M., “Clustering Ensembles Using Genetic Algorithm”, in IEEE CAMPS, 2006.

[۶] Azimi J., Analoui M., “Improved Clustering Ensembles Using Maximal Similar Features and Non-Random K-means”, The IASTED International Conference on Artificial Intelligence and Applications, Innsbruck, Austria, pp. 12 – ۱۴, February 2007.

[۷] Azimi J., Fern X., “Adaptive Cluster Ensemble Selection”, International Joint Conferences on Artificial Intelligence, 2009.

[۸] Alizadeh H., Minae i.M. and Parvin H., “A New Asymmetric Criterion for Cluster Validation”, Springer-Verlag Berlin Heidelberg, pp.320-30, 2011.

[۹] Alizadeh H., Parvin H. and Parvin S., “A Framework for Cluster Ensemble Based on a Max Metric as Cluster Evaluator”, International Journal of Computer Science (IAENG), pp.1-39, 2012.

[۱۰] Baker L. and Ellison D., “The wisdom of crowds — ensembles and modules in environmental modeling”, Geoderma, 147, pp.1-7, 2008.

[۱۱] Chung, F. R. K., “Spectral Graph Theory”, CBMS Regional Conference Series in Mathematics, vol. 92, 1997.

[۱۲] Chris Ding and Xiaofeng He., “K-means clustering via Principal Component Analysis”, Proc. of Int’l Conf. Machine Learning (ICML’04), pp. 225-232. July 2004.

[۱۳] Dunn J. C., “A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters”, Journal of Cybernetics, vol. 3, pp. 32-57, 1973.

[۱۴] Davis L., “Handbook of Genetic Algorithms”, Van Nostrand Reinhold, New York, ISBN-10: 0442001738, ISBN-13: 978-0442001735, 1991.

[۱۵] Driessche R.V. and D. Roose, “An improved spectral bisection algorithm and its application to dynamic load balancing, parallel Computing, vol. 21, 1995.

[۱۶] Dempster A. P., Laird N. M. and Rubin D. B., “Maximum Likelihood from Incomplete Data via the EM Algorithm”, Journal of the Royal Statistical Society B, vol. 39, pp. 1-22, 1997.

[۱۷] Dudoit S. and Fridly J., “Bagging to improve the accuracy of a clustering procedure”, Bioinformatics 19, pp.1090–۱۰۹۹, ۲۰۱۳٫

[۱۸] Fred A. L. N. and Jain A. K., “Data Clustering Using Evidence Accumulation”, Proc. of the 16th Intl. Conf. on Pattern Recognition, ICPR02, Quebec City, pp. 276 – ۲۸۰, ۲۰۰۲٫

[۱۹] Fred A. L. N. and Jain A. K., “Combining Multiple Clusterings Using Evidence Accumulation. IEEE Trans”, Pattern Analysis and Machine Intelligence, vol. 27(6), pp. 835–۸۵۰, ۲۰۰۵٫

۲-۱٫ مقدمه

در این مقاله، کارهای انجام‌شده در خوشه‌بندی و خوشه‌بندی ترکیبی را مورد مطالعه قرار می‌دهیم. ابتدا چند الگوریتم‌ پایه خوشه‌بندی معروف را معرفی خواهیم کرد. سپس چند روش کاربردی جهت ارزیابی خوشه، خوشه‌بندی و افرازبندی را مورد مطالعه قرار می‌دهیم. در ادامه به بررسی ادبیات خوشه‌بندی ترکیبی خواهیم پرداخت و روش‌های ترکیب متداول را بررسی خواهیم کرد. از روش‌های خوشه‌بندی ترکیبی، روش ترکیب کامل و چند روش معروف مبتنی بر انتخاب را به صورت مفصل شرح خواهیم داد.

۲-۲٫ خوشه‌بندی

در این بخش ابتدا انواع الگوریتم‌های خوشه‌بندی پایه را معرفی می‌کنیم و سپس برخی از آن‌ها را مورد مطالعه قرار می‌دهیم سپس برای ارزیابی نتایج به دست آمده چند متریک معرفی خواهیم کرد.

۲-۲-۱٫ الگوریتم‌های خوشه‌بندی پایه

به طور کلی، الگوریتم‌های خوشه‌بندی را می‌توان به دو دسته کلی تقسیم کرد:

۱- الگوریتم‌های سلسله مراتبی[۱]

۲- الگوریتم‌های افرازبندی[۲]

الگوریتم‌های سلسله مراتبی، یک روال برای تبدیل یک ماتریس مجاورت به یک دنباله از افرازهای تو در تو، به صورت یک درخت است. در این روش‌ها، مستقیماً با داده‌ها سروکار داریم و از روابط بین آن‌ها برای به دست آوردن خوشه‌ها استفاده می‌کنیم. یکی از ویژگی‌های این روش قابلیت تعیین تعداد خوشه‌ها به صورت بهینه می‌باشد. در نقطه مقابل الگوریتم‌های سلسله مراتبی، الگوریتم‌های افرازبندی قرار دارند. هدف این الگوریتم‌ها، تقسیم داده‌ها در خوشه‌ها، به گونه‌ای است که داده‌های درون یک خوشه بیش‌ترین شباهت را به همدیگر داشته باشند؛ و درعین‌حال، بیش‌ترین فاصله و اختلاف را با داده‌های خوشه‌های دیگر داشته باشند. در این فصل تعدادی از متداول‌ترین الگوریتم‌های خوشه‌بندی، در دو دسته سلسله مراتبی و افرازبندی، مورد بررسی قرار می‌گیرند. از روش سلسله‌ مراتبی چهار الگوریتم‌ از سری الگوریتم‌های پیوندی[۳] را مورد بررسی قرار می‌دهیم. و از الگوریتم‌های افرازبندی K-means، FCM و الگوریتم طیفی را مورد بررسی خواهیم داد.

۲-۲-۱-۱٫ الگوریتم‌های سلسله مراتبی

همان‌گونه که در شکل ۲-۱ مشاهده می‌شود، روال الگوریتم‌های خوشه‌بندی سلسله مراتبی را می‌تواند به صورت یک دندوگرام[۴] نمایش داد. این نوع نمایش تصویری از خوشه‌بندی سلسله مراتبی، برای انسان، بیشتر از یک لیست از نمادها قابل‌درک است. در واقع دندوگرام، یک نوع خاص از ساختار درخت است که یک تصویر قابل‌فهم از خوشه‌بندی سلسله مراتبی را ارائه می‌کند. هر دندوگرام شامل چند لایه از گره‌هاست، به طوری که هر لایه یک خوشه را نمایش می‌دهد. خطوط متصل‌کننده گره‌ها، بیانگر خوشه‌هایی هستند که به صورت آشیانه‌ای[۵] داخل یکدیگر قرار دارند. برش افقی یک دندوگرام، یک خوشه‌بندی را تولید می‌کند [۳۳].

اگر الگوریتم‌های خوشه‌بندی سلسله مراتبی، دندوگرام را به صورت پایین به بالا بسازند، الگوریتم‌های خوشه‌بندی سلسله مراتبی تراکمی[۱] نامیده می‌شوند. همچنین، اگر آن‌ها دندوگرام را به صورت بالا به پایین بسازند، الگوریتم‌های خوشه‌بندی سلسله مراتبی تقسیم‌کننده[۲] نامیده می‌شوند [۲۶]. مهم‌ترین روش‌های خوشه‌بندی سلسله مراتبی الگوریتم‌های سری پیوندی می‌باشد که در این بخش تعدادی از کاراترین آن‌ها مورد بررسی قرار خواهند گرفت که عبارت‌اند از:

الگوریتم پیوندی منفرد[۳]

الگوریتم پیوندی کامل[۴]

الگوریتم پیوندی میانگین[۵]

الگوریتم پیوندی بخشی[۶]

۲-۲-۱-۱-۱٫ تعاریف و نماد‌ها

قبل از معرفی این الگوریتم‌ها، در ابتدا نمادها و نحوه نمایش مسئله نمایش داده خواهد شد. فرض کنید که یک ماتریس مجاورت متقارن داریم. وارده در هر سمت قطر اصلی قرار دارد که شامل یک جای گشت اعداد صحیح بین ۱ تا است. ما مجاورت‌ها را عدم شباهت در نظر می‌گیریم. به این معنی است که اشیاء ۱ و ۳ بیشتر از اشیاء ۱ و ۲ به هم شبیه‌اند. یک مثال از ماتریس مجاورت معمول برای است که در شکل ۲-۲ نشان داده شده است. یک گراف آستانه[۱]، یک گراف غیر جهت‌دار و غیر وزن‌دار، روی گره، بدون حلقه بازگشت به خود[۲] یا چند لبه است. هر نود یک شیء را نمایش می‌دهد. یک گراف آستانه برای هر سطح عدم شباهت به این صورت تعریف می‌شود: اگر عدم شباهت اشیاء و از حد آستانه کوچک‌تر باشد، با واردکردن یک لبه بین نودهای و یک گراف آستانه تعریف می‌کنیم.

۲-۲-۱-۱-۲٫ الگوریتم پیوندی منفرد

این الگوریتم روش کمینه و روش نزدیک‌ترین همسایه نیز نامیده می‌شود [۲۶]. اگر و خوشه‌ها باشند، در روش پیوندی منفرد، فاصله آن‌ها برابر خواهد بود

که نشان‌دهنده فاصله (عدم شباهت) بین نقاط a و b در ماتریس مجاورت است. شکل ۲-۵ این الگوریتم را نمایش می‌دهد. شکل ۲-۶ دندوگرام حاصل از روش پیوندی منفرد را برای ماتریس ، را نشان می‌دهد.

[۱] Threshold graph

[۲] Self-loop

[۱] Agglomerative

[۲] Divisive

[۳] Single Linkage

[۴] Complete Linkage

[۵] Average Linkage

[۶] Ward Linkage

[۱] Hierarchical

[۲] Partitioning

[۳] Linkage

[۴] Dendogram

[۵] Nested

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.

مطالب پیشنهادی:

تحقیق الگوریتم‌های خوشه‌بندی و خوشه بندی ترکیبی