پیشینه تحقیق خوشهبندی و خوشه بندی ترکیبی و خوشهبندی ترکیبی مبتنی بر انتخاب دارای ۸۶ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.
۲-۱٫ مقدمه ۵
۲-۲٫ خوشهبندی ۵
۲-۲-۱٫ الگوریتمهای خوشه بندی پایه ۵
۲-۲-۱-۱٫ الگوریتمهای سلسله مراتبی ۶
۲-۲-۱-۱-۱٫ تعاریف و نمادها ۸
۲-۲-۱-۱-۲٫ الگوریتم پیوندی منفرد ۹
۲-۲-۱-۱-۳٫ الگوریتم پیوندی کامل ۱۰
۲-۲-۱-۱-۴٫ الگوریتم پیوندی میانگین ۱۱
۲-۲-۱-۱-۵٫ الگوریتم پیوندی بخشی ۱۲
۲-۲-۱-۲٫ الگوریتمهای افرازبندی ۱۲
۲-۲-۱-۲-۱٫ الگوریتم K-means ۱۳
۲-۲-۱-۲-۲٫ الگوریتم FCM ۱۴
۲-۲-۱-۲-۳٫ الگوریتم طیفی ۱۶
۲-۲-۱-۲-۳-۱٫ الگوریتم برش نرمال ۱۷
۲-۲-۱-۲-۳-۲٫ الگوریتم NJW ۱۸
۲-۲-۱-۲-۴٫ الگوریتم خوشهبندی کاهشی ۲۰
۲-۲-۱-۲-۵٫ الگوریتم خوشهبندی Median K-Flat ۲۱
۲-۲-۱-۲-۶٫ الگوریتم خوشهبندی مخلوط گوسی ۲۴
۲-۲-۲٫ معیارهای ارزیابی ۲۶
۲-۲-۲-۱٫ معیار SSE ۲۷
۲-۲-۲-۲٫ معیار اطلاعات متقابل نرمال شده ۲۹
۲-۲-۲-۳٫ معیار APMM ۳۲
۲-۳. خوشهبندی ترکیبی ۳۳
۲-۳-۱٫ ایجاد تنوع در خوشهبندی ترکیبی ۳۴
۲-۳-۱-۱٫ استفاده از الگوریتمهای مختلف خوشهبندی ترکیبی ۳۵
۲-۳-۱-۲٫ تغییر پارامترهای اولیه خوشهبندی ترکیبی ۳۶
۲-۳-۱-۳٫ انتخاب یا تولید ویژگیهای جدید ۳۷
۲-۳-۱-۴٫ انتخاب زیرمجموعهای از مجموعه داده اصلی ۳۷
۲-۳-۲٫ ترکیب نتایج با تابع توافقی ۳۷
۲-۳-۲-۱٫ روش مبتنی بر مدل مخلوط ۳۸
۲-۳-۲-۲٫ روش مبتنی بر ابر گراف ۴۶
۲-۳-۲-۲-۱٫ روش CSPA ۴۸
۲-۳-۲-۲-۲٫ روش HGPA ۴۹
۲-۳-۲-۲-۳٫ روش MCLA ۵۰
۲-۳-۲-۳٫ روشهای مبتنی بر ماتریس همبستگی ۵۲
۲-۳-۲-۳-۱٫ الگوریتمهای سلسله مراتبی تراکمی ۵۳
۲-۳-۲-۳-۲٫ الگوریتم افرازبندی گراف با تکرار ۵۴
۲-۳-۳٫ الگوریتمهای خوشهبندی ترکیبی کامل ۵۹
۲-۴٫ خوشهبندی ترکیبی مبتنی بر انتخاب ۵۹
۲-۴-۱٫ خوشهبندی ترکیبی مبتنی بر انتخاب فرن و لین ۶۰
۲-۴-۱-۱٫ تعریف معیار کیفیت در روش فرن و لین ۶۰
۲-۴-۱-۲٫ تعریف معیار پراکندگی در روش فرن و لین ۶۱
۲-۴-۱-۳٫ راهکار انتخاب خوشه برای تشکیل نتیجه نهایی در روش فرن و لین ۶۲
۲-۴-۲٫ الگوریتم هوشمند طبقهبندی مجموعه دادهها ۶۳
۲-۴-۳٫ خوشهبندی ترکیبی طیفی مبتنی بر انتخاب بر اساس شباهت ۶۴
۲-۴-۳-۱٫ معیار ارزیابی در روش پیشنهادی ژیا ۶۵
۲-۴-۳-۲٫ انتخاب خوشهبندی بر اساس قانون نزدیکترین همسایه در روش ژیا ۶۶
۲-۴-۴٫ خوشهبندی ترکیبی انتخابی لیمین ۶۸
۲-۴-۴-۱٫ انتخاب افراز مرجع در روش لیمین ۶۸
۲-۴-۴-۲٫ راهکار انتخاب خوشه در روش لیمین ۷۰
۲-۴-۴-۳٫ چهارچوب الگوریتم خوشهبندی انتخابی لیمین ۷۲
۲-۴-۵٫ خوشهبندی بر اساس معیار MAX با استفاده از مجموعهای از خوشههای یک افراز ۷۳
۲-۴-۵-۱٫ راهکار ارزیابی خوشهی MAX ۷۳
۲-۴-۵-۲٫ روش انباشت مدارک توسعهیافته ۷۴
۲-۴-۶٫ خوشهبندی بر اساس معیار APMM با استفاده از مجموعهای از خوشههای یک افراز ۷۵
۲-۵٫ روش بهترین افراز توافقی اعتبارسنجی شده ۷۷
۲-۶٫ استفاده از نظریه خرد جمعی در علوم رایانه ۷۸
منابع و مآخذ ۸۰
[۱] حسین علیزاده، خوشهبندی ترکیبی مبتنی بر زیرمجموعهای از نتایج اولیه، پایاننامه کارشناسی ارشد، دانشکده کامپیوتر دانشگاه علم و صنعت ایران، اسفند ۱۳۸۷
[۲] جواد عظیمی، بررسی پراکندگی در خوشهبندی ترکیبی، پایاننامه کارشناسی ارشد، دانشکده کامپیوتر دانشگاه علم و صنعت ایران، خرداد ۱۳۸۶
[۳] Ayad H.G. and Kamel M.S., “Cumulative Voting Consensus Method for Partitions with a Variable Number of Clusters”, IEEE Trans. On Pattern Analysis and Machine Intelligence, VOL. 30, NO. 1, 160-173, 2008.
[۴] Azimi J., Maani J. and Mozayyeni N., “Improved Clustering Ensembles”, 11th International CSI Computer Conference (CSICC06), Tehran, Iran, pp. 24-26, January 2006.
[۵] Azimi J., Mohammadi M., Analoui M., “Clustering Ensembles Using Genetic Algorithm”, in IEEE CAMPS, 2006.
[۶] Azimi J., Analoui M., “Improved Clustering Ensembles Using Maximal Similar Features and Non-Random K-means”, The IASTED International Conference on Artificial Intelligence and Applications, Innsbruck, Austria, pp. 12 – ۱۴, February 2007.
[۷] Azimi J., Fern X., “Adaptive Cluster Ensemble Selection”, International Joint Conferences on Artificial Intelligence, 2009.
[۸] Alizadeh H., Minae i.M. and Parvin H., “A New Asymmetric Criterion for Cluster Validation”, Springer-Verlag Berlin Heidelberg, pp.320-30, 2011.
[۹] Alizadeh H., Parvin H. and Parvin S., “A Framework for Cluster Ensemble Based on a Max Metric as Cluster Evaluator”, International Journal of Computer Science (IAENG), pp.1-39, 2012.
[۱۰] Baker L. and Ellison D., “The wisdom of crowds — ensembles and modules in environmental modeling”, Geoderma, 147, pp.1-7, 2008.
[۱۱] Chung, F. R. K., “Spectral Graph Theory”, CBMS Regional Conference Series in Mathematics, vol. 92, 1997.
[۱۲] Chris Ding and Xiaofeng He., “K-means clustering via Principal Component Analysis”, Proc. of Int’l Conf. Machine Learning (ICML’04), pp. 225-232. July 2004.
[۱۳] Dunn J. C., “A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters”, Journal of Cybernetics, vol. 3, pp. 32-57, 1973.
[۱۴] Davis L., “Handbook of Genetic Algorithms”, Van Nostrand Reinhold, New York, ISBN-10: 0442001738, ISBN-13: 978-0442001735, 1991.
[۱۵] Driessche R.V. and D. Roose, “An improved spectral bisection algorithm and its application to dynamic load balancing, parallel Computing, vol. 21, 1995.
[۱۶] Dempster A. P., Laird N. M. and Rubin D. B., “Maximum Likelihood from Incomplete Data via the EM Algorithm”, Journal of the Royal Statistical Society B, vol. 39, pp. 1-22, 1997.
[۱۷] Dudoit S. and Fridly J., “Bagging to improve the accuracy of a clustering procedure”, Bioinformatics 19, pp.1090–۱۰۹۹, ۲۰۱۳٫
[۱۸] Fred A. L. N. and Jain A. K., “Data Clustering Using Evidence Accumulation”, Proc. of the 16th Intl. Conf. on Pattern Recognition, ICPR02, Quebec City, pp. 276 – ۲۸۰, ۲۰۰۲٫
[۱۹] Fred A. L. N. and Jain A. K., “Combining Multiple Clusterings Using Evidence Accumulation. IEEE Trans”, Pattern Analysis and Machine Intelligence, vol. 27(6), pp. 835–۸۵۰, ۲۰۰۵٫
در این مقاله، کارهای انجامشده در خوشهبندی و خوشهبندی ترکیبی را مورد مطالعه قرار میدهیم. ابتدا چند الگوریتم پایه خوشهبندی معروف را معرفی خواهیم کرد. سپس چند روش کاربردی جهت ارزیابی خوشه، خوشهبندی و افرازبندی را مورد مطالعه قرار میدهیم. در ادامه به بررسی ادبیات خوشهبندی ترکیبی خواهیم پرداخت و روشهای ترکیب متداول را بررسی خواهیم کرد. از روشهای خوشهبندی ترکیبی، روش ترکیب کامل و چند روش معروف مبتنی بر انتخاب را به صورت مفصل شرح خواهیم داد.
در این بخش ابتدا انواع الگوریتمهای خوشهبندی پایه را معرفی میکنیم و سپس برخی از آنها را مورد مطالعه قرار میدهیم سپس برای ارزیابی نتایج به دست آمده چند متریک معرفی خواهیم کرد.
به طور کلی، الگوریتمهای خوشهبندی را میتوان به دو دسته کلی تقسیم کرد:
۱- الگوریتمهای سلسله مراتبی[۱]
۲- الگوریتمهای افرازبندی[۲]
الگوریتمهای سلسله مراتبی، یک روال برای تبدیل یک ماتریس مجاورت به یک دنباله از افرازهای تو در تو، به صورت یک درخت است. در این روشها، مستقیماً با دادهها سروکار داریم و از روابط بین آنها برای به دست آوردن خوشهها استفاده میکنیم. یکی از ویژگیهای این روش قابلیت تعیین تعداد خوشهها به صورت بهینه میباشد. در نقطه مقابل الگوریتمهای سلسله مراتبی، الگوریتمهای افرازبندی قرار دارند. هدف این الگوریتمها، تقسیم دادهها در خوشهها، به گونهای است که دادههای درون یک خوشه بیشترین شباهت را به همدیگر داشته باشند؛ و درعینحال، بیشترین فاصله و اختلاف را با دادههای خوشههای دیگر داشته باشند. در این فصل تعدادی از متداولترین الگوریتمهای خوشهبندی، در دو دسته سلسله مراتبی و افرازبندی، مورد بررسی قرار میگیرند. از روش سلسله مراتبی چهار الگوریتم از سری الگوریتمهای پیوندی[۳] را مورد بررسی قرار میدهیم. و از الگوریتمهای افرازبندی K-means، FCM و الگوریتم طیفی را مورد بررسی خواهیم داد.
همانگونه که در شکل ۲-۱ مشاهده میشود، روال الگوریتمهای خوشهبندی سلسله مراتبی را میتواند به صورت یک دندوگرام[۴] نمایش داد. این نوع نمایش تصویری از خوشهبندی سلسله مراتبی، برای انسان، بیشتر از یک لیست از نمادها قابلدرک است. در واقع دندوگرام، یک نوع خاص از ساختار درخت است که یک تصویر قابلفهم از خوشهبندی سلسله مراتبی را ارائه میکند. هر دندوگرام شامل چند لایه از گرههاست، به طوری که هر لایه یک خوشه را نمایش میدهد. خطوط متصلکننده گرهها، بیانگر خوشههایی هستند که به صورت آشیانهای[۵] داخل یکدیگر قرار دارند. برش افقی یک دندوگرام، یک خوشهبندی را تولید میکند [۳۳].
اگر الگوریتمهای خوشهبندی سلسله مراتبی، دندوگرام را به صورت پایین به بالا بسازند، الگوریتمهای خوشهبندی سلسله مراتبی تراکمی[۱] نامیده میشوند. همچنین، اگر آنها دندوگرام را به صورت بالا به پایین بسازند، الگوریتمهای خوشهبندی سلسله مراتبی تقسیمکننده[۲] نامیده میشوند [۲۶]. مهمترین روشهای خوشهبندی سلسله مراتبی الگوریتمهای سری پیوندی میباشد که در این بخش تعدادی از کاراترین آنها مورد بررسی قرار خواهند گرفت که عبارتاند از:
الگوریتم پیوندی منفرد[۳]
الگوریتم پیوندی کامل[۴]
الگوریتم پیوندی میانگین[۵]
الگوریتم پیوندی بخشی[۶]
قبل از معرفی این الگوریتمها، در ابتدا نمادها و نحوه نمایش مسئله نمایش داده خواهد شد. فرض کنید که یک ماتریس مجاورت متقارن داریم. وارده در هر سمت قطر اصلی قرار دارد که شامل یک جای گشت اعداد صحیح بین ۱ تا است. ما مجاورتها را عدم شباهت در نظر میگیریم. به این معنی است که اشیاء ۱ و ۳ بیشتر از اشیاء ۱ و ۲ به هم شبیهاند. یک مثال از ماتریس مجاورت معمول برای است که در شکل ۲-۲ نشان داده شده است. یک گراف آستانه[۱]، یک گراف غیر جهتدار و غیر وزندار، روی گره، بدون حلقه بازگشت به خود[۲] یا چند لبه است. هر نود یک شیء را نمایش میدهد. یک گراف آستانه برای هر سطح عدم شباهت به این صورت تعریف میشود: اگر عدم شباهت اشیاء و از حد آستانه کوچکتر باشد، با واردکردن یک لبه بین نودهای و یک گراف آستانه تعریف میکنیم.
این الگوریتم روش کمینه و روش نزدیکترین همسایه نیز نامیده میشود [۲۶]. اگر و خوشهها باشند، در روش پیوندی منفرد، فاصله آنها برابر خواهد بود
که نشاندهنده فاصله (عدم شباهت) بین نقاط a و b در ماتریس مجاورت است. شکل ۲-۵ این الگوریتم را نمایش میدهد. شکل ۲-۶ دندوگرام حاصل از روش پیوندی منفرد را برای ماتریس ، را نشان میدهد.
[۱] Threshold graph
[۲] Self-loop
[۱] Agglomerative
[۲] Divisive
[۳] Single Linkage
[۴] Complete Linkage
[۵] Average Linkage
[۶] Ward Linkage
[۱] Hierarchical
[۲] Partitioning
[۳] Linkage
[۴] Dendogram
[۵] Nested
تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.
ارسال نظر