تحقیق خوشه بندی اطلاعات و انواع روشهای خوشه بندی و روشهای بهینه سازی

پیشینه تحقیق و پایان نامه و پروژه دانشجویی

پیشینه تحقیق خوشه بندی اطلاعات و  انواع روشهای خوشه بندی و روشهای بهینه سازی دارای ۶۵ صفحه می باشد فایل پیشینه تحقیق به صورت ورد  word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود  آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

فصل اول: خوشهبندی بر مبنای الگوریتم FUZZY C-MEANS    ۵
۲-۱- مقدمه    ۵
۲-۲- خوشهبندی اطلاعات    ۵
۲-۲-۱- تفاوت خوشهبندی و طبقهبندی    ۷
۲-۲-۲-کاربردهای خوشهبندی    ۸
۲-۲-۳- انواع خوشهها    ۹
۲-۲-۴- مراحل خوشهبندی    ۱۰
۲-۲-۵- انواع روشهای خوشهبندی    ۱۲
۲-۲-۶- خوشهبندی سلسله مراتبی    ۱۳
۲-۲-۶-۱- خوشه بندی سلسله مراتبی تقسیم شونده    ۱۴
۲-۲-۶-۲- خوشه بندی سلسله مراتبی متراکم شونده    ۱۴
۲-۲-۷- خوشه‌بندی افرازبندی یا پارتیشنی    ۱۷
۲-۲-۷-۱-الگوریتم K-MEANS    ۱۸
۲-۲-۸- خوشهبندی همپوشانی    ۲۱
۲-۲-۸-۱- خوشهبندی فازی    ۲۲
فصل دوم:  روش های بهینهسازی    ۲۸
۳-۱- مقدمه    ۲۹
۳-۲- شرح مسأله بهینهسازی    ۳۰
۳-۳-روشهای حل مسائل بهینهسازی    ۳۴
۳-۳-۱- بهینه سازی تودهی ذرات    ۳۸
۳-۳-۲- الگوریتم جفت گیری زنبور عسل    ۴۰
۳-۳-۳- الگوریتم مورچگان    ۴۱
۳-۳-۴- الگوریتم الگوی جستجوی ممنوع    ۴۳
۳-۳-۵- الگوریتم آبکاری فولاد    ۴۴
۳-۳-۶- الگوریتم خفاش    ۴۶
۳-۳-۷-۱- انتخاب جمعیت اولیه براساس قاعده‌ی تولید عدد متضاد    ۵۰
۳-۳-۷-۲- استراتژی جهش خود  تطبیق    ۵۰
۳-۵- معیارهای مقایسه‌ی الگوریتم‌های بهینه‌سازی    ۵۴
۳-۵-۱-کارآیی    ۵۴
۳-۵-۲- انحراف استاندارد    ۵۴
۳-۵-۳- قابلیت اعتماد    ۵۵
۳-۵-۴- سرعت همگرایی    ۵۵
۳-۵- تعریف مسائل عددی گوناگون    ۵۵
۳-۵-۱- تابع ROSENBROCK    ۵۶
۳-۵-۲- تابع SCHEWEFEL    ۵۷
۳-۵-۳- تابع RASTRAGIN    ۵۸
۳-۵-۴- تابع ACKLEY    ۶۰
۳-۵-۵- تابع GREIWANK    ۶۱

مراجع

[۱۹] J. C. Bezdek, “Feature selection for binary data-Medical diagnosis

with fuzzy sets,” in Proc. Nat. Comput. Conf. AFIPS Press, 1972,

۱۰۵۷-۱۰۶۸٫

[۲۰]مسعود یقینی، مریم رنجپور، فرید یوسفی، ”مروری بر الگوریتم های خوشه بندی فازی.“، سوین کنفرانس داده کاوی ایران، ۱۳۸۸٫

[۲۱]Jiawei Han, MichelineKamber,. ‘Data Mining consepts and techniques.’,Diane Cerra, 2006.

[۲۲]Gabriela Czibula, Grigreta Sofia Cojocar, Istvan Gergely Czibula,

“A Partitional Clustering Algorithm for Crosscutting Concerns

Identification.”,proceedings of the 8th wseas int. conference on

software engineering, parallel and distributed systems, 2010,

pp.111-116.

[۲۳]Jiahai Wang, Yalan Zhou, “Stochastic optimal competitive Hopfield network for partitional clustering”,. Expert Systems with Applications, 2009, Vol.36. pp.2072-2080.

[۲۴]A.K.Jain, M.N. Murty, P.J. Flynn,“Data Clustering: A Review.”,ACM Computing Surveys, 1999, Vol.31. pp.264-323.

[۲۵]Georgios P. Papamichail, Dimitrios P. Papamichail,“The k-means range algorithm for personalized data clustering in e-commerce.”,European Journal of Operational Research, 2007, Vol.177. pp.1400-1408.

[۲۶]Ohn Mar San, Van-Nam Huynh,Yoshiteru Nakamori, “An alternative extension of the k-means algorithm for clustering.”,Int. J. Appl. Math. Comput, 2004, Vol.14. pp.241-247.

[۲۷]Tarsitano Agostino, “A computational studyof several relocation methods for k-means algorithms.”,Pattern Recognition, 2003, Vol.36. pp.2955-2966.

[۲۸]H. Ralambondrainy,“A conceptual version of the K-means algorithm. ”, Pattern Recognition Letters, 1995, Vol.16. pp.1147-1157.

[۲۹]Dingxi Qiu, Ajit C. Tamhane,“A comparative study of the K-means algorithm and the normal mixture model for clustering: Univariate case.”,Journal of Statistical Planning and Inference, 2007, Vol.137. pp.3722-3740.

[۳۰]Stephen J. Redmond, Conor Heneghan,“A method for initialising the K-means clustering algorithm using kd-trees.”,Pattern Recognition Letters, 2007, Vol.28. pp.965-973.

[۳۱] Yiu-Ming Cheung, “k*-Means: A new generalized k-means clustering algorithm.”,Pattern Recognition Letters, 2003, Vol. 24. 2883-2893.

فصل اول: خوشه ­بندی بر مبنای الگوریتم Fuzzy c-means

۲-۱- مقدمه

خوشه به مجموعه­ای از داده­ها گفته می­شود که از زاویه­ی خاصی به هم شباهت دارند. به دسته بندی طبیعی داده­های نامتجانس به تعدادی خوشه بر اساس خصوصیات مشابه نیز خوشه­بندی می­گویند. اغلب از خوشه­بندی به عنوان اولین گام داده­کاوی یاد می­شود که قبل از سایر فرآیندها بر روی رکوردها اعمال می­شود تا گروهی از رکوردهای مرتبط به هم به عنوان نقطه آغاز تحلیل­ها شناسایی شوند. هدف از خوشه بندی این است که داده­های موجود را به چندین گروه تقسیم کنند و در این تقسیم­بندی داده­های گروه­های مختلف باید حداکثر تفاوت ممکن را با هم داشته باشند و داده­های موجود در یک گروه باید بسیار به هم شبیه باشند.

در این فصل، بعد از مقایسه روش خوشه­ بنـدی با روش طبقه­ بندی، روش­های مختلف خوشه­بندی معرفی می­گردد و در آخر به توضیح در مورد الگوریتم Fuzzy c-means که این تحقیق بر پایه آن بنا شده است، خواهیم پرداخت.

 ۲-۲- خوشه ­بندی اطلاعات

در حالت کلی یادگیری را می­توان به دوگروه اصلی تقسیم کرد: یادگیری با نظارت و یادگیری بدون نظارت. در یادگیری با نظارت از ابتدا دسته­ها مشخص هستند و هر یک از داده­های آموزشی به دسته­ای خاص نسبت داده­شده­است. اصطلاحاٌ گفته می­شود که ناظری وجود دارد که در هنکام آموزش اطلاعاتی علاوه بر داده­های آموزش در اختیار یاد­گیرنده قرار می­دهد. ولی در یاد­گیری بدون نظارت هیچ اطلاعاتی به­جز داده­های آموزشی در اختیار یاد­گیرنده قرار ندارد و این یاد­گیرنده است که باید درون داده­ها به دنبال ساختاری خاص بگردد. خوشه­بندی را می­توان به­عنوان مهمترین مسأله در یاد­گیری بدون نظارت درنظر گرفت. شکل۲-۱(الف)، خوشه­بندی اطلاعات بر اساس معیار شباهت بین داده­ها و شکل۲-۱ (ب)، طبقه­بندی اطلاعات بر اساس تعداد کلاس معین از قبل تعیین شده را نشان می­دهد.

خوشه‌بندی همان­گونه که بیان شد، بدون دانش قبلی، درون مجموعه­ای از داده­ها به کشف گروه­های مشابه می­پردازد. در واقع، الگوریتم­های خوشه­بندی اغلب بدین­گونه­اند که یک سری نماینده اولیه برای نمونه­های ورودی در نظر می­­گیرند سپس با توجه به میزان تشابه نمونه­ها با این نماینده­ها، مشخص می­شود که نمونه به کدام خوشه تعلق دارد و بعد از این مرحله نماینده­های جدید برای هر خوشه محاسبه می­شود و دوباره نمونه­ها با این نماینده­ها مقایسه می­شوند تا مشخص شود که به کدام خوشه تعلق دارند و این کار آنقدر تکرار می­شود تا زمانی­که نماینده­های خوشه­ها تغییری نکنند.

انواعی از روش­های خوشه­بندی تا­کنون ارائه شده­اند که وابسته به کاربرد می­توان از آن­ها استفاده کرد. با این حال، با وجود گوناگونی روش‌های خوشه‌بندی، هنوز روش یکتایی وجود ندارد که بتواند انواع خوشه‌ها را به خوبی شناسایی کند؛ از این رو، این کاربر است که باید با توجه به نیاز‌هایش روش مناسب را بر‌گزیند.‌

۲-۲-۱- تفاوت خوشه­ بندی و طبقه­ بندی

در طبقه­بندی هر داده به یک کلاس از پیش تعیین شده ، تخصیص می­یابد. در واقع، سیستم­هایی که بر اساس طبقه­بندی کار می­کنند دو مجموعه ورودی دارند. مجموعه­ی آموزشی، که در آن داده­هایی که به طور پیش فرض در دسته های مختلفی قرار دارند، همراه با ساختار دسته بندی خود وارد سیستم می­شوند و سیستم بر اساس آن­ها آموزش می بیند یا به عبارتی، پارامتر­های دسته بندی را برای خود مهیا می­کند. گروه دیگر، ورودی­هایی هستند که پس از مرحله آموزش و برای تعیین دسته وارد سیستم می شوند.

خوشه­بندی با طبقه­بندی[۱] متفاوت است. در طبقه بندی نمونه­های ورودی برچسب گذاری شده­اند ولی در خوشه­بندی نمونه­های ورودی دارای بر چسب اولیه نمی­باشند و در واقع با استفاده از روش­های خوشه­بندی است که داده­های مشابه مشخص و به­طور ضمنی برچسب­گذاری می­شوند. در واقع می­توان قبل از عملیات طبقه­بندی داده­ها یک خوشه­بندی روی نمونه­ها انجام داد و سپس مراکز خوشه­های حاصل را محاسبه کرد و یک بر چسب به مراکز خوشه­ها نسبت داد و سپس عملیات طبقه بندی را برای نمونه­های ورودی جدید انجام داد.

۲-۲-۲-کاربردهای خوشه ­بندی

در بسیاری از موارد با کمبود اطلاعات در مورد داده­ها مواجه می­باشیم و تصمیم گیرنده می­بایست تا آنجا که ممکن است فرضیاتی را در مورد داده متصور شود . تحت این محدودیت است که متدلوژی کلاسترینگ به­عنوان یک راهکار مناسب برای کشف ارتباط­های معنائی میان داده­ها به شمار می­رود و می­توان از آن به عنوان یک دانش اولیه[۲] از داده­ها یاد کرد. در حال حاضرخوشه­بندی در زمینه­های متنوعی به کارگرفته شده است که به عنوان نمونه می­توان  موارد زیر را بر­­شمرد:

۱- مهندسی: بینش محاسباتی، یادگیری ماشین، تشخیص الگو، مهندسی مکانیک ، مهندسی برق. کاربردهای موضوعی خوشه­بندی درمحدوده­ی مهندسی از شناسایی بیومتریک و شناسایی گفتار تا تحلیل سیگنال رادار، خلاصه کردن اطلاعات و رفع پارازیت می باشد .

۲ – علوم کامپیوتر: کاربردهای  خیلی  زیادی از خوشه بندی در وب کاوی ( دسته‌ بندی اسناد و یا دسته ‌بندی مشتریان به سایت­ها )، تحلیل پایگاه داده فضایی ، بازیابی اطلاعات ، گردآوری مستندات متنی وپردازش تصویر ( تقسیم بندی تصاویر پزشکی و یا ماهواره‌ای) مشاهده کرده­ایم .

۳ – علوم پزشکی و زندگی: ژنتیک ، زیست شناسی ( دسته ‌بندی حیوانات و گیاهان از روی ویژگی‌های آن­ها )، میکروب شناسی، دیرین شناسی، روانپزشکی، تکامل نژادی، آسیب شناسی. این حوزه­ها، در وهله­ی اول شامل کاربردهای عمده­ی خوشه­بندی هستند و تا یکی از زمینه های اصلی الگوریتم­های خوشه­بندی گردند؛ ادامه پیدا می­کنند. کاربردهای مهم شامل تعریف طبقه بندی، شناسایی کارکرد پروتئین و ژن ، تشخیص و درمان بیماری و … می­باشند.

۴ – علوم زمین و ستاره شناسی: جغرافیا، زمین شناسی، دریافت متحرک. خوشه بندی می­تواند برای طبقه­بندی کردن ستاره­ها و سیارات، تحقیق درمورد ساختار زمین، تفکیک کردن مناطق و شهرها (دسته­‌بندی خانه‌­ها براساس نوع و موقعیت جغرافیایی آن­ها)، مطالعه­ی رودخانه و کوه­ها، مطالعات زلزله­نگاری ( تشخیص مناطق حادثه‌ خیز بر اساس مشاهدات قبلی ) به کار رود .

۵ – علوم اجتماعی: جامعه شناسی، روان شناسی، انسان شناسی، کتابداری ( دسته ‌بندی کتاب­ها)، آموزش و پرورش. هم­چنین، کاربردهای جالب توجه­ای می­تواند در تحلیل الگوی رفتاری، ساختار تاریخ تکاملی زبان­ها، تحلیل شبکه­های اجتماعی، تشخیص باستان شناسی، طبقه بندی مصنوعی و مطالعه روان شناسی جنایی یافت شود.

۶ – اقتصاد: بازاریابی، تجارت. کاربردهایی نظیر شناسایی الگوی خرید، گروه بندی شرکت­ها و تحلیل روند  ذخیره­سازی، همه از تحلیل خوشه بندی سودمند می­گردند.

۲-۲-۳- انواع خوشه­ها

×خوشه­های به­خوبی جدا شده: مجموعه نقاط داخل این خوشه نسبت به نقاط خارج آن به یکدیگر شباهت بیشتری دارند.

×خوشه­های مبتنی به مرکز: مجموعه نقاط داخل این خوشه به مرکز خوشه نسبت به مراکز خوشه­های دیگر بسیار نزدیک­ترهستند.

×خوشه­های مبتنی بر مجاورت و نزدیکی: مجموعه نقاط داخل این خوشه به یک یا تعداد بیشتری از نقاط داخل خوشه نسبت به نقاط خارج آن شبیه می­باشند.

۲-۲-۴- مراحل خوشه ­بندی

خوشه بندی دارای چهارمرحله­ی اساسی به  شرح زیر است :

×انتخاب یا استخراج ویژگی: ویژگی­ها باید به طور مناسبی انتخاب شوند تا اکثر داده­ها کدگذاری گردند. در صورتی که در این مرحله، ویژگی­های انتخابی به طور نامناسب در نظر گرفته شوند، جواب نهایی هدف مورد نظر را نتیجه نخواهد داد. لذا، این بخش نقش اساسی را در روند خوشه­بندی ایفا خواهد کرد [۱۹]. برای به­دست آوردن مجموعه­ی مناسبی از ویژگی­ها در امر کلاسترینگ، از دو تکنیک استفاده می شود: گزینش ویژگی و استخراج ویژگی. گزینش ویژگی[۳] فرآیندی است که برای شناسائی مؤثرترین زیر مجموعه از ویژگی­های اولیه برای کلاسترینگ استفاده می­شود و استخراج ویژگی[۴] استفاده از یک یا چند مرحله تبدیل ویژگی­های ورودی به منظور به دست آوردن ویژگی­های برجسته جدید می­باشد .

×مقیاس نزدیکی: معیاری است که میزان شباهت و یا عدم شباهت دو بردار خصوصیت را مشخص می­کند. تمام خصوصیات انتخاب شده باید در محاسبه این معیار شرکت کنند و هیچ خصوصیتی نباید بر بقیه غلبه کند. ساده­ترین معیار برای مسافت، فاصله اقلیدسی است که بیانگر افتراق[۵] بین دو نمونه می­باشد . این در حالی است که معیارهای تشابه هم می­توانند برای تشخیص تشابهات معنائی در میان نمونه­ها استفاده شوند. همین که، یک مقیاس نزدیکی تعیین می­شود، خوشه­بندی می­تواند به عنوان یک مسأله­ی بهینه سازی با یک تابع معیار خاص استنباط گردد. پس خوشه­های به دست آمده وابسته به انتخاب تابع معیار می­باشند.

×الگوریتم خوشه­بندی: پس از اینکه مقیاس نزدیکی انتخاب شدند، یک الگوریتم خاص جهت روشن کردن ساختار دسته­بندی مجموعه داده­ها انتخاب می­گردد. به­عنوان نمونه خروجی خوشه­بندی می­تواند گروه­های سخت[۶] و یا نرم [۷]باشد که هر روش دارای درجه عضویت متفاوتی بوده و درجه عضویت، میزان تعلق هر داده به خوشه است.

×اعتبار سنجی نتایج: شاخص های اعتبار سنجی برای سنجش میزان صحت نتایج خوشه­بندی به منظور مقایسه بین روش­های مختلف یا مقایسه­ی نتایج حاصل از یک روش با پارامترهای مختلف مورد استفاده قرار می گیرد؛ زیرا نتایج حاصل از اعمال الگوریتم­های خوشه­بندی روی یک مجموعه داده با توجه به مقادیر انتخابی برای پارامترهای هر الگوریتم می­تواند بسیار متفاوت از یکدیگر باشد. هدف از اعتبارسنجی، یافتن خوشه­هایی است که بهترین تناسب را با داده­های مورد نظر داشته باشند.

دو معیار پایه اندازه­گیری برای ارزیابی و انتخاب خوشه­های بهینه عبارتند از:

تراکم[۸] : داده­های متعلق به یک خوشه بایستی تا حد ممکن به یکدیگر نزدیک باشند. معیار رایج برای تعیین میزان تراکم داده­ها واریانس داده­ها است.

جدایی [۹]: خوشه­ها خود بایستی به اندازه کافی از هم جدا باشند. سه راه برای سنجش میزان جدایی خوشه ها مورد استفاده قرار می گیرد:

فاصله بین نزدیک­ترین داده­ها از دو خوشه

فاصله بین دورترین داده­ها از دو خوشه

فاصله بین مراکز خوشه­ها

هم­چنین، روش­های ارزیابی خوشه­های حاصل از خوشه­بندی را به سه دسته تقسیم می کنند: شاخص­های خارجی، شاخص­های داخلی و شاخص­های نسبی.

[۱] Classification

[۲]-preliminary

[۳]-Feature Selection

[۴]-Feature Extraction

[۵]-Dissimilarity

[۶]-K-means

[۷]-Fuzzy c-means

[۸]-compactness

[۹]-separation

80,000 ریال – خرید

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ  را پرداخت نمایید. 

مطالب پیشنهادی:
  • تحقیق خوشه بندی و روشهای آن و خوشه بندی ترکیبی
  • تحقیق الگوریتم‌های خوشه‌بندی و خوشه بندی ترکیبی
  • تحقیق شبکه‌های حسگر بی‌سیم و مسیریابی و خوشه بندی در آن
  • تحقیق داده‌کاوی و خوشه بندی و روش های آن و الگوریتم خوشه بندی
  • برچسب ها : , , , , , , , , , , , ,
    برای ثبت نظر خود کلیک کنید ...

    به راهنمایی نیاز دارید؟ کلیک کنید

    جستجو پیشرفته

    دسته‌ها

    آخرین بروز رسانی

      شنبه, ۱ اردیبهشت , ۱۴۰۳
    اولین پایگاه اینترنتی اشتراک و فروش فایلهای دیجیتال ایران
    wpdesign Group طراحی و پشتیبانی سایت توسط digitaliran.ir صورت گرفته است
    تمامی حقوق برایpayandaneshjo.irمحفوظ می باشد.