3,991 views
پیشینه تحقیق خوشه بندی اطلاعات و انواع روشهای خوشه بندی و روشهای بهینه سازی دارای ۶۵ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.
فصل اول: خوشهبندی بر مبنای الگوریتم FUZZY C-MEANS ۵
۲-۱- مقدمه ۵
۲-۲- خوشهبندی اطلاعات ۵
۲-۲-۱- تفاوت خوشهبندی و طبقهبندی ۷
۲-۲-۲-کاربردهای خوشهبندی ۸
۲-۲-۳- انواع خوشهها ۹
۲-۲-۴- مراحل خوشهبندی ۱۰
۲-۲-۵- انواع روشهای خوشهبندی ۱۲
۲-۲-۶- خوشهبندی سلسله مراتبی ۱۳
۲-۲-۶-۱- خوشه بندی سلسله مراتبی تقسیم شونده ۱۴
۲-۲-۶-۲- خوشه بندی سلسله مراتبی متراکم شونده ۱۴
۲-۲-۷- خوشهبندی افرازبندی یا پارتیشنی ۱۷
۲-۲-۷-۱-الگوریتم K-MEANS ۱۸
۲-۲-۸- خوشهبندی همپوشانی ۲۱
۲-۲-۸-۱- خوشهبندی فازی ۲۲
فصل دوم: روش های بهینهسازی ۲۸
۳-۱- مقدمه ۲۹
۳-۲- شرح مسأله بهینهسازی ۳۰
۳-۳-روشهای حل مسائل بهینهسازی ۳۴
۳-۳-۱- بهینه سازی تودهی ذرات ۳۸
۳-۳-۲- الگوریتم جفت گیری زنبور عسل ۴۰
۳-۳-۳- الگوریتم مورچگان ۴۱
۳-۳-۴- الگوریتم الگوی جستجوی ممنوع ۴۳
۳-۳-۵- الگوریتم آبکاری فولاد ۴۴
۳-۳-۶- الگوریتم خفاش ۴۶
۳-۳-۷-۱- انتخاب جمعیت اولیه براساس قاعدهی تولید عدد متضاد ۵۰
۳-۳-۷-۲- استراتژی جهش خود تطبیق ۵۰
۳-۵- معیارهای مقایسهی الگوریتمهای بهینهسازی ۵۴
۳-۵-۱-کارآیی ۵۴
۳-۵-۲- انحراف استاندارد ۵۴
۳-۵-۳- قابلیت اعتماد ۵۵
۳-۵-۴- سرعت همگرایی ۵۵
۳-۵- تعریف مسائل عددی گوناگون ۵۵
۳-۵-۱- تابع ROSENBROCK ۵۶
۳-۵-۲- تابع SCHEWEFEL ۵۷
۳-۵-۳- تابع RASTRAGIN ۵۸
۳-۵-۴- تابع ACKLEY ۶۰
۳-۵-۵- تابع GREIWANK ۶۱
[۱۹] J. C. Bezdek, “Feature selection for binary data-Medical diagnosis
with fuzzy sets,” in Proc. Nat. Comput. Conf. AFIPS Press, 1972,
۱۰۵۷-۱۰۶۸٫
[۲۰]مسعود یقینی، مریم رنجپور، فرید یوسفی، ”مروری بر الگوریتم های خوشه بندی فازی.“، سوین کنفرانس داده کاوی ایران، ۱۳۸۸٫
[۲۱]Jiawei Han, MichelineKamber,. ‘Data Mining consepts and techniques.’,Diane Cerra, 2006.
[۲۲]Gabriela Czibula, Grigreta Sofia Cojocar, Istvan Gergely Czibula,
“A Partitional Clustering Algorithm for Crosscutting Concerns
Identification.”,proceedings of the 8th wseas int. conference on
software engineering, parallel and distributed systems, 2010,
pp.111-116.
[۲۳]Jiahai Wang, Yalan Zhou, “Stochastic optimal competitive Hopfield network for partitional clustering”,. Expert Systems with Applications, 2009, Vol.36. pp.2072-2080.
[۲۴]A.K.Jain, M.N. Murty, P.J. Flynn,“Data Clustering: A Review.”,ACM Computing Surveys, 1999, Vol.31. pp.264-323.
[۲۵]Georgios P. Papamichail, Dimitrios P. Papamichail,“The k-means range algorithm for personalized data clustering in e-commerce.”,European Journal of Operational Research, 2007, Vol.177. pp.1400-1408.
[۲۶]Ohn Mar San, Van-Nam Huynh,Yoshiteru Nakamori, “An alternative extension of the k-means algorithm for clustering.”,Int. J. Appl. Math. Comput, 2004, Vol.14. pp.241-247.
[۲۷]Tarsitano Agostino, “A computational studyof several relocation methods for k-means algorithms.”,Pattern Recognition, 2003, Vol.36. pp.2955-2966.
[۲۸]H. Ralambondrainy,“A conceptual version of the K-means algorithm. ”, Pattern Recognition Letters, 1995, Vol.16. pp.1147-1157.
[۲۹]Dingxi Qiu, Ajit C. Tamhane,“A comparative study of the K-means algorithm and the normal mixture model for clustering: Univariate case.”,Journal of Statistical Planning and Inference, 2007, Vol.137. pp.3722-3740.
[۳۰]Stephen J. Redmond, Conor Heneghan,“A method for initialising the K-means clustering algorithm using kd-trees.”,Pattern Recognition Letters, 2007, Vol.28. pp.965-973.
[۳۱] Yiu-Ming Cheung, “k*-Means: A new generalized k-means clustering algorithm.”,Pattern Recognition Letters, 2003, Vol. 24. 2883-2893.
خوشه به مجموعهای از دادهها گفته میشود که از زاویهی خاصی به هم شباهت دارند. به دسته بندی طبیعی دادههای نامتجانس به تعدادی خوشه بر اساس خصوصیات مشابه نیز خوشهبندی میگویند. اغلب از خوشهبندی به عنوان اولین گام دادهکاوی یاد میشود که قبل از سایر فرآیندها بر روی رکوردها اعمال میشود تا گروهی از رکوردهای مرتبط به هم به عنوان نقطه آغاز تحلیلها شناسایی شوند. هدف از خوشه بندی این است که دادههای موجود را به چندین گروه تقسیم کنند و در این تقسیمبندی دادههای گروههای مختلف باید حداکثر تفاوت ممکن را با هم داشته باشند و دادههای موجود در یک گروه باید بسیار به هم شبیه باشند.
در این فصل، بعد از مقایسه روش خوشه بنـدی با روش طبقه بندی، روشهای مختلف خوشهبندی معرفی میگردد و در آخر به توضیح در مورد الگوریتم Fuzzy c-means که این تحقیق بر پایه آن بنا شده است، خواهیم پرداخت.
در حالت کلی یادگیری را میتوان به دوگروه اصلی تقسیم کرد: یادگیری با نظارت و یادگیری بدون نظارت. در یادگیری با نظارت از ابتدا دستهها مشخص هستند و هر یک از دادههای آموزشی به دستهای خاص نسبت دادهشدهاست. اصطلاحاٌ گفته میشود که ناظری وجود دارد که در هنکام آموزش اطلاعاتی علاوه بر دادههای آموزش در اختیار یادگیرنده قرار میدهد. ولی در یادگیری بدون نظارت هیچ اطلاعاتی بهجز دادههای آموزشی در اختیار یادگیرنده قرار ندارد و این یادگیرنده است که باید درون دادهها به دنبال ساختاری خاص بگردد. خوشهبندی را میتوان بهعنوان مهمترین مسأله در یادگیری بدون نظارت درنظر گرفت. شکل۲-۱(الف)، خوشهبندی اطلاعات بر اساس معیار شباهت بین دادهها و شکل۲-۱ (ب)، طبقهبندی اطلاعات بر اساس تعداد کلاس معین از قبل تعیین شده را نشان میدهد.
خوشهبندی همانگونه که بیان شد، بدون دانش قبلی، درون مجموعهای از دادهها به کشف گروههای مشابه میپردازد. در واقع، الگوریتمهای خوشهبندی اغلب بدینگونهاند که یک سری نماینده اولیه برای نمونههای ورودی در نظر میگیرند سپس با توجه به میزان تشابه نمونهها با این نمایندهها، مشخص میشود که نمونه به کدام خوشه تعلق دارد و بعد از این مرحله نمایندههای جدید برای هر خوشه محاسبه میشود و دوباره نمونهها با این نمایندهها مقایسه میشوند تا مشخص شود که به کدام خوشه تعلق دارند و این کار آنقدر تکرار میشود تا زمانیکه نمایندههای خوشهها تغییری نکنند.
انواعی از روشهای خوشهبندی تاکنون ارائه شدهاند که وابسته به کاربرد میتوان از آنها استفاده کرد. با این حال، با وجود گوناگونی روشهای خوشهبندی، هنوز روش یکتایی وجود ندارد که بتواند انواع خوشهها را به خوبی شناسایی کند؛ از این رو، این کاربر است که باید با توجه به نیازهایش روش مناسب را برگزیند.
در طبقهبندی هر داده به یک کلاس از پیش تعیین شده ، تخصیص مییابد. در واقع، سیستمهایی که بر اساس طبقهبندی کار میکنند دو مجموعه ورودی دارند. مجموعهی آموزشی، که در آن دادههایی که به طور پیش فرض در دسته های مختلفی قرار دارند، همراه با ساختار دسته بندی خود وارد سیستم میشوند و سیستم بر اساس آنها آموزش می بیند یا به عبارتی، پارامترهای دسته بندی را برای خود مهیا میکند. گروه دیگر، ورودیهایی هستند که پس از مرحله آموزش و برای تعیین دسته وارد سیستم می شوند.
خوشهبندی با طبقهبندی[۱] متفاوت است. در طبقه بندی نمونههای ورودی برچسب گذاری شدهاند ولی در خوشهبندی نمونههای ورودی دارای بر چسب اولیه نمیباشند و در واقع با استفاده از روشهای خوشهبندی است که دادههای مشابه مشخص و بهطور ضمنی برچسبگذاری میشوند. در واقع میتوان قبل از عملیات طبقهبندی دادهها یک خوشهبندی روی نمونهها انجام داد و سپس مراکز خوشههای حاصل را محاسبه کرد و یک بر چسب به مراکز خوشهها نسبت داد و سپس عملیات طبقه بندی را برای نمونههای ورودی جدید انجام داد.
در بسیاری از موارد با کمبود اطلاعات در مورد دادهها مواجه میباشیم و تصمیم گیرنده میبایست تا آنجا که ممکن است فرضیاتی را در مورد داده متصور شود . تحت این محدودیت است که متدلوژی کلاسترینگ بهعنوان یک راهکار مناسب برای کشف ارتباطهای معنائی میان دادهها به شمار میرود و میتوان از آن به عنوان یک دانش اولیه[۲] از دادهها یاد کرد. در حال حاضرخوشهبندی در زمینههای متنوعی به کارگرفته شده است که به عنوان نمونه میتوان موارد زیر را برشمرد:
۱- مهندسی: بینش محاسباتی، یادگیری ماشین، تشخیص الگو، مهندسی مکانیک ، مهندسی برق. کاربردهای موضوعی خوشهبندی درمحدودهی مهندسی از شناسایی بیومتریک و شناسایی گفتار تا تحلیل سیگنال رادار، خلاصه کردن اطلاعات و رفع پارازیت می باشد .
۲ – علوم کامپیوتر: کاربردهای خیلی زیادی از خوشه بندی در وب کاوی ( دسته بندی اسناد و یا دسته بندی مشتریان به سایتها )، تحلیل پایگاه داده فضایی ، بازیابی اطلاعات ، گردآوری مستندات متنی وپردازش تصویر ( تقسیم بندی تصاویر پزشکی و یا ماهوارهای) مشاهده کردهایم .
۳ – علوم پزشکی و زندگی: ژنتیک ، زیست شناسی ( دسته بندی حیوانات و گیاهان از روی ویژگیهای آنها )، میکروب شناسی، دیرین شناسی، روانپزشکی، تکامل نژادی، آسیب شناسی. این حوزهها، در وهلهی اول شامل کاربردهای عمدهی خوشهبندی هستند و تا یکی از زمینه های اصلی الگوریتمهای خوشهبندی گردند؛ ادامه پیدا میکنند. کاربردهای مهم شامل تعریف طبقه بندی، شناسایی کارکرد پروتئین و ژن ، تشخیص و درمان بیماری و … میباشند.
۴ – علوم زمین و ستاره شناسی: جغرافیا، زمین شناسی، دریافت متحرک. خوشه بندی میتواند برای طبقهبندی کردن ستارهها و سیارات، تحقیق درمورد ساختار زمین، تفکیک کردن مناطق و شهرها (دستهبندی خانهها براساس نوع و موقعیت جغرافیایی آنها)، مطالعهی رودخانه و کوهها، مطالعات زلزلهنگاری ( تشخیص مناطق حادثه خیز بر اساس مشاهدات قبلی ) به کار رود .
۵ – علوم اجتماعی: جامعه شناسی، روان شناسی، انسان شناسی، کتابداری ( دسته بندی کتابها)، آموزش و پرورش. همچنین، کاربردهای جالب توجهای میتواند در تحلیل الگوی رفتاری، ساختار تاریخ تکاملی زبانها، تحلیل شبکههای اجتماعی، تشخیص باستان شناسی، طبقه بندی مصنوعی و مطالعه روان شناسی جنایی یافت شود.
۶ – اقتصاد: بازاریابی، تجارت. کاربردهایی نظیر شناسایی الگوی خرید، گروه بندی شرکتها و تحلیل روند ذخیرهسازی، همه از تحلیل خوشه بندی سودمند میگردند.
×خوشههای بهخوبی جدا شده: مجموعه نقاط داخل این خوشه نسبت به نقاط خارج آن به یکدیگر شباهت بیشتری دارند.
×خوشههای مبتنی به مرکز: مجموعه نقاط داخل این خوشه به مرکز خوشه نسبت به مراکز خوشههای دیگر بسیار نزدیکترهستند.
×خوشههای مبتنی بر مجاورت و نزدیکی: مجموعه نقاط داخل این خوشه به یک یا تعداد بیشتری از نقاط داخل خوشه نسبت به نقاط خارج آن شبیه میباشند.
خوشه بندی دارای چهارمرحلهی اساسی به شرح زیر است :
×انتخاب یا استخراج ویژگی: ویژگیها باید به طور مناسبی انتخاب شوند تا اکثر دادهها کدگذاری گردند. در صورتی که در این مرحله، ویژگیهای انتخابی به طور نامناسب در نظر گرفته شوند، جواب نهایی هدف مورد نظر را نتیجه نخواهد داد. لذا، این بخش نقش اساسی را در روند خوشهبندی ایفا خواهد کرد [۱۹]. برای بهدست آوردن مجموعهی مناسبی از ویژگیها در امر کلاسترینگ، از دو تکنیک استفاده می شود: گزینش ویژگی و استخراج ویژگی. گزینش ویژگی[۳] فرآیندی است که برای شناسائی مؤثرترین زیر مجموعه از ویژگیهای اولیه برای کلاسترینگ استفاده میشود و استخراج ویژگی[۴] استفاده از یک یا چند مرحله تبدیل ویژگیهای ورودی به منظور به دست آوردن ویژگیهای برجسته جدید میباشد .
×مقیاس نزدیکی: معیاری است که میزان شباهت و یا عدم شباهت دو بردار خصوصیت را مشخص میکند. تمام خصوصیات انتخاب شده باید در محاسبه این معیار شرکت کنند و هیچ خصوصیتی نباید بر بقیه غلبه کند. سادهترین معیار برای مسافت، فاصله اقلیدسی است که بیانگر افتراق[۵] بین دو نمونه میباشد . این در حالی است که معیارهای تشابه هم میتوانند برای تشخیص تشابهات معنائی در میان نمونهها استفاده شوند. همین که، یک مقیاس نزدیکی تعیین میشود، خوشهبندی میتواند به عنوان یک مسألهی بهینه سازی با یک تابع معیار خاص استنباط گردد. پس خوشههای به دست آمده وابسته به انتخاب تابع معیار میباشند.
×الگوریتم خوشهبندی: پس از اینکه مقیاس نزدیکی انتخاب شدند، یک الگوریتم خاص جهت روشن کردن ساختار دستهبندی مجموعه دادهها انتخاب میگردد. بهعنوان نمونه خروجی خوشهبندی میتواند گروههای سخت[۶] و یا نرم [۷]باشد که هر روش دارای درجه عضویت متفاوتی بوده و درجه عضویت، میزان تعلق هر داده به خوشه است.
×اعتبار سنجی نتایج: شاخص های اعتبار سنجی برای سنجش میزان صحت نتایج خوشهبندی به منظور مقایسه بین روشهای مختلف یا مقایسهی نتایج حاصل از یک روش با پارامترهای مختلف مورد استفاده قرار می گیرد؛ زیرا نتایج حاصل از اعمال الگوریتمهای خوشهبندی روی یک مجموعه داده با توجه به مقادیر انتخابی برای پارامترهای هر الگوریتم میتواند بسیار متفاوت از یکدیگر باشد. هدف از اعتبارسنجی، یافتن خوشههایی است که بهترین تناسب را با دادههای مورد نظر داشته باشند.
دو معیار پایه اندازهگیری برای ارزیابی و انتخاب خوشههای بهینه عبارتند از:
تراکم[۸] : دادههای متعلق به یک خوشه بایستی تا حد ممکن به یکدیگر نزدیک باشند. معیار رایج برای تعیین میزان تراکم دادهها واریانس دادهها است.
جدایی [۹]: خوشهها خود بایستی به اندازه کافی از هم جدا باشند. سه راه برای سنجش میزان جدایی خوشه ها مورد استفاده قرار می گیرد:
فاصله بین نزدیکترین دادهها از دو خوشه
فاصله بین دورترین دادهها از دو خوشه
فاصله بین مراکز خوشهها
همچنین، روشهای ارزیابی خوشههای حاصل از خوشهبندی را به سه دسته تقسیم می کنند: شاخصهای خارجی، شاخصهای داخلی و شاخصهای نسبی.
[۱] Classification
[۲]-preliminary
[۳]-Feature Selection
[۴]-Feature Extraction
[۵]-Dissimilarity
[۶]-K-means
[۷]-Fuzzy c-means
[۸]-compactness
[۹]-separation
تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.
ارسال نظر