تحقیق داده کاوی و الگوریتم‌های رایج دسته‌بندی و الگوریتم بهینه‌سازی ازدحام ذرات و سیستم های فازی

تحقیق داده کاوی و الگوریتم‌های رایج دسته‌بندی و الگوریتم بهینه‌سازی ازدحام ذرات و سیستم های فازی

دسته: رشته مهندسی فناوری اطلاعات

فرمت : word | صفحات : 72

قیمت: 8000 تومان
481 views

پیشینه تحقیق داده کاوی و الگوریتم‌های رایج دسته‌بندی و الگوریتم بهینه‌سازی ازدحام ذرات و سیستم های فازی دارای ۷۲ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

۲-۱- مقدمه   ۵
۲-۲- داده‌کاوی   ۵
۲-۳- دسته‌بندی   ۷
۲-۴- الگوریتم‌های رایج دسته‌بندی   ۹
۲-۴-۱- شبکه‌های عصبی مصنوعی   ۱۰
۲-۴-۲- درخت‌های تصمیم   ۱۴
۲-۴-۳- شبکه‌های بیزین   ۱۶
۲-۴-۴- K نزدیک‌ترین همسایه   ۱۸
۲-۴-۵- ماشین بردار پشتیبان   ۱۹
۲-۴-۶- روش‌های مبتنی بر قانون   ۲۳
۲-۵- الگوریتم بهینه‌سازی ازدحام ذرات   ۲۷
۲-۵-۱- پارامترهای پایه بهینه‌سازی ازدحام ذرات   ۳۱
۲-۵-۲- چالش‌ها و مسائل پیش روی الگوریتم بهینه‌سازی ازدحام ذرات   ۳۵
۲-۵-۲-۱- مشکل ابعاد بالا   ۳۶
۲-۵-۲-۲- مشکل همبستگی میان داده‌ها   ۳۹
۲-۵-۳- گونه‌های مختلف PSO   ۴۳
۲-۵-۳-۱- بهینه‌سازی ازدحام ذرات مبتنی بر شبکه‌های جمعی   ۴۳
۲-۵-۳-۱-۱- همسایگی مبتنی بر فاصله فضایی   ۴۴
۲-۵-۳-۱-۲- همسایگی فزاینده   ۴۴
۲-۵-۳-۱-۳- بهینه‌سازی ازدحام ذرات کاملاً آگاه (FIPS)   ۴۵
۲-۵-۳-۲- مدل پیوندی بهینه‌سازی ازدحام ذرات   ۴۶
۲-۵-۳-۳- بهینه‌سازی ازدحام ذرات چند جمعیتی   ۴۹
۲-۶- سیستم‌های فازی   ۵۲
۲-۶-۱- ساختار یک سیستم دسته‌بندی مبتنی بر قوانین فازی   ۵۳
۲-۶-۲- دسته‌بندی بدون استفاده از درجه قطعیت   ۵۴
۲-۶-۳- دسته‌بندی با استفاده از درجه قطعیت   ۵۸
۲-۶-۴- استنتاج فازی   ۶۲
۲-۷- معیار‌های ارزیابی دسته‌بند‌ها   ۶۴
منابع و مآخذ:   ۶۹

منابع:

[۱] H. Ishibuchi, “Evolutionary multiobjective design of fuzzy rule-based systems,” in Foundations of Computational Intelligence, 2007. FOCI 2007. IEEE Symposium on, 2007, pp. 9-16.

[۲] U. Fayyad, et al., “From data mining to knowledge discovery in databases,” AI magazine, vol. 17, p. 37, 1996.

[۳] G. Mariscal, et al., “A survey of data mining and knowledge discovery process models and methodologies,” Knowledge Engineering Review, vol. 25, p. 137, 2010.

[۴] T.-P. Hong, et al., “An effective mining approach for up-to-date patterns,” Expert systems with applications, vol. 36, pp. 9747-9752, 2009.

[۵] K. P. Murphy, Machine Learning: A Probabilistic Perspective: The MIT Press, 2012.

[۶] S. S. Haykin, Neural networks: a comprehensive foundation: Prentice Hall Englewood Cliffs NJ, 2007.

[۷] P. Benardos and G.-C. Vosniakos, “Optimizing feedforward artificial neural network architecture,” Engineering Applications of Artificial Intelligence, vol. 20, pp. 365-382, 2007.

[۸] G. P. Zhang, “Neural networks for classification: a survey,” Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on, vol. 30, pp. 451-462, 2000.

[۹] A. P. Engelbrecht, Computational intelligence: an introduction: Wiley, 2007.

[۱۰] C. Jin, et al., “Attribute selection method based on a hybrid BPNN and PSO algorithms,” Applied Soft Computing, vol. 12, pp. 2147-2155, 2012.

[۱۱] J. R. Quinlan, “C4. 5: Programs for machine learning (morgan kaufmann series in machine learning),” Morgan Kaufmann, 1993.

[۱۲] S. B. Kotsiantis, et al., Supervised machine learning: A review of classification techniques, 2007.

[۱۳] R. O. Duda, et al., Pattern classification: John Wiley & Sons, 2012.

[۱۴] C. M. Bishop and N. M. Nasrabadi, Pattern recognition and machine learning vol. 1: springer New York, 2006.

[۱۵] R. S. Parpinelli, et al., “Data mining with an ant colony optimization algorithm,” Evolutionary Computation, IEEE Transactions on, vol. 6, pp. 321-332, 2002.

۲-۱- مقدمه

دنیای مدرن در حقیقت دنیایی در محاصره حجم عظیمی از داده‌ها، چه عددی و چه انواع دیگر است. پیشرفت فناوری اطلاعات و مجهز شدن به ابزار رایانه‌ای امکان جمع‌آوری اطلاعات در زمینه‌های مختلف را فراهم آورده و منجر به پیدایش ساختارهای داده‌ای با حجم عظیم شده است. دست پیدا کردن به اطلاعات نهفته در پایگاه داده شرکت‌ها، دانشگاه‌ها، مؤسسات دولتی و سایر مراکز نیازمند مدیریتی جدید است و با به‌کارگیری سیستم‌های سنتی این امر تحقق نمی‌یابد. ضمن اینکه با گسترش رقابت در بخش‌های مختلف علمی، اجتماعی، سیاسی و غیره زمان مورد نیاز برای دسترسی به این اطلاعات نیز اهمیت دوچندان پیدا کرده است. بنابراین نیاز به طراحی سیستم‌های هوشمندی که توانایی دست‌یابی به اطلاعات مورد نظر کاربر را در مدت زمان کوتاه و با کم‌ترین مداخله کاربر را داشته باشند کاملاً مشهود است.

۲-۲- داده‌کاوی

داده کاوی فرآیندی است که از آغاز دهه‌ی ۹۰ پا به عرصه‌ی ظهور گذاشته و با نگرشی نو به مسئله‌ی استخراج اطلاعات از پایگاه داده می‌نگرد. این فرآیند یک مرحله فراتر از بازیابی ساده داده‌ها است و این اجازه را می‌دهد که دانش را در میان حجم انبوه داده‌ها کشف کرد [۱۴]. داده کاوی یک علم میان رشته‌ای است و ترکیبی از علومی نظیر پایگاه داده، تحلیل آماری، هوش مصنوعی و بینایی ماشین می‌باشد. داده کاوی یک مرحله ضروری از فرآیند بزرگ‌تر کشف دانش می‌باشد که شامل مراحل زیر می‌باشد [۱۵] :

پاک‌سازی داده‌ها: حذف نویز و داده‌های ناسازگار و نا ایستا.

یکپارچگی داده‌ها: ترکیب انواع داده‌های پراکنده و ناهمگن از منابع مختلف.

انتخاب ویژگی‌ها: انتخاب صفت‌های تأثیرگذار از داده‌ها.

تبدیل داده‌ها: تبدیل یا ترکیب داده‌ها به اشکالی که برای بکار بردن در داده‌کاوی مناسب باشند.

داده‌کاوی: روش‌های مختلف را برای استخراج الگو استفاده می‌کند.

ارزیابی الگو: الگوهای مناسب برای ارائه دانش را بر اساس معیارهای مشخص شناسایی می‌کند.

ارائه دانش: دانش کشف شده را با استفاده از روش‌های نمایش اطلاعات نشان می‌دهد.

داده‌کاوی از دو مرحله اصلی تشکیل شده است؛ مرحله اول پیش پردازش داده‌ها که در این مرحله خصیصه‌های با تأثیر بالاتر از داده‌های سطح پایین استخراج می‌شود. مرحله دوم تشخیص الگو می‌باشد که به کشف الگوی موجود در داده‌ها به کمک صفات و خصیصه‌های بدست آمده می‌پردازد.

داده‌کاوی را می‌توان سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک بلوغ در صنعت پایگاه داده نظیر: عملیات جمع‌آوری داده‌ها و ایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده می‌باشد.

داده کاوی تحلیل داده‌های قابل مشاهده برای کشف ارتباطات غیرمنتظره و خلاصه کردن داده‌ها به صورتی بدیع است که برای دارنده‌ی اطلاعات مفید و قابل درک باشد [۱۶]. کاوش اطلاعات، حجم عظیمی از داده‌های خام را به فرمی تغییر می‌دهد که انسان بتواند آن‌ها را به راحتی بفهمد و برای تصمیم گیری بتواند از این اطلاعات استفاده کند. در مسائل داده کاوی، هر چه حجم داده‌ها بیشتر می‌شود، میل بیشتری برای کشف الگوهای مخفی در داده‌ها به وجود می‌آید. در قدم اصلی داده کاوی ممکن است از چندین الگوریتم داده کاوی استفاده شود. کار اصلی الگوریتم داده کاوی با توجه به نوع مسئله‌ی کشف دانش تغییر می‌کند اما دو نوع اصلی الگوریتم‌های داده کاوی، دسته‌بندی و خوشه‌بندی است.

اصلی‌ترین دلیلی که باعث شد داده کاوی در علوم پزشکی مورد توجه بسیاری قرار بگیرد، مسأله در دسترس بودن حجم وسیعی از داده‌ها و نیاز شدید به اینکه از این داده‌ها، اطلاعات و دانش استخراج شود. داده‌کاوی عبارت است از استخراج دانش از مجموعه‌ای از داده‌ها.

۲-۳- دسته‌بندی

هرگاه داده‌ها دارای خصیصه‌ای خاص باشند که مستقیماً از دیگر خصایص به وجود نیامده باشد اما بین آن مشخصه و دیگر ابعاد رابطه وابستگی وجود داشته باشد، در این صورت می‌توان با کشف مدلی بر اساس دیگر مشخصه‌ها، آن بعد مذکور (که نشان دهنده دسته خاصی از داده‌ها است) را شناسایی نمود. فرض کنید که مشخصات تعدادی بیمار در پایگاه داده‌ای وجود دارد که قبلاً با استفاده از آزمایش خاص دو نوع بیماری مشخص شده که هر‌کدام از این بیماران به کدام بیماری مبتلا هستند، در این جا هیچ فردی حق ندارد هر دو بیماری را داشته باشد، سالم بوده و یا بیماری دیگری داشته باشد، به این معنی که دسته‌ها فضای مسئله را افراز می‌کند. در چنین پایگاه داده‌هایی برای هر بیمار یک رکورد خاص وجود دارد که شامل علائم بیمار و در نهایت نام یا برچسب بیماری که بیمار به آن مبتلا شده است می‌باشد. یک داده کاو تصمیم می‌گیرد سیستمی را ابداع کند که طی آن بدون آزمایش و فقط از روی علائم بیمار بتوان نوع بیماری وی را تشخیص داد. این تصمیم ممکن است به هر دلیلی مثلاً کمبود امکانات صورت گرفته باشد. آنچه باید انجام شود عملیات دسته بندی نامیده می‌شود. هدف دسته‌بندی؛ آموزش یک نگاشت از ورودی‌های x به خروجی‌های y است، که در آن ، C تعداد کلاس‌ها را مشخص می‌کند. اگر C=2 دسته‌بندی را دسته‌بندی دودویی می‌نامیم ( )، اگر C>2 باشد، این نوع دسته‌بندی را دسته‌بندی چند کلاسه می‌نامیم [۱۷].

دسته‌بندی داده‌ها یک فرآیند دو مرحله‌ای است. اولین مرحله ساخت مدل و دومین مرحله استفاده از مدل و پیش‌بینی کلاس از طریق مدل ساخته شده است. برای این منظور باید مجموعه داده‌ها را به دو دسته داده‌های آموزش و داده‌های تست تقسیم کنیم. با استفاده از داده‌هایی که برچسب آموزش خورده‌اند یک دسته‌بند ایجاد می‌شود که بر اساس آن بتوان داده‌های فاقد برچسب را در دسته‌های مربوط به خودشان قرار داد. کارایی دسته‌بند ساخته شده با داده‌های تست (که به صورت تصادفی از میان داده‌ها انتخاب شده‌اند) مورد سنجش قرار می‌گیرد و مدل روی آن‌ها اجرا می‌شود تا دقت پیش بینی دسته‌بند بررسی گردد، چنان که مدل دارای دقت مناسبی باشد برای دسته‌بندی داده‌ها به کار می‌رود.

در دسته‌بندی یادگیری به وسیله نمونه‌ها انجام می‌گیرید و برچسب هر یک از دسته‌ها مشخص است. سپس نمونه‌ها بر حسب ویژگی‌هایشان به دسته‌های از قبل مشخص شده، تخصیص داده می‌شوند. در حالی که در خوشه‌بندی داده‌ها به خوشه‌های مختلف که از قبل معین نیستند تقسیم می‌شوند، بر این اساس که داده‌های درون خوشه مشابه و داده‌های خوشه‌های مختلف متفاوت باشند. خوشه بندی به فرآیند تقسیم بندی داده به یک یا چند گروه به طوری که فاصله‌ی بین خوشه‌ها حداکثر و فاصله‌ی درون خوشه‌ها حداقل باشد، اطلاق می‌شود.

۲-۴- الگوریتم‌های رایج دسته‌بندی

روش‌های زیادی برای دسته‌بندی وجود دارد که از جمله می‌توان به مواردی که در ادامه به آن‌ها اشاره می‌شود اشاره کرد:

شبکه‌های عصبی مصنوعی[۱]

درخت‌های تصمیم[۲]

شبکه‌های بیزین

kنزدیک‌ترین همسایه[۳]

ماشین بردار پشتیبان[۴]

روش‌های مبتنی بر قانون

۲-۴-۱- شبکه‌های عصبی مصنوعی

مطالعه شبکه‌های عصبی مصنوعی تا حد زیادی الهام گرفته از سیستم‌های یادگیر طبیعی است که در آن‌ها یک مجموعه پیچیده از نرون‌های به هم متصل در کار یادگیری دخیل هستند. گمان می‌رود که مغز انسان از تعداد ۱۰^۱۱ نرون تشکیل شده باشد که هر نرون با تقریباً ۱۰^۴ نرون دیگر در ارتباط است. سرعت انتقال نرون‌ها در حدود ۱۰^-۳ ثانیه است که در مقایسه با کامپیوترها ( ۱۰^-۱۰ ثانیه) بسیار ناچیز می‌نماید. با این وجود آدمی قادر است در ۰٫۱ ثانیه تصویر یک انسان را باز شناسائی نماید. این قدرت فوق‌العاده باید از پردازش موازی توزیع شده در تعدادی زیادی از نرون‌ها حاصل شده باشد [۱۸].

این شبکه‌ها یادگیری را از روی مثال‌ها و نمونه‌ها انجام می‌دهند و از این لحاظ در عمل یادگیری شبیه به انسان عمل می‌کنند. مزیت دیگر آن‌ها این است که این شبکه‌ها از توانایی تعمیم دهی ذاتی برخوردار هستند؛ یعنی این شبکه‌ها توانایی تشخیص الگوهایی را که شبیه نمونه‌هایی که قبلاً یاد گرفته باشد را دارد نه اینکه تنها الگوهای دقیقاً همانند نمونه‌های آموزشی را تشخیص دهد [۱۹].

شبکه عصبی مصنوعی روشی عملی برای یادگیری توابع گوناگون نظیر توابع با مقادیر حقیقی، توابع با مقادیر گسسته و توابع با مقادیر برداری می‌باشد. یک نرون به تنهایی فقط می‌تواند برای شناسایی توابعی که به صورت خطی تفکیک پذیرند بکار رود، از آنجا که در مسائل واقعی عموماً توابع به صورت خطی جدایی پذیر نیستند شبکه‌ای از نرون‌ها مورد نیاز می‌باشد.

[۱] Artificial Neural Networks (ANN)

[۲] decision trees

[۳] k-nearest neighbors (K-NN)

[۴] Support Vector Machine (SVM)

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.

مطالب پیشنهادی:

تحقیق داده کاوی و تکنیک ها و روشهای آن

تحقیق داده کاوی و مراحل فرآیند و دسته بندی الگوریتم های آن

تحقیق الگوهای نوظهور و کلاسه بندها و الگوریتمهای مرسوم در استخراج آن

تحقیق یادگیری طبقه بندی کننده های فازی و معرفی الگوریتم رقابت استعماری

تحقیق الگوریتم نزدیک ترن همسایه و روش های موجود برای بهبود آن