پیشینه تحقیق داده کاوی و الگوریتمهای رایج دستهبندی و الگوریتم بهینهسازی ازدحام ذرات و سیستم های فازی دارای ۷۲ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.
۲-۱- مقدمه ۵
۲-۲- دادهکاوی ۵
۲-۳- دستهبندی ۷
۲-۴- الگوریتمهای رایج دستهبندی ۹
۲-۴-۱- شبکههای عصبی مصنوعی ۱۰
۲-۴-۲- درختهای تصمیم ۱۴
۲-۴-۳- شبکههای بیزین ۱۶
۲-۴-۴- K نزدیکترین همسایه ۱۸
۲-۴-۵- ماشین بردار پشتیبان ۱۹
۲-۴-۶- روشهای مبتنی بر قانون ۲۳
۲-۵- الگوریتم بهینهسازی ازدحام ذرات ۲۷
۲-۵-۱- پارامترهای پایه بهینهسازی ازدحام ذرات ۳۱
۲-۵-۲- چالشها و مسائل پیش روی الگوریتم بهینهسازی ازدحام ذرات ۳۵
۲-۵-۲-۱- مشکل ابعاد بالا ۳۶
۲-۵-۲-۲- مشکل همبستگی میان دادهها ۳۹
۲-۵-۳- گونههای مختلف PSO ۴۳
۲-۵-۳-۱- بهینهسازی ازدحام ذرات مبتنی بر شبکههای جمعی ۴۳
۲-۵-۳-۱-۱- همسایگی مبتنی بر فاصله فضایی ۴۴
۲-۵-۳-۱-۲- همسایگی فزاینده ۴۴
۲-۵-۳-۱-۳- بهینهسازی ازدحام ذرات کاملاً آگاه (FIPS) ۴۵
۲-۵-۳-۲- مدل پیوندی بهینهسازی ازدحام ذرات ۴۶
۲-۵-۳-۳- بهینهسازی ازدحام ذرات چند جمعیتی ۴۹
۲-۶- سیستمهای فازی ۵۲
۲-۶-۱- ساختار یک سیستم دستهبندی مبتنی بر قوانین فازی ۵۳
۲-۶-۲- دستهبندی بدون استفاده از درجه قطعیت ۵۴
۲-۶-۳- دستهبندی با استفاده از درجه قطعیت ۵۸
۲-۶-۴- استنتاج فازی ۶۲
۲-۷- معیارهای ارزیابی دستهبندها ۶۴
منابع و مآخذ: ۶۹
[۱] H. Ishibuchi, “Evolutionary multiobjective design of fuzzy rule-based systems,” in Foundations of Computational Intelligence, 2007. FOCI 2007. IEEE Symposium on, 2007, pp. 9-16.
[۲] U. Fayyad, et al., “From data mining to knowledge discovery in databases,” AI magazine, vol. 17, p. 37, 1996.
[۳] G. Mariscal, et al., “A survey of data mining and knowledge discovery process models and methodologies,” Knowledge Engineering Review, vol. 25, p. 137, 2010.
[۴] T.-P. Hong, et al., “An effective mining approach for up-to-date patterns,” Expert systems with applications, vol. 36, pp. 9747-9752, 2009.
[۵] K. P. Murphy, Machine Learning: A Probabilistic Perspective: The MIT Press, 2012.
[۶] S. S. Haykin, Neural networks: a comprehensive foundation: Prentice Hall Englewood Cliffs NJ, 2007.
[۷] P. Benardos and G.-C. Vosniakos, “Optimizing feedforward artificial neural network architecture,” Engineering Applications of Artificial Intelligence, vol. 20, pp. 365-382, 2007.
[۸] G. P. Zhang, “Neural networks for classification: a survey,” Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on, vol. 30, pp. 451-462, 2000.
[۹] A. P. Engelbrecht, Computational intelligence: an introduction: Wiley, 2007.
[۱۰] C. Jin, et al., “Attribute selection method based on a hybrid BPNN and PSO algorithms,” Applied Soft Computing, vol. 12, pp. 2147-2155, 2012.
[۱۱] J. R. Quinlan, “C4. 5: Programs for machine learning (morgan kaufmann series in machine learning),” Morgan Kaufmann, 1993.
[۱۲] S. B. Kotsiantis, et al., Supervised machine learning: A review of classification techniques, 2007.
[۱۳] R. O. Duda, et al., Pattern classification: John Wiley & Sons, 2012.
[۱۴] C. M. Bishop and N. M. Nasrabadi, Pattern recognition and machine learning vol. 1: springer New York, 2006.
[۱۵] R. S. Parpinelli, et al., “Data mining with an ant colony optimization algorithm,” Evolutionary Computation, IEEE Transactions on, vol. 6, pp. 321-332, 2002.
دنیای مدرن در حقیقت دنیایی در محاصره حجم عظیمی از دادهها، چه عددی و چه انواع دیگر است. پیشرفت فناوری اطلاعات و مجهز شدن به ابزار رایانهای امکان جمعآوری اطلاعات در زمینههای مختلف را فراهم آورده و منجر به پیدایش ساختارهای دادهای با حجم عظیم شده است. دست پیدا کردن به اطلاعات نهفته در پایگاه داده شرکتها، دانشگاهها، مؤسسات دولتی و سایر مراکز نیازمند مدیریتی جدید است و با بهکارگیری سیستمهای سنتی این امر تحقق نمییابد. ضمن اینکه با گسترش رقابت در بخشهای مختلف علمی، اجتماعی، سیاسی و غیره زمان مورد نیاز برای دسترسی به این اطلاعات نیز اهمیت دوچندان پیدا کرده است. بنابراین نیاز به طراحی سیستمهای هوشمندی که توانایی دستیابی به اطلاعات مورد نظر کاربر را در مدت زمان کوتاه و با کمترین مداخله کاربر را داشته باشند کاملاً مشهود است.
داده کاوی فرآیندی است که از آغاز دههی ۹۰ پا به عرصهی ظهور گذاشته و با نگرشی نو به مسئلهی استخراج اطلاعات از پایگاه داده مینگرد. این فرآیند یک مرحله فراتر از بازیابی ساده دادهها است و این اجازه را میدهد که دانش را در میان حجم انبوه دادهها کشف کرد [۱۴]. داده کاوی یک علم میان رشتهای است و ترکیبی از علومی نظیر پایگاه داده، تحلیل آماری، هوش مصنوعی و بینایی ماشین میباشد. داده کاوی یک مرحله ضروری از فرآیند بزرگتر کشف دانش میباشد که شامل مراحل زیر میباشد [۱۵] :
پاکسازی دادهها: حذف نویز و دادههای ناسازگار و نا ایستا.
یکپارچگی دادهها: ترکیب انواع دادههای پراکنده و ناهمگن از منابع مختلف.
انتخاب ویژگیها: انتخاب صفتهای تأثیرگذار از دادهها.
تبدیل دادهها: تبدیل یا ترکیب دادهها به اشکالی که برای بکار بردن در دادهکاوی مناسب باشند.
دادهکاوی: روشهای مختلف را برای استخراج الگو استفاده میکند.
ارزیابی الگو: الگوهای مناسب برای ارائه دانش را بر اساس معیارهای مشخص شناسایی میکند.
ارائه دانش: دانش کشف شده را با استفاده از روشهای نمایش اطلاعات نشان میدهد.
دادهکاوی از دو مرحله اصلی تشکیل شده است؛ مرحله اول پیش پردازش دادهها که در این مرحله خصیصههای با تأثیر بالاتر از دادههای سطح پایین استخراج میشود. مرحله دوم تشخیص الگو میباشد که به کشف الگوی موجود در دادهها به کمک صفات و خصیصههای بدست آمده میپردازد.
دادهکاوی را میتوان سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک بلوغ در صنعت پایگاه داده نظیر: عملیات جمعآوری دادهها و ایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده میباشد.
داده کاوی تحلیل دادههای قابل مشاهده برای کشف ارتباطات غیرمنتظره و خلاصه کردن دادهها به صورتی بدیع است که برای دارندهی اطلاعات مفید و قابل درک باشد [۱۶]. کاوش اطلاعات، حجم عظیمی از دادههای خام را به فرمی تغییر میدهد که انسان بتواند آنها را به راحتی بفهمد و برای تصمیم گیری بتواند از این اطلاعات استفاده کند. در مسائل داده کاوی، هر چه حجم دادهها بیشتر میشود، میل بیشتری برای کشف الگوهای مخفی در دادهها به وجود میآید. در قدم اصلی داده کاوی ممکن است از چندین الگوریتم داده کاوی استفاده شود. کار اصلی الگوریتم داده کاوی با توجه به نوع مسئلهی کشف دانش تغییر میکند اما دو نوع اصلی الگوریتمهای داده کاوی، دستهبندی و خوشهبندی است.
اصلیترین دلیلی که باعث شد داده کاوی در علوم پزشکی مورد توجه بسیاری قرار بگیرد، مسأله در دسترس بودن حجم وسیعی از دادهها و نیاز شدید به اینکه از این دادهها، اطلاعات و دانش استخراج شود. دادهکاوی عبارت است از استخراج دانش از مجموعهای از دادهها.
هرگاه دادهها دارای خصیصهای خاص باشند که مستقیماً از دیگر خصایص به وجود نیامده باشد اما بین آن مشخصه و دیگر ابعاد رابطه وابستگی وجود داشته باشد، در این صورت میتوان با کشف مدلی بر اساس دیگر مشخصهها، آن بعد مذکور (که نشان دهنده دسته خاصی از دادهها است) را شناسایی نمود. فرض کنید که مشخصات تعدادی بیمار در پایگاه دادهای وجود دارد که قبلاً با استفاده از آزمایش خاص دو نوع بیماری مشخص شده که هرکدام از این بیماران به کدام بیماری مبتلا هستند، در این جا هیچ فردی حق ندارد هر دو بیماری را داشته باشد، سالم بوده و یا بیماری دیگری داشته باشد، به این معنی که دستهها فضای مسئله را افراز میکند. در چنین پایگاه دادههایی برای هر بیمار یک رکورد خاص وجود دارد که شامل علائم بیمار و در نهایت نام یا برچسب بیماری که بیمار به آن مبتلا شده است میباشد. یک داده کاو تصمیم میگیرد سیستمی را ابداع کند که طی آن بدون آزمایش و فقط از روی علائم بیمار بتوان نوع بیماری وی را تشخیص داد. این تصمیم ممکن است به هر دلیلی مثلاً کمبود امکانات صورت گرفته باشد. آنچه باید انجام شود عملیات دسته بندی نامیده میشود. هدف دستهبندی؛ آموزش یک نگاشت از ورودیهای x به خروجیهای y است، که در آن ، C تعداد کلاسها را مشخص میکند. اگر C=2 دستهبندی را دستهبندی دودویی مینامیم ( )، اگر C>2 باشد، این نوع دستهبندی را دستهبندی چند کلاسه مینامیم [۱۷].
دستهبندی دادهها یک فرآیند دو مرحلهای است. اولین مرحله ساخت مدل و دومین مرحله استفاده از مدل و پیشبینی کلاس از طریق مدل ساخته شده است. برای این منظور باید مجموعه دادهها را به دو دسته دادههای آموزش و دادههای تست تقسیم کنیم. با استفاده از دادههایی که برچسب آموزش خوردهاند یک دستهبند ایجاد میشود که بر اساس آن بتوان دادههای فاقد برچسب را در دستههای مربوط به خودشان قرار داد. کارایی دستهبند ساخته شده با دادههای تست (که به صورت تصادفی از میان دادهها انتخاب شدهاند) مورد سنجش قرار میگیرد و مدل روی آنها اجرا میشود تا دقت پیش بینی دستهبند بررسی گردد، چنان که مدل دارای دقت مناسبی باشد برای دستهبندی دادهها به کار میرود.
در دستهبندی یادگیری به وسیله نمونهها انجام میگیرید و برچسب هر یک از دستهها مشخص است. سپس نمونهها بر حسب ویژگیهایشان به دستههای از قبل مشخص شده، تخصیص داده میشوند. در حالی که در خوشهبندی دادهها به خوشههای مختلف که از قبل معین نیستند تقسیم میشوند، بر این اساس که دادههای درون خوشه مشابه و دادههای خوشههای مختلف متفاوت باشند. خوشه بندی به فرآیند تقسیم بندی داده به یک یا چند گروه به طوری که فاصلهی بین خوشهها حداکثر و فاصلهی درون خوشهها حداقل باشد، اطلاق میشود.
روشهای زیادی برای دستهبندی وجود دارد که از جمله میتوان به مواردی که در ادامه به آنها اشاره میشود اشاره کرد:
شبکههای عصبی مصنوعی[۱]
درختهای تصمیم[۲]
شبکههای بیزین
kنزدیکترین همسایه[۳]
ماشین بردار پشتیبان[۴]
روشهای مبتنی بر قانون
مطالعه شبکههای عصبی مصنوعی تا حد زیادی الهام گرفته از سیستمهای یادگیر طبیعی است که در آنها یک مجموعه پیچیده از نرونهای به هم متصل در کار یادگیری دخیل هستند. گمان میرود که مغز انسان از تعداد ۱۰۱۱ نرون تشکیل شده باشد که هر نرون با تقریباً ۱۰۴ نرون دیگر در ارتباط است. سرعت انتقال نرونها در حدود ۱۰-۳ ثانیه است که در مقایسه با کامپیوترها ( ۱۰-۱۰ ثانیه) بسیار ناچیز مینماید. با این وجود آدمی قادر است در ۰٫۱ ثانیه تصویر یک انسان را باز شناسائی نماید. این قدرت فوقالعاده باید از پردازش موازی توزیع شده در تعدادی زیادی از نرونها حاصل شده باشد [۱۸].
این شبکهها یادگیری را از روی مثالها و نمونهها انجام میدهند و از این لحاظ در عمل یادگیری شبیه به انسان عمل میکنند. مزیت دیگر آنها این است که این شبکهها از توانایی تعمیم دهی ذاتی برخوردار هستند؛ یعنی این شبکهها توانایی تشخیص الگوهایی را که شبیه نمونههایی که قبلاً یاد گرفته باشد را دارد نه اینکه تنها الگوهای دقیقاً همانند نمونههای آموزشی را تشخیص دهد [۱۹].
شبکه عصبی مصنوعی روشی عملی برای یادگیری توابع گوناگون نظیر توابع با مقادیر حقیقی، توابع با مقادیر گسسته و توابع با مقادیر برداری میباشد. یک نرون به تنهایی فقط میتواند برای شناسایی توابعی که به صورت خطی تفکیک پذیرند بکار رود، از آنجا که در مسائل واقعی عموماً توابع به صورت خطی جدایی پذیر نیستند شبکهای از نرونها مورد نیاز میباشد.
[۱] Artificial Neural Networks (ANN)
[۲] decision trees
[۳] k-nearest neighbors (K-NN)
[۴] Support Vector Machine (SVM)
تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.
ارسال نظر