پیشینه تحقیق بیماری تنفسی و مفهوم و مراحل و کاربرد های داده کاوی و الگوهای رده بندی دارای ۳۳ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.
۲-۲٫ دادهکاوی ۳
۲-۲-۱٫ مفهوم دادهکاوی ۳
۲-۲-۲٫ مراحل دادهکاوی ۴
۲-۲-۳٫ پیشپردازش ۴
۲-۲-۳-۱٫ پاکسازی داده ۴
۲-۲-۳-۲٫ یکپارچهسازی داده ۵
۲-۲-۳-۳٫ تبدیل داده ۵
۲-۲-۳-۴٫ کاهش داده ۶
۲-۲-۳-۵٫ تصویر کردن برای کاهش بعد ۶
۲-۲-۴٫ دادهکاوی ۷
۲-۲-۵٫ پسپردازش ۸
۲-۲-۶٫ کاربردهای دادهکاوی ۸
۲-۳٫ دادهکاوی در پزشکی ۸
۲-۴٫ بیماری تنفسی ۱۰
۲-۴-۱٫ عفونت دستگاه تنفسی فوقانی ۱۱
۲-۴-۲٫ پنومونی ۱۱
۲-۴-۳٫ بیماری مزمن انسدادی ریه ۱۲
۲-۵٫ الگوریتمهای ردهبندی ۱۲
۲-۵-۱٫ درخت تصمیم ۱۳
۲-۵-۱-۱٫ CHAID ۱۴
۲-۵-۱-۲٫ ID3 ۱۴
۲-۵-۱-۳٫ C5.0 ۱۵
۲-۵-۲٫ ماشین بردار پشتیبان ۱۵
۲-۵-۳٫ شبکهی عصبی ۱۸
۲-۵-۴٫ Bagging ۱۹
۲-۵-۵٫ AdaBoost ۲۱
۲-۶٫ پیشینهی تحقیقات در بیماریهای تنفسی ۲۴
مراجع ۲۶
[۲] غضنفری، مهدی، علیزاده، سمیه و تیمورپور، بابک. «دادهکاوی و کشف دانش». تهران: انتشارات دانشگاه علم و صنعت ایران، چاپ اول، (۱۳۸۷).
[۵] Tan, Pang-Ning; Steinbach, Michael & Kumar, Vipin. Intro-duction to data mining. Michael Steinbach & Vipin Kumar, Pearson Addison Wesley, (2006).
[۶] Patil, Shantakumar B. & Kumaraswamy, Y.S. “Intelligent and Effective Heart Attack Prediction System Using Data Mining and Artificial Neural Network”. European Journal of Scien-tific Research, 31(4):642-656, 2009.
[۷] Gupta, Anamika; Kumar, Naveen & Bhatnagar, Vasudha. “Analysis of Medical Data using Data Mining and Formal Con-cept Analysis”. World Academy of Science, Engineering and Technology, 11:61-64, Jun 2005.
[۸] Gorunescu, Florin. “Data Mining Techniques in Computer-Aided Diagnosis: Non-Invasive Cancer Detection”. Interna-tional Journal of Biological and Medical Sciences, 1(2):105-108, September 2007.
[۹] Wasan, Siri Krishan; Bhatnagar, Vasudha & Kaur, Harleen. “The Impact of Data Mining Techniques on Medical Diagnos-tics”. Data Science Journal, 5:119-126, 2006.
[۱۰] Canlas, Ruben D. Data Mining in health care: Current Ap-plications and Issues. Master of Science in Information Tech-nology, Carnegie Mellon University, Australia, August 2009.
[۱۱] Silver, Michael; Sakata, Taiki; Su, Hua-Ching; Herman, Charles; Dolins, Steven B. & O’Shea, Michael J.. “Case study: how to apply data mining techniques in a healthcare data ware-house”. Journal of Healthcare Information Management, 15(2):155-164, Summer 2001.
[۱۲] Kaur, Harleen & Wasan, Siri K. “Empirical Study on Applica-tions of Data Mining Techniques in Healthcare”. Journal of Computer Science, 2(2):194-200, February 2006.
تکنولوژی مدیریت پایگاه داده های پیشرفته انواع مختلفی از دادهها را میتواند در خود جای دهد، در نتیجه تکنیکهای آماری و ابزار مدیریت سنتی برای آنالیز این دادهها کافی نیست و استخراج دانش[۱] از این مقدار حجیم یک چالش بزرگ تلقی میشود. دادهکاوی کوششی برای بهدست آوردن اطلاعات مفید از میان این دادههاست و رشد بیرویهی دادهها در سطح جهان اهمیت دادهکاوی را دو چندان کرده است.
پایگاه دادههای پزشکی، شامل انبوهی از اطلاعات بیماران و وضعیت پزشکی آنهاست. ارتباطات و الگوهای نهفته در این دادهها میتواند دانش جدیدی در حوزه علوم پزشکی تولید کند. بهطوریکه امروزه استخراج دانش مفید و فراهم کردن ابزارهای تصمیمگیری برای تشخیص و معالجهی بیماریها، به یک موضوع ضروری تبدیل شده است.
در یک تعریف غیر رسمی دادهکاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی میکنند، که این دانش به صورت ضمنی در پایگاه دادههای عظیم، انبارداده[۲]و دیگر مخازن بزرگ اطلاعات، ذخیره شده است. دادهکاوی بهطور همزمان از چندین رشته علمی بهره میبرد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکههای عصبی، آمار، شناسایی الگو، سیستمهای مبتنی بردانش[۳]، حصول دانش[۴]، بازیابی اطلاعات[۵]، محاسبات سرعت بالا[۶] و بازنمایی بصری داده[۷] .
دادهکاوی اغلب بهعنوان بخشی از فرآیند «کشف دانش از پایگاهداده»، تلقی میشود. کشف دانش از پایگاه داده، فرآیندی است که دادههای خام را به دانش مفید تبدیل میکند که علاوه بر دادهکاوی، شامل دو مرحلهی پیشپردازش و پسپردازش نیز میباشد.
هدف پیشپردازش، تبدیل دادههای خام به قالبی است که برای تحلیلهای بعدی مناسب باشد. همچنین این مرحله به شناسایی ویژگیها و قطعات مختلف داده، کمک میکند. از آنجائیکه دادهها ممکن است با قالبهای مختلف و در پایگاه دادههای متفاوتی ذخیره شده باشند، اغلب زمان زیادی برای پیشپردازش داده لازم است[۵].
پیشپردازش داده، یک محدودهی وسیع شامل استراتژیها و تکنیکهای مختلفی است که بهصورت بسیار پیچیدهای با یکدیگر در رابطهاند و این ارتباطات پیچیده، معرفی رهیافتها و ایدههای اصلی پیشپردازش را بهصورت منظم و ساختیافته بسیار مشکل میکند.
وظایف پیشپردازش عبارتند از: پاکسازی دادهها[۸]، یکپارچهسازی دادهها[۹]، تبدیل داده[۱۰]، کاهش داده[۱۱]، تصویر کردن و کاهش بعد[۲].
خطاهای عملیاتی اغلب باعث میشوند که دادههای بهدست آمده از منابع دنیای واقعی، پرغلط، ناقص و ناسازگار باشند. ابتدا لازم است، چنین دادههای بیکیفیتی، تمیز شوند. وظایف اصلی پاکسازی دادهها عبارتند از:
پرکردن ویژگیهایی با مقدار گمشده[۱۲] : رویکردهای مختلفی در برخورد با مقادیر گمشده وجود دارد که عبارتند از: حذف رکورد، پرکردن بهصورت دستی، جایگزینی با یک مقدار ثابت سراسری، جایگزینی با مقدار میانگین، جایگزینی با مقادیری با احتمال بالاتر (با استفاده از رابطههای بیزی، درخت تصمیمگیری یا پسانمایی[۱۳] ).
شناخت دادههای پرت[۱۴] و هموار کردن دادههای نویزدار[۱۵].
اصلاح دادههای ناسازگار.
رفع مشکل افزونگی که بر اثر یکپارچهسازی دادهها ایجاد شده است.
دادهکاوی اغلب به یکپارچهسازی داده (ادغام دادهها از چندین منبع داده) نیاز دارد. همچنین ممکن است لازم باشد که دادهها به شکل مناسب دادهکاوی تبدیل شوند. در این مرحله، دادههای چندین منبع را در یک مخزن منسجم ترکیب میکنیم.
در این مرحله، دادهها به شکل مناسب برای دادهکاوی تبدیل میشوند. این مرحله، شامل بخشهای زیر میباشد:
هموارسازی: این بخش از تبدیل داده، با حذف نویز سروکار دارد.
تجمیع: شامل عملیات تلخیص و تجمیع روی دادههاست. مثل تبدیل فروش روزانه به فروش هفتگی یا ماهانه.
تعمیم: جایگزینی دادهی سطح پائین با مفاهیم سطح بالاتر. مثل تبدیل متغیر پیوستهی سن به یک مفهوم سطح بالاتر مثل جوان، میانسال یا مسن.
ایجاد ویژگی[۱۶] : گاهی برای کمک به فرآیند دادهکاوی لازم است که ویژگی جدیدی از روی ویژگیهای موجود ساخته شود.
نرمالسازی: نرمالسازی شامل تغییر مقیاس دادهها به گونهایست که آنها را به یک دامنهی کوچک و معین مثل ] ۱،۱-[ نگاشت کند. مهمترین روشهای نرمالسازی عبارتند از: Min-Max، Z-Score و نرمالسازی با استفاده از مقیاسبندی اعشاری[۱۷].
روشهای کاهش داده، میتواند برای بهدست آوردن یک بازنمایی کوچکتر و کاهشیافته از داده، که بسیار کمحجمتر از دادههای اصلی بوده و البته یکپارچگی دادههای اصلی را حفظ میکند، بهکار میرود. استراتژیهای کاهش داده، عبارتند از: تجمیع مکعبی داده[۱۸]، انتخاب زیرمجموعهای از ویژگیها[۱۹]، کاهش تعداد نقاط، گسستهسازی و تولید سلسله مراتب مفهومی.
در کاهش بعد از طریق تصویر کردن، تبدیلات و کدگذاریهایی روی داده انجام میشود که در نهایت بازنمایی کاهشیافته یا فشردهای از دادههای اصلی بهدست میآید.
وظایف داده کاوی را میتوان به دو بخش کلی تقسیم کرد: توصیفی و پیشبینانه.
وظایف توصیفی، خواص عمومی دادهها را مشخص میکنند. هدف از توصیف، یافتن الگوهایی در مورد دادههاست که برای انسان قابل تفسیر باشد.
وظایف پیشبینانه به منظور پیشبینی رفتارهای آینده، مورد استفاده قرار میگیرند. منظور از پیشبینی، بهکارگیری چند متغیر یا ویژگی در پایگاه داده برای پیشبینی مقادیر آینده یا مقادیر ناشناختهی دیگر متغیرهاست[۲].
وظایف پیشبینانه را میتوان به دو دسته تقسیم کرد: ردهبندی و پسانمایی. ردهبندی برای پیشبینی مقدار یک متغیر گسسته بهکار میرود. درحالیکه پسانمایی برای پیشبینی مقدار یک متغیر پیوسته، مورد استفاده قرار میگیرد. در انتهای این فصل، به معرفی برخی از تکنیکهای موجود برای حل مسائل ردهبندی که در این تحقیق مورد استفاده قرار گرفته است، خواهیم پرداخت.
وظایف توصیفی را نیز میتوان به سه دسته تقسیم کرد: تحلیل انجمنی[۲۰]، خوشهبندی[۲۱] و تشخیص انحراف[۲۲]. هدف فرآیند تحلیل انجمنی، ایجاد مجموعهای از قوانین است که ارتباطات بین مجموعهای از ویژگیها را که بهشدت به یکدیگر وابسته هستند، بیان میکند. هدف خوشهبندی، معرفی گروههایی از داده است بهطوریکه دادههایی که در یک خوشه حضور دارند، نسبت به دادههایی که در یک خوشهی دیگر قرار دارند، شباهت بسیار بیشتری به یکدیگر دارند. در فرآیند تشخیص انحراف نیز هدف، کشف موارد غیرطبیعی یا خارج از محدوده است که شامل دادههایی هستند که با بقیهی دادههای حاضر در مجموعه، بسیار متفاوتاند[۵].
[۲] Data Warehouse
[۳] Knowledge-based System
[۴] Knowledge-acquisition
[۵] Information Retrieval
[۶] High-performance Computing
[۷] Data Visualization
۲ Normalization by decimal scaling
تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.
ارسال نظر