پیشینه تحقیق داده کاوی و فنون داده‌کاوی و روش‌های یادگیری مدل در داده‌کاوی

پیشینه تحقیق داده کاوی و فنون داده‌کاوی و روش‌های یادگیری مدل در داده‌کاوی

دسته: رشته مهندسی فناوری اطلاعات

فرمت : word | صفحات : 49

قیمت: 5000 تومان
891 views

پیشینه تحقیق داده کاوی و فنون داده‌کاوی و روش‌های یادگیری مدل در داده‌کاوی دارای ۴۹ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

۲-۱- مقدمه   ۵
۲-۲-انگیزه‌های کاوش داده   ۵
۲-۳-نیاز به داده‌کاوی   ۸
۲-۴- چالش‌های داده‌کاوی   ۸
۲-۴-۱- چالشهای اولیه   ۹
۲-۴-۲- چالش‌های ثانویه   ۱۱
۲-۵-معرفی داده‌کاوی   ۱۲
۲-۵-۱-منشاُ علمی   ۱۳
۲-۵-۲- معماری سیستم داده‌کاوی   ۱۴
۲-۵-۳- مراحل عملیات داده‌کاوی   ۱۶
۲-۵-۳-۱-آمادهسازی داده   ۱۶
۲-۵-۳-۲-یادگیری مدل   ۱۷
۲-۵-۳-۳-ارزیابی و تفسیر مدل   ۱۷
۲-۶- محدودیت‌های داده‌کاوی   ۱۸
۲-۷- قابلیت‌های داده‌کاوی   ۱۸
۲-۸- روش‌های یادگیری مدل در داده‌کاوی   ۱۹
۲-۸-۱- روش‌های پیش‌بینی   ۱۹
۲-۸-۱-۱- دسته‌بندی   ۱۹
۲-۸-۱-۲- رگرسیون   ۲۰
۲-۸-۱-۳-تشخیص انحراف   ۲۱
۲-۸-۲- روش‌های توصیفی   ۲۲
۲-۸-۲-۱- خوشه‌بندی   ۲۲
۲-۸-۲-۲- کشف قوانین انجمنی   ۲۵
۲-۸-۲-۳- کشف الگوهای ترتیبی   ۲۵
۲-۹- فنون داده‌کاوی   ۲۵
۲-۹-۱- یافتن خودکارخوشه‌ها   ۲۷
۲-۹-۱-۱-نقاط قدرت این روش   ۲۷
۲-۹-۱-۲-نقاط ضعف   ۲۷
۲-۹-۱-۳- کاربرد   ۲۸
۲-۹-۲- درخت‌های تصمیم‌گیری و استقرا قاعده‌ای   ۲۸
۲-۹-۲-۱-نقاط قوت   ۲۸
۲-۹-۲-۲-نقاط ضعف روش درخت‌تصمیم‌گیری   ۲۸
۲-۹-۲-۳-کاربرد   ۲۹
۲-۹-۳- شبکه‌های عصبی   ۲۹
۲-۹-۳-۱- نقاط قوت شبکه‌های عصبی مصنوعی   ۲۹
۲-۹-۳-۲- نقاط ضعف شبکه‌عصبی   ۳۰
۲-۹-۳-۳-کاربرد   ۳۰
۲-۱۰- درجه‌بندی فنون مختلف داده‌کاوی از جهت سختی و آسانی   ۳۰
۲-۱۱-تعریف داشبورد   ۳۱
۲-۱۲- سابقه تحقیق   ۳۶
۲-۱۲-۱- سابقه داده‌کاوی   ۳۷
۲-۱۲-۲- سابقه داشبورد   ۴۱
۲-۱۳ بررسی مراحل داشبورد در چند نمونه   ۴۳
فهرست منابع   ۴۵

منابع

همکاران سیستم.(۱۳۹۱),همکاران سیستم “Retrieved from”

پناهی‌آذر، مریم.(۱۳۸۵)، ”داده‌کاوی جهت مقاصد پیش‌بینی “، دانشگاه صنعتی شریف.

زرین، غ. (۱۳۸۸)”, جایگاه هوش تجاری در شهرداری الکترونیک, “دومین کنفرانس بین المللی شهرداری الکترونیک.

صنیعی‌آباده،دکتر محمد.داده‌‌کاوی کاربردی، انتشارات انتشارات نیاز‌ دانش،چاپ اول ۱۳۹۱٫

کلانتری، خلیل.پردازش و تحلیل داده‌ها در تحقیقات اجتماعی-اقتصادی، انتشارات فرهنگ مبنا، چاپ چهارم ۱۳۸۹٫

Yigitbasioglu, O.M. and Velcu, O. (2011),”A review of dashboards in performance management: Implications for design and research,” International Journal of Accounting Information Systems, Elsevier Inc.doi:10,1016/j.accinf.2011.08.002.

Mehmed Kantardzic,”Data Mining (Concepts, Models, Methods and Algorithms)”, University of Louisvilla. IEEE Press, ISBN 0-471-22852, 2003.

Wai-Ki Ching and Michael Kwok ,”Advances in Data Mining and Modeling“, University of Hong Kong , Jone, World Scientifc, ISBN 981-238-354-9,2005.

Attaway, N. M., & Bry, B. H. (2004). Parenting style and black adolescents’ academic Journal of Black Psychology, 30, 229–۲۴۷٫

۲-۱- مقدمه

در اواسط نیمه‌ی دوم قرن بیستم گروهی از پژوهشگران آمریکایی دست به اقدام جالبی زدند. آن‌ها کلیه اطلاعلاتی را که انسآن‌ها تا قرن دوم میلادی از خورشید، گردش زمین، ماه، شب و روز و … داشتند به‌صورتی قابل پردازش درآوردند و به شکل مجموعه‌ای از داده‌های عددی و سیمبلیک جهت کاوش آماده نمودند. با استفاده از روش‌های داده‌کاوی پس از حدود یک ماه خروجی الگوریتم به‌صورت مجموعه‌ای از روابط آماده شد. این روابط پس از تفسیر مجموعه قوانین حیرت‌انگیزی به شکل ذیل به‌دست آورد:

شی‌ء‌ای که زمین نامیده شده گرد است.

شیء زمین به دور شیءای که خورشید نامیده شده می‌گردد.

شیءای که ماه نامیده شده به دور زمین می‌گردد.

این اقدام باعث شد که این پژوهشگران به نتیجه مهمی دست یابند: با استفاده از داده‌کاوی می‌توان به دانشی دست یافت که خود انسان قرن‌ها بعد این دانش را کسب خواهد کرد.

در این مقاله با مقدمات علم داده‌کاوی آشنا شده و سپس به تعاریف و دسته‌بندی داشبورد خواهیم پرداخت و در ادامه تحقیقات انجام شده تاکنون در زمینه داده‌کاوی آموزشی و داشبورد و چند نمونه از مراحل طراحی داشبورد را مورد بررسی قرار خواهیم داد.

۲-۲-انگیزه‌های کاوش داده

به شکل ۲-۱ توجه کنید. دراین شکل دو نمودار وجود دارد. نمودار اول (نمودار پایین شکل) نشان‌دهنده تعداد تحلیل‌گرها است، با توجه به نمودار مشخص است با گذشت زمان تعداد تحلیل‌گرها در مقایسه با رشد داده تقریبا ثابت است. نمودار دوم نشان‌دهنده‌ی رشد داده در طی زمان می‌باشد، از روی نمودار می‌توان مشاهده نمود که حجم داده با گذشت زمان در حال رشد انفجارگونه است. به تفاوت بین این دو نمودار (فضای خالی بین دو نمودار) شکاف داده‌ای[۱] بین دو نمودار گفته می‌شود. فاصله‌ای که بین این دو نمودار است نشان می‌دهد که به مرور زمان تعداد داده‌ها نسبت به تعداد افرادی که بتوانند این داده‌ها را تحلیل کنند مرتبا در حال افزایش است، پس نیاز به ابزار مکانیزه‌ای برای تحلیل داده، روز‌به‌روز در حال افزایش است. برای تبیین سرعت رشد داده‌ها، می‌توان به نمونه‌های ذیل اشاره نمود:

مرکز ستاره‌شناسی VLBI دارای ۱۶ تلسکوپ بزرگ است که هر یک با سرعت ۱ گیگابیت بر ثانیه داده ستاره‌شناسی را برمبنای مشاهدات یک ماه ۲۵ روز تولید می‌کنند.

شرکت مخابراتی AT&T با میلیاردها تماس در روز سروکار دارد. چنین داده‌ی عظیمی را نمی‌توان ذخیره نمود – تجزیه و تحلیل آن می‌بایست به‌صورت برخط[۲] بر روی جریان داده باشد.

تیم جمع‌آوری وب کتابخانه‌ی ملی آمریکا در ماه می ۲۰۰۸ اعلام نموده که کتابخانه بیش از۸۲٫۶ ترابایت داده گردآوری نموده است.

موسسه‌ی com ادعا می‌کند که در حدود۶۰۰ ترابایت اطلاعات شجره‌نامه‌ای از داده‌های سرشماری آمریکا طی سال‌های ۱۷۹۰ الی ۱۹۳۰ جمع‌آوری نموده است.

در سال ۱۹۹۳ تمامی ترافیک اینترنت ۱۰۰ ترابایت برآورد نموده است (معادل با ۵ زتابایت درسال)

با توجه به مطالب مطرح شده، شاید بتوان اولین انگیزه کاوش داده را رشد روزافزون آن

دانست. در واقع رشد داده به حدی است که تنها در صورت وجود ابزار مکانیزه برای بررسی آن می‌توان امیدوار به استفاده از آن بود. زیرا در غیر این صورت هم‌زمان با تحلیل حجم کوچکی داده، حجم بسیار زیادی از همان داده در حال تولید شدن است که هرگز فرصتی برای کاوش آن وجود نخواهد داشت. به علاوه مشکلاتی دیگر که در ادامه اشاره شده‌اند نیز وجود دارند:

معمولا دانشی که در داده‌ها وجود دارد خیلی بدیهی، روشن و واضح نیست.

تحلیل گران انسانی ممکن است هفته‌ها برای کشف اطلاعات باارزش از داده وقت صرف کنند و گاهی اوقات ممکن است با صرف زمان زیادی لزوما موفق هم نشوند.

گاهی اوقات با وجود امکان جمع‌آوری داده، این کار انجام نمی‌شود. دلیل عدم جمع‌آوری داده معمولا عدم وجود دانش برای جمع‌آوری آن است. اینکه داده سرمایه یک سازمان است خود دانشی مهم و باارزش است که همیشه وجود ندارد.

-نیاز به داده‌کاوی

روش سنتی تبدیل داده‌ها به دانش، متکی به تجزیه، تحلیل و تفسیر دستی است. این تجزیه و تحلیل‌های دستی مجموعه‌های داده‌ای، کند، گران و بسیار موضوعی است. در حقیقت با رشد نمایی حجم داده‌ها، این نوع تجزیه و تحلیل‌ها در بسیاری از حوزه‌ها غیر عملی است. هنگامی که مقیاس به‌کارگیری داده‌ها و استدلال بر مبنای آن‌ها فراتر از ظرفیت‌های انسانی می‌رود، امید به کمک فناوری کامپیوتر می‌رود. مساله استخراج دانش از پایگاه‌های داده‌ای بزرگ شامل مراحل بسیاری از دستکاری، بازیابی و پیش‌پردازش داده‌ها تا استدلالات ریاضی، آماری، جستجو و استنتاج می‌باشد(Wai-Ki Ching&Michael Kwok,2005).

۲-۴- چالش‌های داده‌کاوی

شاید بتوان مهم‌ترین نقاط ضعف روش‌های داده‌کاوی را در سه مورد خلاصه نمود: وجود داده، صحت داده و کافی بودن ویژگی‌ها. منظور از وجود داده‌این است که اصولا داده‌ای برای کاوش وجود داشته باشد و این‌گونه نباشد که داده در محیط مورد کاوش استخراج و یا ثبت نشده باشد. متاسفانه این مشکل در بسیاری از محیط‌های واقعی وجود دارد. صحت داده مبین آن است که داده جمع‌آوری شده صحیح بوده و نادرستی در آن وجود نداشته باشد. به عنوان مثال نباید جنسیت شخصی با نام «محسن» زن وارد شده باشد و یا اشتباه های دیگری که دلیل وجودی آن‌ها خطا در ورود داده است، رخ دهد. کافی بودن ویژگی‌ها بدین معنا است که ویژگی‌های اخذ شده برای هر رکورد یا شیء برای یادگیری مدل و یا کشف نظم حاکم بر داده موثر، مناسب و کافی باشند. به عنوان مثال اگر هدف ما یادگیری یک مدل در دسته‌بندی کننده برای تشخیص بیماری دیابت در یک کلینیک است، ثبت ویژگی قندخون بسیار مهم است در حالی که وجود ویژگی میزان تحصیلات اهمیتی ندارد. توجه کنید چنان چه هر کدام از مشکلات سه‌گانه فوق در داده وجود داشته باشند هیچ یک از الگوریتم‌های داده‌کاوی، هر قدر هم که توانا باشند، نخواهند توانست نظم حاکم بر داده را تحت هیچ شرایطی بیابند.

[۱] Data Gap

[۲] online

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.

مطالب پیشنهادی:

تحقیق داده کاوی و تکنیک ها و روشهای آن

تحقیق داده کاوی و مراحل فرآیند و دسته بندی الگوریتم های آن

تحقیق یادگیری و اسناد و نظریه ها ی آن و نقش اسنادها در مهارت های روان شناختی و ورزشی

تحقیق نقش هورمون های استروئیدی و بیس فنول آ بر یادگیری و حافظه

تحقیق سبک های مدیریت ، یادگیری خود تنظیمی و پیشرفت تحصیلی و نظریه های آن