پیشینه تحقیق داده کاوی و فنون دادهکاوی و روشهای یادگیری مدل در دادهکاوی دارای ۴۹ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.
۲-۱- مقدمه ۵
۲-۲-انگیزههای کاوش داده ۵
۲-۳-نیاز به دادهکاوی ۸
۲-۴- چالشهای دادهکاوی ۸
۲-۴-۱- چالشهای اولیه ۹
۲-۴-۲- چالشهای ثانویه ۱۱
۲-۵-معرفی دادهکاوی ۱۲
۲-۵-۱-منشاُ علمی ۱۳
۲-۵-۲- معماری سیستم دادهکاوی ۱۴
۲-۵-۳- مراحل عملیات دادهکاوی ۱۶
۲-۵-۳-۱-آمادهسازی داده ۱۶
۲-۵-۳-۲-یادگیری مدل ۱۷
۲-۵-۳-۳-ارزیابی و تفسیر مدل ۱۷
۲-۶- محدودیتهای دادهکاوی ۱۸
۲-۷- قابلیتهای دادهکاوی ۱۸
۲-۸- روشهای یادگیری مدل در دادهکاوی ۱۹
۲-۸-۱- روشهای پیشبینی ۱۹
۲-۸-۱-۱- دستهبندی ۱۹
۲-۸-۱-۲- رگرسیون ۲۰
۲-۸-۱-۳-تشخیص انحراف ۲۱
۲-۸-۲- روشهای توصیفی ۲۲
۲-۸-۲-۱- خوشهبندی ۲۲
۲-۸-۲-۲- کشف قوانین انجمنی ۲۵
۲-۸-۲-۳- کشف الگوهای ترتیبی ۲۵
۲-۹- فنون دادهکاوی ۲۵
۲-۹-۱- یافتن خودکارخوشهها ۲۷
۲-۹-۱-۱-نقاط قدرت این روش ۲۷
۲-۹-۱-۲-نقاط ضعف ۲۷
۲-۹-۱-۳- کاربرد ۲۸
۲-۹-۲- درختهای تصمیمگیری و استقرا قاعدهای ۲۸
۲-۹-۲-۱-نقاط قوت ۲۸
۲-۹-۲-۲-نقاط ضعف روش درختتصمیمگیری ۲۸
۲-۹-۲-۳-کاربرد ۲۹
۲-۹-۳- شبکههای عصبی ۲۹
۲-۹-۳-۱- نقاط قوت شبکههای عصبی مصنوعی ۲۹
۲-۹-۳-۲- نقاط ضعف شبکهعصبی ۳۰
۲-۹-۳-۳-کاربرد ۳۰
۲-۱۰- درجهبندی فنون مختلف دادهکاوی از جهت سختی و آسانی ۳۰
۲-۱۱-تعریف داشبورد ۳۱
۲-۱۲- سابقه تحقیق ۳۶
۲-۱۲-۱- سابقه دادهکاوی ۳۷
۲-۱۲-۲- سابقه داشبورد ۴۱
۲-۱۳ بررسی مراحل داشبورد در چند نمونه ۴۳
فهرست منابع ۴۵
همکاران سیستم.(۱۳۹۱),همکاران سیستم “Retrieved from”
پناهیآذر، مریم.(۱۳۸۵)، ”دادهکاوی جهت مقاصد پیشبینی “، دانشگاه صنعتی شریف.
زرین، غ. (۱۳۸۸)”, جایگاه هوش تجاری در شهرداری الکترونیک, “دومین کنفرانس بین المللی شهرداری الکترونیک.
صنیعیآباده،دکتر محمد.دادهکاوی کاربردی، انتشارات انتشارات نیاز دانش،چاپ اول ۱۳۹۱٫
کلانتری، خلیل.پردازش و تحلیل دادهها در تحقیقات اجتماعی-اقتصادی، انتشارات فرهنگ مبنا، چاپ چهارم ۱۳۸۹٫
Yigitbasioglu, O.M. and Velcu, O. (2011),”A review of dashboards in performance management: Implications for design and research,” International Journal of Accounting Information Systems, Elsevier Inc.doi:10,1016/j.accinf.2011.08.002.
Mehmed Kantardzic,”Data Mining (Concepts, Models, Methods and Algorithms)”, University of Louisvilla. IEEE Press, ISBN 0-471-22852, 2003.
Wai-Ki Ching and Michael Kwok ,”Advances in Data Mining and Modeling“, University of Hong Kong , Jone, World Scientifc, ISBN 981-238-354-9,2005.
Attaway, N. M., & Bry, B. H. (2004). Parenting style and black adolescents’ academic Journal of Black Psychology, 30, 229–۲۴۷٫
در اواسط نیمهی دوم قرن بیستم گروهی از پژوهشگران آمریکایی دست به اقدام جالبی زدند. آنها کلیه اطلاعلاتی را که انسآنها تا قرن دوم میلادی از خورشید، گردش زمین، ماه، شب و روز و … داشتند بهصورتی قابل پردازش درآوردند و به شکل مجموعهای از دادههای عددی و سیمبلیک جهت کاوش آماده نمودند. با استفاده از روشهای دادهکاوی پس از حدود یک ماه خروجی الگوریتم بهصورت مجموعهای از روابط آماده شد. این روابط پس از تفسیر مجموعه قوانین حیرتانگیزی به شکل ذیل بهدست آورد:
شیءای که زمین نامیده شده گرد است.
شیء زمین به دور شیءای که خورشید نامیده شده میگردد.
شیءای که ماه نامیده شده به دور زمین میگردد.
این اقدام باعث شد که این پژوهشگران به نتیجه مهمی دست یابند: با استفاده از دادهکاوی میتوان به دانشی دست یافت که خود انسان قرنها بعد این دانش را کسب خواهد کرد.
در این مقاله با مقدمات علم دادهکاوی آشنا شده و سپس به تعاریف و دستهبندی داشبورد خواهیم پرداخت و در ادامه تحقیقات انجام شده تاکنون در زمینه دادهکاوی آموزشی و داشبورد و چند نمونه از مراحل طراحی داشبورد را مورد بررسی قرار خواهیم داد.
به شکل ۲-۱ توجه کنید. دراین شکل دو نمودار وجود دارد. نمودار اول (نمودار پایین شکل) نشاندهنده تعداد تحلیلگرها است، با توجه به نمودار مشخص است با گذشت زمان تعداد تحلیلگرها در مقایسه با رشد داده تقریبا ثابت است. نمودار دوم نشاندهندهی رشد داده در طی زمان میباشد، از روی نمودار میتوان مشاهده نمود که حجم داده با گذشت زمان در حال رشد انفجارگونه است. به تفاوت بین این دو نمودار (فضای خالی بین دو نمودار) شکاف دادهای[۱] بین دو نمودار گفته میشود. فاصلهای که بین این دو نمودار است نشان میدهد که به مرور زمان تعداد دادهها نسبت به تعداد افرادی که بتوانند این دادهها را تحلیل کنند مرتبا در حال افزایش است، پس نیاز به ابزار مکانیزهای برای تحلیل داده، روزبهروز در حال افزایش است. برای تبیین سرعت رشد دادهها، میتوان به نمونههای ذیل اشاره نمود:
مرکز ستارهشناسی VLBI دارای ۱۶ تلسکوپ بزرگ است که هر یک با سرعت ۱ گیگابیت بر ثانیه داده ستارهشناسی را برمبنای مشاهدات یک ماه ۲۵ روز تولید میکنند.
شرکت مخابراتی AT&T با میلیاردها تماس در روز سروکار دارد. چنین دادهی عظیمی را نمیتوان ذخیره نمود – تجزیه و تحلیل آن میبایست بهصورت برخط[۲] بر روی جریان داده باشد.
تیم جمعآوری وب کتابخانهی ملی آمریکا در ماه می ۲۰۰۸ اعلام نموده که کتابخانه بیش از۸۲٫۶ ترابایت داده گردآوری نموده است.
موسسهی com ادعا میکند که در حدود۶۰۰ ترابایت اطلاعات شجرهنامهای از دادههای سرشماری آمریکا طی سالهای ۱۷۹۰ الی ۱۹۳۰ جمعآوری نموده است.
در سال ۱۹۹۳ تمامی ترافیک اینترنت ۱۰۰ ترابایت برآورد نموده است (معادل با ۵ زتابایت درسال)
با توجه به مطالب مطرح شده، شاید بتوان اولین انگیزه کاوش داده را رشد روزافزون آن
دانست. در واقع رشد داده به حدی است که تنها در صورت وجود ابزار مکانیزه برای بررسی آن میتوان امیدوار به استفاده از آن بود. زیرا در غیر این صورت همزمان با تحلیل حجم کوچکی داده، حجم بسیار زیادی از همان داده در حال تولید شدن است که هرگز فرصتی برای کاوش آن وجود نخواهد داشت. به علاوه مشکلاتی دیگر که در ادامه اشاره شدهاند نیز وجود دارند:
معمولا دانشی که در دادهها وجود دارد خیلی بدیهی، روشن و واضح نیست.
تحلیل گران انسانی ممکن است هفتهها برای کشف اطلاعات باارزش از داده وقت صرف کنند و گاهی اوقات ممکن است با صرف زمان زیادی لزوما موفق هم نشوند.
گاهی اوقات با وجود امکان جمعآوری داده، این کار انجام نمیشود. دلیل عدم جمعآوری داده معمولا عدم وجود دانش برای جمعآوری آن است. اینکه داده سرمایه یک سازمان است خود دانشی مهم و باارزش است که همیشه وجود ندارد.
روش سنتی تبدیل دادهها به دانش، متکی به تجزیه، تحلیل و تفسیر دستی است. این تجزیه و تحلیلهای دستی مجموعههای دادهای، کند، گران و بسیار موضوعی است. در حقیقت با رشد نمایی حجم دادهها، این نوع تجزیه و تحلیلها در بسیاری از حوزهها غیر عملی است. هنگامی که مقیاس بهکارگیری دادهها و استدلال بر مبنای آنها فراتر از ظرفیتهای انسانی میرود، امید به کمک فناوری کامپیوتر میرود. مساله استخراج دانش از پایگاههای دادهای بزرگ شامل مراحل بسیاری از دستکاری، بازیابی و پیشپردازش دادهها تا استدلالات ریاضی، آماری، جستجو و استنتاج میباشد(Wai-Ki Ching&Michael Kwok,2005).
شاید بتوان مهمترین نقاط ضعف روشهای دادهکاوی را در سه مورد خلاصه نمود: وجود داده، صحت داده و کافی بودن ویژگیها. منظور از وجود دادهاین است که اصولا دادهای برای کاوش وجود داشته باشد و اینگونه نباشد که داده در محیط مورد کاوش استخراج و یا ثبت نشده باشد. متاسفانه این مشکل در بسیاری از محیطهای واقعی وجود دارد. صحت داده مبین آن است که داده جمعآوری شده صحیح بوده و نادرستی در آن وجود نداشته باشد. به عنوان مثال نباید جنسیت شخصی با نام «محسن» زن وارد شده باشد و یا اشتباه های دیگری که دلیل وجودی آنها خطا در ورود داده است، رخ دهد. کافی بودن ویژگیها بدین معنا است که ویژگیهای اخذ شده برای هر رکورد یا شیء برای یادگیری مدل و یا کشف نظم حاکم بر داده موثر، مناسب و کافی باشند. به عنوان مثال اگر هدف ما یادگیری یک مدل در دستهبندی کننده برای تشخیص بیماری دیابت در یک کلینیک است، ثبت ویژگی قندخون بسیار مهم است در حالی که وجود ویژگی میزان تحصیلات اهمیتی ندارد. توجه کنید چنان چه هر کدام از مشکلات سهگانه فوق در داده وجود داشته باشند هیچ یک از الگوریتمهای دادهکاوی، هر قدر هم که توانا باشند، نخواهند توانست نظم حاکم بر داده را تحت هیچ شرایطی بیابند.
[۱] Data Gap
[۲] online
تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.
ارسال نظر