تحقیق تکنیک های طبقه بندی داده کاوی و مروری بر تحقیقات شناسایی الگوهای طراحی از کد منبع

پیشینه تحقیق و پایان نامه و پروژه دانشجویی

پیشینه تحقیق تکنیک های طبقه بندی داده کاوی و مروری بر تحقیقات شناسایی الگوهای طراحی از کد منبع دارای ۱۵ صفحه می باشد فایل پیشینه تحقیق به صورت ورد  word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود  آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

۲-۱-مقدمه    ۴
۲-۲- تکنیک های طبقه بندی    ۴
۲-۲-۱-   طبقه بند C5.0    ۵
۲-۲-۲-  طبقه بند SVM    ۵
۲-۲-۳-  طبقه بند  BOOSTED C5.0    ۵
۲-۴-معیارهای  ارزیابی کارایی    ۵
۲-۵-مروری بر تحقیقات پیشین    ۸
کارهای مرتبط    ۸
فهرست منابع و مآخذ    ۱۴

منابع

[] Z. Balanyi and R. Ferenc. Mining Design Patterns from C++ Source Code. In Proceedings of the 19th International Conference on Software Maintenance (ICSM 2003), pages 305–۳۱۴٫ IEEE Computer Society, Sept. 2003.

[] R. Ferenc, ´A. Besz´edes, L. Fulop, and J. Lele. Design pattern mining enhanced by machine learning. In ICSM, pages 295–۳۰۴, ۲۰۰۵٫

[] N. Shi and R. A. Olsson, “Reverse engineering of design patterns from java source code,” in ASE’۰۶٫ Washington, USA: IEEE Computer Society, 2006, pp. 123–۱۳۴٫

[] N. Tsantalis, A. Chatzigeorgiou, G. Stephanides, and S. T. Halkidis, “Design pattern detection using similarity scoring,” IEEE TSE, vol. 32, no. 11, pp. 896–۹۰۹, ۲۰۰۶٫

[] G. Antoniol, R. Fiutem, and L. Cristoforetti. Using Metrics to Identify Design Patterns in Object-Oriented Software. In Proceedings of the Fifth International Symposium on Software Metrics (METRICS98), pages 23–۳۴٫ IEEE Computer Society, Nov. 1998.

[] M. Zanoni. MARPLE: discovering structured groups of classes for design pattern detection. Master’s thesis, Università degli studi di Milano-Bicocca, Milano, Italy, July 2008.

[] M. Zanoni. Data mining techniques for design pattern detection. PhD’s thesis, Università degli Studi di Milano Bicocca,  ۲۰۱۲٫

[] S. Uchiyama, H. Washizaki, Y.  Fukazawa and A.  Kubo,  Design Pattern Detection using Software Metrics and Machine Learning.

[]A. Binun and G. Kniesel. Joining Forces for Higher Precision and Recall of Design Pattern Detection, in proceeding of the 16th conference on software maintenance and reengineering (CSMR2012), March 27-30, Washington, DC, USA, 2012. IEEE Computer society.

[] Clementine 12, copyright(c) integral solutions ltd, help-modeling nodes, (1994-2007)

[] J. Han, M. Kamber and J. Pei, Data Mining third edition: concepts and techniques, M. Kaufmann pub, 2011.

[] S. Alhusain, S. Coupland, R. John AND M. Kavanagh. Towards Machine Learning Based Design Pattern Recognition. Computational intellingent, (UKCI) 2013.

[] Y. Freund AND R.E. Schapire. A Short Introduction to Boosting, Proc. Journal of Japanese Society for Artificial Intelligence, 14(5):771-780, September, 1999.

۲-۱-مقدمه

   دراین مقاله مختصری بروی مفاهیم و تعاریف اولیه­ روش­های داده ­کاوی و معیارهای ارزیابی مدل­های پیش بینی کننده خواهیم داشت.

۲-۲- تکنیک های طبقه بندی[۱]

در داده­کاوی با دو مجموعه داده مواجه هستیم، داده­ آموزشی و داده آزمایشی. صفات داده­ آموزشی را مجموعه معیارهایی تشکیل می­دهند که هویت موجودیت­های قرارگرفته درر­کورد­ها را پیشگویی می­کنند. موجودیت­های داده­ی آموزشی، مشاهداتی هستند که از قبل هویت­شان شناسایی شده­ است. داده­ی آموزشی حاوی یک ستون پیش­گویی است. مقادیر این ستون، با برچسب­هایی پر می­شوند که هویت اصلی موجودیت­ها را نشان می­دهد (مثلا درست یا غلط). داده­ آزمایشی حاوی مشاهداتی است که هویت اصلیشان شناخته شده نیست. با تجزیه ­و­ تحلیلی که به واسطه­ الگوریتم­های داده­کاوی روی داده­ی آموزشی صورت می­گیرد مدل­هایی ساخته می­شود. مدل­سازی، دانش موجود در مشاهدات داده­ آموزشی را در قالب یک سری قوانین استخراج می­کند. داده­ آزمایشی برای ارزیابی دقت پیش­گویی مدل ساخته شده روی داده­ آموزشی بکار برده میشود. در واقع پیشگویی یک فرایند دو مرحله­ای دارد، فاز یادگیری و فاز دسته­بندی.

‌‌‌در فاز یادگیری بر اساس مجموعه داده­ی آموزشی، مدل طبقه­بند ساخته می­شود و در فاز طبقه­بندی بر اساس مدل ساخته شده در فاز قبل، مجموعه داده­ جدید که در فاز یادگیری استفاده نشده است (مجموعه داده آزمایشی) دسته­بندی می­شود (پیش­گویی می­شود که مشاهدات جدید چه برچسبی به خود بگیرند). جهت خودکار سازی  عملگر تصحیح برچسب در این تحقیق، از روش­های داده ­کاوی (الگوریتم­های  طبقه بندی) استفاده شده است [۱۷].

دقت مدل، درصد نمونه­ هایی از مجموعه داده آزمایش است که به درستی طبقه بندی شده­اند. مجموعه داده  لازم جهت ساخت مدل طبقه بندی، از متغیر­های مستقل و وابسته تشکیل شده است. متغیر­های مستقل همان خصیصه­ ها هستند که جهت طبقه بندی متغیر وابسته که در واقع بر چسب کلاس­ها می باشد، مورد استفاده قرار می­گیرند [۱۷]. توضیح مختصری در مورد انواع طبقه ­بندی­هایی که در این تحقیق مورد استفاده قرار گرفته اند در ادامه آمده است.

۲-۲-۱-   طبقه بند C5.0

این طبقه بند در واقع براساس تقسیم  مبتنی بر نمونه روی فیلدی که بیشترین سود اطلاعاتی را با خود دارد، کار می­کند. سپس هر زیرنمونه تعریف شده با اولین تقسیم، دوباره تقسیم می­شود (معمولا بر اساس یک فیلد متفاوت). این فرایند تکرار می­شود تا اینکه هیچ زیرنمونه قابل تقسیم نداشته باشیم. سرانجام پایین ترین سطح تقسیم ها دوباره بررسی می شوند. آنهایی که تاثیر قابل توجهی بر مقدار مدل ندارند حذف یا هرس می­شوند  [۱۶].

۲-۲-۲-  طبقه بند SVM

یک طبقه بند و الگوریتم رگرسیون است که از تئوری یادگیری ماشین با حداکثر دقت پیش بینی بدون” اُور فیتینگ[۲] ” داده ها استفاده می­کند. این روش از یک تبدیل غیر خطی بر داده های یادگیری استفاده می­کند، و با جستجوی برای تساوی های رگرسیون در داده­های تبدیل شده کلاس­ها (اهداف) را جدا می­کنند.SVM  خصوصا برای آنالیز داده­ها با تعداد زیادی از فیلد­های پیش گویی کننده مناسب می­باشد [۱۶].

۲-۲-۳-  طبقه بند  BOOSTED C5.0

یک الگوریتم داده­ کاوی است که برای کاهش خطای الگوریتم­های یادگیری  ضعیف (به آرامی به سمت طبقه بندی صحیح میل می­کنند) مورد استفاده قرار می­گیرد و آنها را به یک الگوریتم یادگیری قوی تبدیل می­کند. در این کار برای قدرت بیشتر بخشیدن به الگوریتم تصمیم گیری  C5.0 استفاده شده است [۲۷].

[۱] classification

[۲] Over fitting generally occurs when a model is excessively complex, such as having too many parameters relative to the number of observations.

[۳] Confusion matrix

50,000 ریال – خرید

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ  را پرداخت نمایید.

مطالب پیشنهادی:
  • تحقیق داده کاوی و تکنیک ها و روشهای آن
  • تحقیق داده کاوی و مراحل فرآیند و دسته بندی الگوریتم های آن
  • تحقیق مروری بر روشهای داده کاوی
  • تحقیق نظریه کارایی بازار سرمایه و کاربرد داده کاوی و شبکه عصبی در پیش بینی قیمت سهام
  • تحقیق داده کاوی و مدلها و الگوریتمهای آن و ساختن مدل تقلب و سیستم تشخیص نفوذ
  • برچسب ها : , , , , , , , , , , ,
    برای ثبت نظر خود کلیک کنید ...

    به راهنمایی نیاز دارید؟ کلیک کنید

    جستجو پیشرفته

    دسته‌ها

    آخرین بروز رسانی

      جمعه, ۳۱ فروردین , ۱۴۰۳
    اولین پایگاه اینترنتی اشتراک و فروش فایلهای دیجیتال ایران
    wpdesign Group طراحی و پشتیبانی سایت توسط digitaliran.ir صورت گرفته است
    تمامی حقوق برایpayandaneshjo.irمحفوظ می باشد.