تحقیق داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی

پیشینه تحقیق و پایان نامه و پروژه دانشجویی

پیشینه تحقیق داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی  دارای ۴۱ صفحه می باشد فایل پیشینه تحقیق به صورت ورد  word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود  آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

۲-۱- مقدمه    ۴
۲-۲- دادهکاوی    ۴
۲-۲-۱- خوشهبندی    ۵
۲-۲-۱-۱- روشهای خوشه‌بندی مبتنی بر تقسیمبندی    ۵
۲-۲-۱-۲- روشهای سلسله مراتبی    ۵
۲-۲-۱-۳- روشهای مبتنی بر چگالی    ۶
۲-۲-۲- طبقهبندی    ۶
۲-۲-۲-۱- طبقهبندی مبتنی بر قواعد    ۷
۲-۲-۳- کشف قواعد انجمنی    ۹
۲-۲-۳-۱- تعاریف و مفاهیم اصلی در قواعد انجمنی    ۹
۲-۲-۳-۱-۱- تقسیم بندی قواعد انجمنی    ۱۱
۲-۲-۳-۱-۲- استخراج قواعد تک‌سطحی تک بعدی دودویی    ۱۱
۲-۲-۳-۱-۲-۱- مرحله پیوست    ۱۳
۲-۲-۳-۱-۲-۲- مرحله هرس    ۱۴
۲-۲-۳-۱-۳- محاسبه اطمینان و استخراج قواعد نهایی    ۱۴
۲-۳- دادهکاوی توزیع شده    ۱۵
۲-۴- عاملها و سیستمهای چندعامله    ۱۶
۲-۴-۱- عامل    ۱۶
۲-۴-۱-۱- مقایسه عامل با شیء    ۱۷
۲-۴-۱-۲- معماری عاملها    ۲۰
۲-۴-۱-۲-۱-  معماری BDI    ۲۱
۲-۴-۲- سیستمهای چندعامله    ۲۳
۲-۴-۲-۱- مذاکره    ۲۵
۲-۵- بهرهگیری از عامل برای دادهکاوی    ۲۷
۲-۵-۱- سیستمهای چندعامله، بستری برای دادهکاوی توزیع شده    ۲۸
۲-۶- مروری بر کارهای انجام شده    ۳۰
۲-۶-۱- دادهکاوی توزیع شده    ۳۱
۲-۶-۲- کارهای مهم انجام شده در زمینه دادهکاوی با استفاده از عامل    ۳۴
منابع و مآخذ    ۳۶

منابع

[۱]     Wang J., Data mining: opportunities and challenges: Irm Press, 2003.

[۲]     Rao V.S., Vidyavathi S., “Distributed Data Mining and Mining Multi-Agent Data,” IJCSE) International Journal on Computer Science and Engineering, vol. 2, pp. 1237-1244, 2010.

[۳]     Chen M.S., Han J., Yu P.S., “Data mining: an overview from a database perspective,” Knowledge and Data Engineering, IEEE Transactions on, vol. 8, pp. 866-883, 1996.

[۴]     Han J., Kamber M., “Data mining: Concepts and Techniques, 2nd Edition,” San Francisco, CA, itd: Morgan Kaufmann, 2005.

[۵]     Grossman R., Kasif S., Moore R., Rocke D., Ullman J., “Data mining research: Opportunities and challenges,” presented at the A Report of Three Workshops on Mining Large, Massive and Distributed Data, 1999.

[۶]     Mitchell T.M., “Machine learning. 1997,” Burr Ridge, IL: McGraw Hill, 1997.

[۷]     Bing L., Wynne H., Yiming M., “Integrating classification and association rule mining,” in KDD, New York City, New York, USA., 1998, pp. 80-86.

[۸]     Bing L., Yiming M., Ching  Kian W., “Improving an association rule based classifier,” Principles of Data Mining and Knowledge Discovery, pp. 293-317, 2000.

[۹]     Kargupta H., Joshi A., Sivakumar K., Yesha Y., Data mining: Next generation challenges and future directions: AAAI Press, 2004.

[۱۰]   Weiss G., Multiagent systems: a modern approach to distributed artificial intelligence: The MIT press, 1999.

[۱۱]   Sycara K.P., “Multi-agent Systems,” AI magazine, Intelligent Agents, vol. 19, pp. 79-92, 1998.

[۱۲]   Chira C., “Software agents,” IDIMS Report, February, vol. 21, 2003.

[۱۳]   Odell J., “Agents: Technology and usage (Part 1),” Executive Report, vol. 3, 2000.

[۱۴]   Wooldridge M., Jennings N.R., “Intelligent agents: Theory and practice,” Knowledge engineering review, vol. 10, pp. 115-152, 1995.

[۱۵]   Wooldridge M., “Agent-based computing,” Interoperable Communication Networks, vol. 1, pp. 71-98, 1998.

[۱۶]   Jennings N.R., Norman T.J., Faratin P., “ADEPT: an agent-based approach to business process management,” ACM Sigmod Record, vol. 27, pp. 32-39, 1998.

[۱۷]   Etzioni O., Weld D.S., “Intelligent agents on the internet: Fact, fiction, and forecast,” IEEE expert, vol. 10, pp. 44-49, 1995.

[۱۸]   Horn E., Kupries M., Reinke T., “Properties and models of software agents and prefabrication for agent application systems,” 1999, p. 10 pp.

[۱۹]   Bradshaw J.M., “An introduction to software agents,” Software agents, vol. 5, pp. 3-46, 1997.

۲-۱ مقدمه

در این مقاله، به سه بخش اصلی با عناوین داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی می­پردازیم و در نهایت به بررسی کارهای انجام شده در این حوزه خواهیم پرداخت.

۲-۲- داده­کاوی

داده کاوی، یک تکنولوژی نوظهور است، که از ابزارها و تکنیک‌های مدل‌سازی و تجزیه و تحلیل آماری، الگوریتم‌های ریاضی، و متدهای یادگیری ماشین برای کشف الگوهای معتبر و ناشناخته در مجموعه داده‌های حجیم استفاده می‌کند. هرچند این تکنولوژی دوران نوباوگی خود را طی می‌کند، اما شرکت‌ها و سازمان‌های بسیاری از جمله خرده‌فروشی‌ها، بانک‌ها، مراکز درمانی، کارخانجات تولیدی، ارتباطات راه دور، و مؤسسات دولتی از ابزارها و تکنیک‌های داده‌کاوی برای تحلیل داده‌هایشان و کشف اطلاعات و دانش مفید از آن‌ها استفاده می‌کنند.[۱, ۲] داده‌کاوی اطلاعاتی را از پایگاه داده‌ها استخراج می‌کند که از طریق کوئری‌ها و گزارش‌گیری‌ها قابل دست‌یابی نیستند.

رشد انفجاری داده‌های ذخیره شده در پایگاه داده‌ها، نیاز به تکنولوژی‌های جدید که بتوانند حجم عظیم داده‌ها را هوشمندانه به دانش مفید تبدیل کنند، را پدید آورده است.[۳] داده­کاوی به معنای یافتن نیمه خودکار الگوهای پنهان در مجموعه داده­های[۱] موجود می‌باشد.[۴] این تکنولوژی با دیگر تکنیک‌های تحلیل داده، که سیستم، مقادیر اولیه را می‌گیرد و خود، الگوهایی را تولید می‌کند، متفاوت است. داده‌کاوی توسط ابزارهای الگوریتمیک، الگوها، تغییرات، آنومالی‌ها، قوانین، و ساختارهای مهم آماری، و رویدادها را از مجموعه داده‌های عظیم استخراج می‌کند.[۵] می‌توان گفت که داده کاوی در جهت کشف اطلاعات پنهان و روابط موجود در بین داده­های فعلی و پیش­بینی موارد نامعلوم و یا مشاهده نشده عمل می­کند. برای انجام عملیات کاوش لازم است قبلاً روی داده­های موجود پیش پردازش‌هایی انجام گیرد. عمل پیش پردازش اطلاعات خود از دو بخش کاهش اطلاعات، و خلاصه­سازی و کلی­سازی داده­ها تشکیل شده است. کاهش اطلاعات عبارت است از تولید یک مجموعه کوچک‌تر، از داده­های اولیه، که تحت عملیات داده­کاوی نتایج تقریباً یکسانی با نتایج داده­کاوی روی اطلاعات اولیه به دست دهد.[۴] پس از انجام عمل کاهش اطلاعات و حذف خصایص غیر مرتبط نوبت به خلاصه­سازی و کلی­سازی داده­ها می‌رسد. داده­های موجود در بانک‌های اطلاعاتی معمولاً حاوی اطلاعات در سطوح پایینی هستند، بنابراین خلاصه­سازی مجموعه بزرگی از داده­ها و ارائه آن به صورت یک مفهوم کلی اهمیت بسیار زیادی دارد. کلی­سازی اطلاعات، فرآیندی است که تعداد زیادی از رکوردهای یک بانک اطلاعاتی را به صورت مفهومی در سطح بالاتر ارائه می‌نماید. تکنیک‌‌های داده­کاوی به چند دسته تقسیم می­شوند که سه دسته اصلی عبارتند از خوشه­بندی[۲]، طبقه­بندی[۳] و کشف قواعد انجمنی[۴]. در ادامه هر یک از این روش‌ها را به طور کلی معرفی می­نماییم.

۲-۱- خوشه ­بندی

فرآیند خوشه­بندی سعی دارد که یک مجموعه داده را به چندین خوشه­ تقسیم نماید بطوریکه داده‌های قرار گرفته در یک خوشه با یکدیگر شبیه بوده و با داده­های خوشه­های دیگر متفاوت باشند. در حال حاضر روش‌های متعددی برای خوشه­بندی داده­ها وجود دارد که بر اساس نوع داده­ها، شکل خوشه­ها، فاصله داده­ها و غیره عمل خوشه­بندی را انجام می­دهند. مهم‌ترین روش‌های خوشه­بندی در زیر معرفی شده­اند:

۲-۲-۱-۱- روش‌های خوشه‌بندی مبتنی بر تقسیم‌بندی

این روش‌ها، داده­های موجود در یک مجموعه داده را به k خوشه تقسیم می­کنند، بطوریکه هر خوشه دو خصوصیت زیر را داراست:

هر خوشه یا گروه حداقل شامل یک داده می­باشد.

هر داده موجود در مجموعه داده دقیقاً به یک گروه یا خوشه تعلق دارد.

معیار اصلی در چنین مجموعه داده­هایی میزان شباهت داده­های قرار گرفته در هر خوشه می­باشد. در حالیکه داده‌های قرار گرفته در دو خوشه مختلف از نظر شباهت با یکدیگر فاصله زیادی دارند. مقدار k که به عنوان پارامتر استفاده می­گردد، هم می­تواند به صورت پویا تعیین گردد و هم اینکه قبل از شروع الگوریتم خوشه­بندی مقدار آن مشخص گردد.

۲-۲-۱-۲- روش‌های سلسله مراتبی[۵]

روش‌های سلسله مراتبی به دو دسته کلی روش‌های پایین به بالا[۶] و روش‌های بالا به پایین[۷] تقسیم می‌گردند. روش‌های سلسله مراتبی پایین به بالا به این صورت عمل می­کنند که در شروع هر کدام از داده­ها را در یک خوشه جداگانه قرار می­دهد و در طول اجرا سعی می­کند تا خوشه­هایی نزدیک به یکدیگر را با هم ادغام نماید. این عمل ادغام تا زمانی که یا تنها یک خوشه داشته باشیم و یا اینکه شرط خاتمه برقرار گردد، ادامه می­یابد. روش‌های بالا به پایین دقیقاً به طریق عکس عمل می­کنند، به این طریق که ابتدا تمام داده­ها را در یک خوشه­ قرار می­دهد و در هر تکرار از الگوریتم، هر خوشه به خوشه­های کوچک‌تر شکسته می­شود و این کار تا زمانی ادامه می­یابد که یا هر کدام از خوشه­ها تنها شامل یک داده باشند و یا شرط خاتمه الگوریتم برقرار گردد. شرط خاتمه معمولاً تعداد کلاستر یا خوشه می­باشد.

۲-۲-۱-۳- روش‌های مبتنی بر چگالی[۸]

اکثر روش‌های خوشه­بندی که به این روش عمل می­کنند معمولاً از تابع فاصله به عنوان تابع معیار خود بهره می­برند. استفاده از چنین معیاری باعث می­گردد که الگوریتم خوشه­بندی تنها قادر به ایجاد خوشه­هایی با اشکال منظم باشد. در صورتیکه خوشه­های واقعی در داده­ها دارای اشکال غیر منظمی باشند، این الگوریتم­ها در خوشه­بندی آن‌ها با مشکل مواجه می­گردند. برای حل این‌گونه مشکلات یکسری از روش‌ها برای خوشه­بندی پیشنهاد گردیده­اند که عمل خوشه­بندی را بر مبنای چگالی داده­ ها انجام می‌دهند. ایده‌ی اصلی در این روش‌ها بر این اساس است که تا زمانی که داده­های قرار گرفته در همسایگی خوشه‌ها از حد معینی بیشتر باشند، آن‌ها رشد می­کنند و بزرگ می­شوند. چنین روش‌هایی قادرند خوشه­هایی با شکل‌های نامنظم نیز ایجاد نمایند.

البته دسته‌های دیگری از روش‌های خوشه­بندی مانند روش‌های مبتنی بر گرید، روش‌های مبتنی بر مدل و غیره وجود دارند که می­توانید آن‌ها را در [۴] مطالعه نمایید.

۲-۲-۲- طبقه ­بندی

فرایند طبقه­بندی در واقع نوعی یادگیری با ناظر می­باشد که در طی دو مرحله انجام می­گردد. در مرحله اول مجموعه­ای از داده­ها که در آن هر داده شامل تعدادی خصوصیت دارای مقدار و یک خصوصیت بنام خصوصیت کلاس می­باشد، برای ایجاد یک مدل داده بکار می­روند که این مدل داده در واقع توصیف کننده مفهوم و خصوصیات آن مجموعه داده­ها است. مرحله دوم فرآیند طبقه­بندی، اعمال یا بکارگیری مدل ایجاد شده، بر روی داده‌هایی است که شامل تمام خصوصیات داده­هایی که برای ایجاد مدل بکار گرفته­ شده­اند، می­باشند، بجز خصوصیت کلاس، و هدف از عمل طبقه­بندی نیز تخمین مقدار این خصوصیت می­باشد.

الگوریتم­ها و روش‌های مختلفی برای طبقه­بندی تاکنون پیشنهاد شده­اند که برای مثال می­توان از روش‌های طبقه­بندی با استفاده از درخت تصمیم، طبقه­بندی بیزین، [۹]SVM، طبقه­بندی با استفاده از شبکه‌های عصبی، طبقه­بندی مبتنی بر قواعد و غیره نام برد.[۶] در اینجا ما قصد نداریم وارد مباحث مربوط به الگوریتم­ها و روش‌های طبقه­بندی شویم و تنها روش طبقه­بندی مبتنی بر قواعد را معرفی خواهیم نمود. در صورت نیاز به مطالعه بیشتر می­توانید به مرجع [۴] مراجعه نمایید.

۲-۲-۲-۱- طبقه ­بندی مبتنی بر قواعد

در این قسمت قصد داریم نگاهی به بحث طبقه­بندی مبتنی بر قواعد داشته باشیم. در این روش، مدل ایجاد شده از روی داده­ها به صورت مجموعه­ای از قواعد می­باشد. می­توان گفت که هر قاعده به صورت یک قاعده IF P THEN C می­باشد که در آن P مجموعه­ای از شرایط بوده و C نیز مشخص کننده برچسب یک کلاس یا طبقه­ خاص می­باشد. یک قاعده بدست آمده از مجموعه داده­های آموزشی با استفاده از دو معیار coverage و accuracy می­تواند ارزیابی گردد.

که در تعاریف مذکور  تعداد داده­هایی در مجموعه داده D است که توسط قاعده پوشش داده می­شوند.  تعداد داده­هایی است که توسط قاعده به درستی طبقه­بندی شده­اند. |D| تعداد داده‌های موجود در D می­باشد.

نکته مهمی که باید اینجا به آن اشاره کرد این بحث است که چگونه داده­ها توسط این قواعد طبقه‌بندی می­گردند. همان‌طور که اشاره گردید این قواعد دارای یک قسمت شرط (P) و یک قسمت C هستند. P یک الگو به صورت  می­باشد که هر کدام از piها بیان کننده‌ی یک محدودیت برای یکی از خصوصیات هستند. اگر خصوصیات داده­ای محدودیت­های مذکور قاعده­ای را برآورده سازد آنگاه کلاس یا طبقه­بند آن داده، کلاس یا طبقه­ای است که آن قاعده بیان می­کند(C). اما مسأله مهمی که اینجا پیش می­آید، این است که اگر یک داده در قسمت شرط (P) بیش از یک قاعده صدق کند، آنگاه کدام قاعده را باید انتخاب کرد. بسته به استراتژی­های مختلف، این مشکل جواب‌های مختلفی می‌تواند داشته باشد. دو نمونه از مهم‌ترین استراتژی­هایی که معمولاً برای حل این مشکل بکار می­روند، استراتژی‌های مرتب‌سازی بر اساس اندازه[۱] و مرتب‌سازی بر اساس قاعده[۲] می­باشند.

در استراتژی مرتب‌سازی بر اساس اندازه، چنانچه یک داده در بیش از یک قاعده صدق کند، قاعده‌ای برای طبقه­بندی داده انتخاب می­شود که خصوصیات بیشتری را برای مشخص نمودن کلاس داده تست کرده باشد. در استراتژی مرتب‌سازی بر اساس قاعده، پیش قواعد اولویت دهی می­شوند و هنگام طبقه­بندی، قاعده با اولویت بالاتر، مشخص کننده کلاس داده خواهد بود. اولویت‌دهی به قواعد هم به طرق مختلفی ممکن است انجام گردد. برای مثال ممکن است که ابتدا کلاس‌ها اولویت­دهی شوند و قواعد مربوط به هر کلاس نیز با تأثیر پذیری از این اولویت‌دهی، اولویت بگیرند. اولویت کلاس‌ها نیز ممکن است بر اساس اهمیت کلاس یا تعداد داده­های متعلق به آن کلاس و یا غیره مشخص گردند. استراتژی­های دیگری نیز در این زمینه وجود دارند که ما در اینجا درباره آن‌ها صحبت نمی­کنیم. مسأله دیگری که ممکن است پیش بیاید این است که یک داده با هیچ‌کدام از قواعد هم‌خوانی نداشته باشد. برای این مسأله هم می­توان راه­حل‌هایی ارائه نمود. معمول­ترین راه­حل این است که چنانچه داده­ای با هیچ‌یک از قواعد هم‌خوانی نداشت، کلاسی به عنوان کلاس آن داده انتخاب گردد که بیشترین تعداد داده در بین داده­ها به آن کلاس تعلق دارد.

[۱] Size ordering

[۲] Rule ordering

[۱]Dataset

[۲] Clustering

[۳] Classification

[۴] Association rule mining

[۵] Hierarchical Clustering Algorithms

[۶] bottom-up

[۷] top-down

[۸] Density-Based Clustering

[۹] Support vector machine

50,000 ریال – خرید

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ  را پرداخت نمایید. 

مطالب پیشنهادی:
  • تحقیق داده‌کاوی و خوشه بندی و روش های آن و الگوریتم خوشه بندی
  • پیشینه تحقیق کاربرد داده‌کاوی در مدیریت دانش مشتری
  • برچسب ها : , , , , , , , , , , ,
    برای ثبت نظر خود کلیک کنید ...

    به راهنمایی نیاز دارید؟ کلیک کنید

    جستجو پیشرفته

    دسته‌ها

    آخرین بروز رسانی

      سه شنبه, ۴ اردیبهشت , ۱۴۰۳
    اولین پایگاه اینترنتی اشتراک و فروش فایلهای دیجیتال ایران
    wpdesign Group طراحی و پشتیبانی سایت توسط digitaliran.ir صورت گرفته است
    تمامی حقوق برایpayandaneshjo.irمحفوظ می باشد.