پیشینه تحقیق دادهکاوی، عاملها و سیستمهای چند عامله، و کاربرد عاملها در دادهکاوی دارای ۴۱ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.
۲-۱- مقدمه ۴
۲-۲- دادهکاوی ۴
۲-۲-۱- خوشهبندی ۵
۲-۲-۱-۱- روشهای خوشهبندی مبتنی بر تقسیمبندی ۵
۲-۲-۱-۲- روشهای سلسله مراتبی ۵
۲-۲-۱-۳- روشهای مبتنی بر چگالی ۶
۲-۲-۲- طبقهبندی ۶
۲-۲-۲-۱- طبقهبندی مبتنی بر قواعد ۷
۲-۲-۳- کشف قواعد انجمنی ۹
۲-۲-۳-۱- تعاریف و مفاهیم اصلی در قواعد انجمنی ۹
۲-۲-۳-۱-۱- تقسیم بندی قواعد انجمنی ۱۱
۲-۲-۳-۱-۲- استخراج قواعد تکسطحی تک بعدی دودویی ۱۱
۲-۲-۳-۱-۲-۱- مرحله پیوست ۱۳
۲-۲-۳-۱-۲-۲- مرحله هرس ۱۴
۲-۲-۳-۱-۳- محاسبه اطمینان و استخراج قواعد نهایی ۱۴
۲-۳- دادهکاوی توزیع شده ۱۵
۲-۴- عاملها و سیستمهای چندعامله ۱۶
۲-۴-۱- عامل ۱۶
۲-۴-۱-۱- مقایسه عامل با شیء ۱۷
۲-۴-۱-۲- معماری عاملها ۲۰
۲-۴-۱-۲-۱- معماری BDI ۲۱
۲-۴-۲- سیستمهای چندعامله ۲۳
۲-۴-۲-۱- مذاکره ۲۵
۲-۵- بهرهگیری از عامل برای دادهکاوی ۲۷
۲-۵-۱- سیستمهای چندعامله، بستری برای دادهکاوی توزیع شده ۲۸
۲-۶- مروری بر کارهای انجام شده ۳۰
۲-۶-۱- دادهکاوی توزیع شده ۳۱
۲-۶-۲- کارهای مهم انجام شده در زمینه دادهکاوی با استفاده از عامل ۳۴
منابع و مآخذ ۳۶
[۱] Wang J., Data mining: opportunities and challenges: Irm Press, 2003.
[۲] Rao V.S., Vidyavathi S., “Distributed Data Mining and Mining Multi-Agent Data,” IJCSE) International Journal on Computer Science and Engineering, vol. 2, pp. 1237-1244, 2010.
[۳] Chen M.S., Han J., Yu P.S., “Data mining: an overview from a database perspective,” Knowledge and Data Engineering, IEEE Transactions on, vol. 8, pp. 866-883, 1996.
[۴] Han J., Kamber M., “Data mining: Concepts and Techniques, 2nd Edition,” San Francisco, CA, itd: Morgan Kaufmann, 2005.
[۵] Grossman R., Kasif S., Moore R., Rocke D., Ullman J., “Data mining research: Opportunities and challenges,” presented at the A Report of Three Workshops on Mining Large, Massive and Distributed Data, 1999.
[۶] Mitchell T.M., “Machine learning. 1997,” Burr Ridge, IL: McGraw Hill, 1997.
[۷] Bing L., Wynne H., Yiming M., “Integrating classification and association rule mining,” in KDD, New York City, New York, USA., 1998, pp. 80-86.
[۸] Bing L., Yiming M., Ching Kian W., “Improving an association rule based classifier,” Principles of Data Mining and Knowledge Discovery, pp. 293-317, 2000.
[۹] Kargupta H., Joshi A., Sivakumar K., Yesha Y., Data mining: Next generation challenges and future directions: AAAI Press, 2004.
[۱۰] Weiss G., Multiagent systems: a modern approach to distributed artificial intelligence: The MIT press, 1999.
[۱۱] Sycara K.P., “Multi-agent Systems,” AI magazine, Intelligent Agents, vol. 19, pp. 79-92, 1998.
[۱۲] Chira C., “Software agents,” IDIMS Report, February, vol. 21, 2003.
[۱۳] Odell J., “Agents: Technology and usage (Part 1),” Executive Report, vol. 3, 2000.
[۱۴] Wooldridge M., Jennings N.R., “Intelligent agents: Theory and practice,” Knowledge engineering review, vol. 10, pp. 115-152, 1995.
[۱۵] Wooldridge M., “Agent-based computing,” Interoperable Communication Networks, vol. 1, pp. 71-98, 1998.
[۱۶] Jennings N.R., Norman T.J., Faratin P., “ADEPT: an agent-based approach to business process management,” ACM Sigmod Record, vol. 27, pp. 32-39, 1998.
[۱۷] Etzioni O., Weld D.S., “Intelligent agents on the internet: Fact, fiction, and forecast,” IEEE expert, vol. 10, pp. 44-49, 1995.
[۱۸] Horn E., Kupries M., Reinke T., “Properties and models of software agents and prefabrication for agent application systems,” 1999, p. 10 pp.
[۱۹] Bradshaw J.M., “An introduction to software agents,” Software agents, vol. 5, pp. 3-46, 1997.
در این مقاله، به سه بخش اصلی با عناوین دادهکاوی، عاملها و سیستمهای چند عامله، و کاربرد عاملها در دادهکاوی میپردازیم و در نهایت به بررسی کارهای انجام شده در این حوزه خواهیم پرداخت.
داده کاوی، یک تکنولوژی نوظهور است، که از ابزارها و تکنیکهای مدلسازی و تجزیه و تحلیل آماری، الگوریتمهای ریاضی، و متدهای یادگیری ماشین برای کشف الگوهای معتبر و ناشناخته در مجموعه دادههای حجیم استفاده میکند. هرچند این تکنولوژی دوران نوباوگی خود را طی میکند، اما شرکتها و سازمانهای بسیاری از جمله خردهفروشیها، بانکها، مراکز درمانی، کارخانجات تولیدی، ارتباطات راه دور، و مؤسسات دولتی از ابزارها و تکنیکهای دادهکاوی برای تحلیل دادههایشان و کشف اطلاعات و دانش مفید از آنها استفاده میکنند.[۱, ۲] دادهکاوی اطلاعاتی را از پایگاه دادهها استخراج میکند که از طریق کوئریها و گزارشگیریها قابل دستیابی نیستند.
رشد انفجاری دادههای ذخیره شده در پایگاه دادهها، نیاز به تکنولوژیهای جدید که بتوانند حجم عظیم دادهها را هوشمندانه به دانش مفید تبدیل کنند، را پدید آورده است.[۳] دادهکاوی به معنای یافتن نیمه خودکار الگوهای پنهان در مجموعه دادههای[۱] موجود میباشد.[۴] این تکنولوژی با دیگر تکنیکهای تحلیل داده، که سیستم، مقادیر اولیه را میگیرد و خود، الگوهایی را تولید میکند، متفاوت است. دادهکاوی توسط ابزارهای الگوریتمیک، الگوها، تغییرات، آنومالیها، قوانین، و ساختارهای مهم آماری، و رویدادها را از مجموعه دادههای عظیم استخراج میکند.[۵] میتوان گفت که داده کاوی در جهت کشف اطلاعات پنهان و روابط موجود در بین دادههای فعلی و پیشبینی موارد نامعلوم و یا مشاهده نشده عمل میکند. برای انجام عملیات کاوش لازم است قبلاً روی دادههای موجود پیش پردازشهایی انجام گیرد. عمل پیش پردازش اطلاعات خود از دو بخش کاهش اطلاعات، و خلاصهسازی و کلیسازی دادهها تشکیل شده است. کاهش اطلاعات عبارت است از تولید یک مجموعه کوچکتر، از دادههای اولیه، که تحت عملیات دادهکاوی نتایج تقریباً یکسانی با نتایج دادهکاوی روی اطلاعات اولیه به دست دهد.[۴] پس از انجام عمل کاهش اطلاعات و حذف خصایص غیر مرتبط نوبت به خلاصهسازی و کلیسازی دادهها میرسد. دادههای موجود در بانکهای اطلاعاتی معمولاً حاوی اطلاعات در سطوح پایینی هستند، بنابراین خلاصهسازی مجموعه بزرگی از دادهها و ارائه آن به صورت یک مفهوم کلی اهمیت بسیار زیادی دارد. کلیسازی اطلاعات، فرآیندی است که تعداد زیادی از رکوردهای یک بانک اطلاعاتی را به صورت مفهومی در سطح بالاتر ارائه مینماید. تکنیکهای دادهکاوی به چند دسته تقسیم میشوند که سه دسته اصلی عبارتند از خوشهبندی[۲]، طبقهبندی[۳] و کشف قواعد انجمنی[۴]. در ادامه هر یک از این روشها را به طور کلی معرفی مینماییم.
فرآیند خوشهبندی سعی دارد که یک مجموعه داده را به چندین خوشه تقسیم نماید بطوریکه دادههای قرار گرفته در یک خوشه با یکدیگر شبیه بوده و با دادههای خوشههای دیگر متفاوت باشند. در حال حاضر روشهای متعددی برای خوشهبندی دادهها وجود دارد که بر اساس نوع دادهها، شکل خوشهها، فاصله دادهها و غیره عمل خوشهبندی را انجام میدهند. مهمترین روشهای خوشهبندی در زیر معرفی شدهاند:
این روشها، دادههای موجود در یک مجموعه داده را به k خوشه تقسیم میکنند، بطوریکه هر خوشه دو خصوصیت زیر را داراست:
هر خوشه یا گروه حداقل شامل یک داده میباشد.
هر داده موجود در مجموعه داده دقیقاً به یک گروه یا خوشه تعلق دارد.
معیار اصلی در چنین مجموعه دادههایی میزان شباهت دادههای قرار گرفته در هر خوشه میباشد. در حالیکه دادههای قرار گرفته در دو خوشه مختلف از نظر شباهت با یکدیگر فاصله زیادی دارند. مقدار k که به عنوان پارامتر استفاده میگردد، هم میتواند به صورت پویا تعیین گردد و هم اینکه قبل از شروع الگوریتم خوشهبندی مقدار آن مشخص گردد.
روشهای سلسله مراتبی به دو دسته کلی روشهای پایین به بالا[۶] و روشهای بالا به پایین[۷] تقسیم میگردند. روشهای سلسله مراتبی پایین به بالا به این صورت عمل میکنند که در شروع هر کدام از دادهها را در یک خوشه جداگانه قرار میدهد و در طول اجرا سعی میکند تا خوشههایی نزدیک به یکدیگر را با هم ادغام نماید. این عمل ادغام تا زمانی که یا تنها یک خوشه داشته باشیم و یا اینکه شرط خاتمه برقرار گردد، ادامه مییابد. روشهای بالا به پایین دقیقاً به طریق عکس عمل میکنند، به این طریق که ابتدا تمام دادهها را در یک خوشه قرار میدهد و در هر تکرار از الگوریتم، هر خوشه به خوشههای کوچکتر شکسته میشود و این کار تا زمانی ادامه مییابد که یا هر کدام از خوشهها تنها شامل یک داده باشند و یا شرط خاتمه الگوریتم برقرار گردد. شرط خاتمه معمولاً تعداد کلاستر یا خوشه میباشد.
اکثر روشهای خوشهبندی که به این روش عمل میکنند معمولاً از تابع فاصله به عنوان تابع معیار خود بهره میبرند. استفاده از چنین معیاری باعث میگردد که الگوریتم خوشهبندی تنها قادر به ایجاد خوشههایی با اشکال منظم باشد. در صورتیکه خوشههای واقعی در دادهها دارای اشکال غیر منظمی باشند، این الگوریتمها در خوشهبندی آنها با مشکل مواجه میگردند. برای حل اینگونه مشکلات یکسری از روشها برای خوشهبندی پیشنهاد گردیدهاند که عمل خوشهبندی را بر مبنای چگالی داده ها انجام میدهند. ایدهی اصلی در این روشها بر این اساس است که تا زمانی که دادههای قرار گرفته در همسایگی خوشهها از حد معینی بیشتر باشند، آنها رشد میکنند و بزرگ میشوند. چنین روشهایی قادرند خوشههایی با شکلهای نامنظم نیز ایجاد نمایند.
البته دستههای دیگری از روشهای خوشهبندی مانند روشهای مبتنی بر گرید، روشهای مبتنی بر مدل و غیره وجود دارند که میتوانید آنها را در [۴] مطالعه نمایید.
فرایند طبقهبندی در واقع نوعی یادگیری با ناظر میباشد که در طی دو مرحله انجام میگردد. در مرحله اول مجموعهای از دادهها که در آن هر داده شامل تعدادی خصوصیت دارای مقدار و یک خصوصیت بنام خصوصیت کلاس میباشد، برای ایجاد یک مدل داده بکار میروند که این مدل داده در واقع توصیف کننده مفهوم و خصوصیات آن مجموعه دادهها است. مرحله دوم فرآیند طبقهبندی، اعمال یا بکارگیری مدل ایجاد شده، بر روی دادههایی است که شامل تمام خصوصیات دادههایی که برای ایجاد مدل بکار گرفته شدهاند، میباشند، بجز خصوصیت کلاس، و هدف از عمل طبقهبندی نیز تخمین مقدار این خصوصیت میباشد.
الگوریتمها و روشهای مختلفی برای طبقهبندی تاکنون پیشنهاد شدهاند که برای مثال میتوان از روشهای طبقهبندی با استفاده از درخت تصمیم، طبقهبندی بیزین، [۹]SVM، طبقهبندی با استفاده از شبکههای عصبی، طبقهبندی مبتنی بر قواعد و غیره نام برد.[۶] در اینجا ما قصد نداریم وارد مباحث مربوط به الگوریتمها و روشهای طبقهبندی شویم و تنها روش طبقهبندی مبتنی بر قواعد را معرفی خواهیم نمود. در صورت نیاز به مطالعه بیشتر میتوانید به مرجع [۴] مراجعه نمایید.
در این قسمت قصد داریم نگاهی به بحث طبقهبندی مبتنی بر قواعد داشته باشیم. در این روش، مدل ایجاد شده از روی دادهها به صورت مجموعهای از قواعد میباشد. میتوان گفت که هر قاعده به صورت یک قاعده IF P THEN C میباشد که در آن P مجموعهای از شرایط بوده و C نیز مشخص کننده برچسب یک کلاس یا طبقه خاص میباشد. یک قاعده بدست آمده از مجموعه دادههای آموزشی با استفاده از دو معیار coverage و accuracy میتواند ارزیابی گردد.
که در تعاریف مذکور تعداد دادههایی در مجموعه داده D است که توسط قاعده پوشش داده میشوند. تعداد دادههایی است که توسط قاعده به درستی طبقهبندی شدهاند. |D| تعداد دادههای موجود در D میباشد.
نکته مهمی که باید اینجا به آن اشاره کرد این بحث است که چگونه دادهها توسط این قواعد طبقهبندی میگردند. همانطور که اشاره گردید این قواعد دارای یک قسمت شرط (P) و یک قسمت C هستند. P یک الگو به صورت میباشد که هر کدام از piها بیان کنندهی یک محدودیت برای یکی از خصوصیات هستند. اگر خصوصیات دادهای محدودیتهای مذکور قاعدهای را برآورده سازد آنگاه کلاس یا طبقهبند آن داده، کلاس یا طبقهای است که آن قاعده بیان میکند(C). اما مسأله مهمی که اینجا پیش میآید، این است که اگر یک داده در قسمت شرط (P) بیش از یک قاعده صدق کند، آنگاه کدام قاعده را باید انتخاب کرد. بسته به استراتژیهای مختلف، این مشکل جوابهای مختلفی میتواند داشته باشد. دو نمونه از مهمترین استراتژیهایی که معمولاً برای حل این مشکل بکار میروند، استراتژیهای مرتبسازی بر اساس اندازه[۱] و مرتبسازی بر اساس قاعده[۲] میباشند.
در استراتژی مرتبسازی بر اساس اندازه، چنانچه یک داده در بیش از یک قاعده صدق کند، قاعدهای برای طبقهبندی داده انتخاب میشود که خصوصیات بیشتری را برای مشخص نمودن کلاس داده تست کرده باشد. در استراتژی مرتبسازی بر اساس قاعده، پیش قواعد اولویت دهی میشوند و هنگام طبقهبندی، قاعده با اولویت بالاتر، مشخص کننده کلاس داده خواهد بود. اولویتدهی به قواعد هم به طرق مختلفی ممکن است انجام گردد. برای مثال ممکن است که ابتدا کلاسها اولویتدهی شوند و قواعد مربوط به هر کلاس نیز با تأثیر پذیری از این اولویتدهی، اولویت بگیرند. اولویت کلاسها نیز ممکن است بر اساس اهمیت کلاس یا تعداد دادههای متعلق به آن کلاس و یا غیره مشخص گردند. استراتژیهای دیگری نیز در این زمینه وجود دارند که ما در اینجا درباره آنها صحبت نمیکنیم. مسأله دیگری که ممکن است پیش بیاید این است که یک داده با هیچکدام از قواعد همخوانی نداشته باشد. برای این مسأله هم میتوان راهحلهایی ارائه نمود. معمولترین راهحل این است که چنانچه دادهای با هیچیک از قواعد همخوانی نداشت، کلاسی به عنوان کلاس آن داده انتخاب گردد که بیشترین تعداد داده در بین دادهها به آن کلاس تعلق دارد.
[۱] Size ordering
[۲] Rule ordering
[۱]Dataset
[۲] Clustering
[۳] Classification
[۴] Association rule mining
[۵] Hierarchical Clustering Algorithms
[۶] bottom-up
[۷] top-down
[۸] Density-Based Clustering
[۹] Support vector machine
تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.
ارسال نظر