تحقیق داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی

تحقیق داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی

دسته: رشته مهندسی فناوری اطلاعات

فرمت : word | صفحات : 41

قیمت: 5000 تومان
514 views

پیشینه تحقیق داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی دارای ۴۱ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

۲-۱- مقدمه   ۴
۲-۲- دادهکاوی   ۴
۲-۲-۱- خوشهبندی   ۵
۲-۲-۱-۱- روشهای خوشه‌بندی مبتنی بر تقسیمبندی   ۵
۲-۲-۱-۲- روشهای سلسله مراتبی   ۵
۲-۲-۱-۳- روشهای مبتنی بر چگالی   ۶
۲-۲-۲- طبقهبندی   ۶
۲-۲-۲-۱- طبقهبندی مبتنی بر قواعد   ۷
۲-۲-۳- کشف قواعد انجمنی   ۹
۲-۲-۳-۱- تعاریف و مفاهیم اصلی در قواعد انجمنی   ۹
۲-۲-۳-۱-۱- تقسیم بندی قواعد انجمنی   ۱۱
۲-۲-۳-۱-۲- استخراج قواعد تک‌سطحی تک بعدی دودویی   ۱۱
۲-۲-۳-۱-۲-۱- مرحله پیوست   ۱۳
۲-۲-۳-۱-۲-۲- مرحله هرس   ۱۴
۲-۲-۳-۱-۳- محاسبه اطمینان و استخراج قواعد نهایی   ۱۴
۲-۳- دادهکاوی توزیع شده   ۱۵
۲-۴- عاملها و سیستمهای چندعامله   ۱۶
۲-۴-۱- عامل   ۱۶
۲-۴-۱-۱- مقایسه عامل با شیء   ۱۷
۲-۴-۱-۲- معماری عاملها   ۲۰
۲-۴-۱-۲-۱- معماری BDI   ۲۱
۲-۴-۲- سیستمهای چندعامله   ۲۳
۲-۴-۲-۱- مذاکره   ۲۵
۲-۵- بهرهگیری از عامل برای دادهکاوی   ۲۷
۲-۵-۱- سیستمهای چندعامله، بستری برای دادهکاوی توزیع شده   ۲۸
۲-۶- مروری بر کارهای انجام شده   ۳۰
۲-۶-۱- دادهکاوی توزیع شده   ۳۱
۲-۶-۲- کارهای مهم انجام شده در زمینه دادهکاوی با استفاده از عامل   ۳۴
منابع و مآخذ   ۳۶

منابع

[۱] Wang J., Data mining: opportunities and challenges: Irm Press, 2003.

[۲] Rao V.S., Vidyavathi S., “Distributed Data Mining and Mining Multi-Agent Data,” IJCSE) International Journal on Computer Science and Engineering, vol. 2, pp. 1237-1244, 2010.

[۳] Chen M.S., Han J., Yu P.S., “Data mining: an overview from a database perspective,” Knowledge and Data Engineering, IEEE Transactions on, vol. 8, pp. 866-883, 1996.

[۴] Han J., Kamber M., “Data mining: Concepts and Techniques, 2nd Edition,” San Francisco, CA, itd: Morgan Kaufmann, 2005.

[۵] Grossman R., Kasif S., Moore R., Rocke D., Ullman J., “Data mining research: Opportunities and challenges,” presented at the A Report of Three Workshops on Mining Large, Massive and Distributed Data, 1999.

[۶] Mitchell T.M., “Machine learning. 1997,” Burr Ridge, IL: McGraw Hill, 1997.

[۷] Bing L., Wynne H., Yiming M., “Integrating classification and association rule mining,” in KDD, New York City, New York, USA., 1998, pp. 80-86.

[۸] Bing L., Yiming M., Ching Kian W., “Improving an association rule based classifier,” Principles of Data Mining and Knowledge Discovery, pp. 293-317, 2000.

[۹] Kargupta H., Joshi A., Sivakumar K., Yesha Y., Data mining: Next generation challenges and future directions: AAAI Press, 2004.

[۱۰] Weiss G., Multiagent systems: a modern approach to distributed artificial intelligence: The MIT press, 1999.

[۱۱] Sycara K.P., “Multi-agent Systems,” AI magazine, Intelligent Agents, vol. 19, pp. 79-92, 1998.

[۱۲] Chira C., “Software agents,” IDIMS Report, February, vol. 21, 2003.

[۱۳] Odell J., “Agents: Technology and usage (Part 1),” Executive Report, vol. 3, 2000.

[۱۴] Wooldridge M., Jennings N.R., “Intelligent agents: Theory and practice,” Knowledge engineering review, vol. 10, pp. 115-152, 1995.

[۱۵] Wooldridge M., “Agent-based computing,” Interoperable Communication Networks, vol. 1, pp. 71-98, 1998.

[۱۶] Jennings N.R., Norman T.J., Faratin P., “ADEPT: an agent-based approach to business process management,” ACM Sigmod Record, vol. 27, pp. 32-39, 1998.

[۱۷] Etzioni O., Weld D.S., “Intelligent agents on the internet: Fact, fiction, and forecast,” IEEE expert, vol. 10, pp. 44-49, 1995.

[۱۸] Horn E., Kupries M., Reinke T., “Properties and models of software agents and prefabrication for agent application systems,” 1999, p. 10 pp.

[۱۹] Bradshaw J.M., “An introduction to software agents,” Software agents, vol. 5, pp. 3-46, 1997.

۲-۱ مقدمه

در این مقاله، به سه بخش اصلی با عناوین داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی میپردازیم و در نهایت به بررسی کارهای انجام شده در این حوزه خواهیم پرداخت.

۲-۲- دادهکاوی

داده کاوی، یک تکنولوژی نوظهور است، که از ابزارها و تکنیک‌های مدل‌سازی و تجزیه و تحلیل آماری، الگوریتم‌های ریاضی، و متدهای یادگیری ماشین برای کشف الگوهای معتبر و ناشناخته در مجموعه داده‌های حجیم استفاده می‌کند. هرچند این تکنولوژی دوران نوباوگی خود را طی می‌کند، اما شرکت‌ها و سازمان‌های بسیاری از جمله خرده‌فروشی‌ها، بانک‌ها، مراکز درمانی، کارخانجات تولیدی، ارتباطات راه دور، و مؤسسات دولتی از ابزارها و تکنیک‌های داده‌کاوی برای تحلیل داده‌هایشان و کشف اطلاعات و دانش مفید از آن‌ها استفاده می‌کنند.[۱, ۲] داده‌کاوی اطلاعاتی را از پایگاه داده‌ها استخراج می‌کند که از طریق کوئری‌ها و گزارش‌گیری‌ها قابل دست‌یابی نیستند.

رشد انفجاری داده‌های ذخیره شده در پایگاه داده‌ها، نیاز به تکنولوژی‌های جدید که بتوانند حجم عظیم داده‌ها را هوشمندانه به دانش مفید تبدیل کنند، را پدید آورده است.[۳] دادهکاوی به معنای یافتن نیمه خودکار الگوهای پنهان در مجموعه دادههای^[۱] موجود می‌باشد.[۴] این تکنولوژی با دیگر تکنیک‌های تحلیل داده، که سیستم، مقادیر اولیه را می‌گیرد و خود، الگوهایی را تولید می‌کند، متفاوت است. داده‌کاوی توسط ابزارهای الگوریتمیک، الگوها، تغییرات، آنومالی‌ها، قوانین، و ساختارهای مهم آماری، و رویدادها را از مجموعه داده‌های عظیم استخراج می‌کند.[۵] می‌توان گفت که داده کاوی در جهت کشف اطلاعات پنهان و روابط موجود در بین دادههای فعلی و پیشبینی موارد نامعلوم و یا مشاهده نشده عمل میکند. برای انجام عملیات کاوش لازم است قبلاً روی دادههای موجود پیش پردازش‌هایی انجام گیرد. عمل پیش پردازش اطلاعات خود از دو بخش کاهش اطلاعات، و خلاصهسازی و کلیسازی دادهها تشکیل شده است. کاهش اطلاعات عبارت است از تولید یک مجموعه کوچک‌تر، از دادههای اولیه، که تحت عملیات دادهکاوی نتایج تقریباً یکسانی با نتایج دادهکاوی روی اطلاعات اولیه به دست دهد.[۴] پس از انجام عمل کاهش اطلاعات و حذف خصایص غیر مرتبط نوبت به خلاصهسازی و کلیسازی دادهها می‌رسد. دادههای موجود در بانک‌های اطلاعاتی معمولاً حاوی اطلاعات در سطوح پایینی هستند، بنابراین خلاصهسازی مجموعه بزرگی از دادهها و ارائه آن به صورت یک مفهوم کلی اهمیت بسیار زیادی دارد. کلیسازی اطلاعات، فرآیندی است که تعداد زیادی از رکوردهای یک بانک اطلاعاتی را به صورت مفهومی در سطح بالاتر ارائه می‌نماید. تکنیک‌‌های دادهکاوی به چند دسته تقسیم میشوند که سه دسته اصلی عبارتند از خوشهبندی[۲]، طبقهبندی[۳] و کشف قواعد انجمنی[۴]. در ادامه هر یک از این روش‌ها را به طور کلی معرفی مینماییم.

۲-۱- خوشه بندی

فرآیند خوشهبندی سعی دارد که یک مجموعه داده را به چندین خوشه تقسیم نماید بطوریکه داده‌های قرار گرفته در یک خوشه با یکدیگر شبیه بوده و با دادههای خوشههای دیگر متفاوت باشند. در حال حاضر روش‌های متعددی برای خوشهبندی دادهها وجود دارد که بر اساس نوع دادهها، شکل خوشهها، فاصله دادهها و غیره عمل خوشهبندی را انجام میدهند. مهم‌ترین روش‌های خوشهبندی در زیر معرفی شدهاند:

۲-۲-۱-۱- روش‌های خوشه‌بندی مبتنی بر تقسیم‌بندی

این روش‌ها، دادههای موجود در یک مجموعه داده را به k خوشه تقسیم میکنند، بطوریکه هر خوشه دو خصوصیت زیر را داراست:

هر خوشه یا گروه حداقل شامل یک داده میباشد.

هر داده موجود در مجموعه داده دقیقاً به یک گروه یا خوشه تعلق دارد.

معیار اصلی در چنین مجموعه دادههایی میزان شباهت دادههای قرار گرفته در هر خوشه میباشد. در حالیکه داده‌های قرار گرفته در دو خوشه مختلف از نظر شباهت با یکدیگر فاصله زیادی دارند. مقدار k که به عنوان پارامتر استفاده میگردد، هم میتواند به صورت پویا تعیین گردد و هم اینکه قبل از شروع الگوریتم خوشهبندی مقدار آن مشخص گردد.

۲-۲-۱-۲- روش‌های سلسله مراتبی[۵]

روش‌های سلسله مراتبی به دو دسته کلی روش‌های پایین به بالا[۶] و روش‌های بالا به پایین[۷] تقسیم می‌گردند. روش‌های سلسله مراتبی پایین به بالا به این صورت عمل میکنند که در شروع هر کدام از دادهها را در یک خوشه جداگانه قرار میدهد و در طول اجرا سعی میکند تا خوشههایی نزدیک به یکدیگر را با هم ادغام نماید. این عمل ادغام تا زمانی که یا تنها یک خوشه داشته باشیم و یا اینکه شرط خاتمه برقرار گردد، ادامه مییابد. روش‌های بالا به پایین دقیقاً به طریق عکس عمل میکنند، به این طریق که ابتدا تمام دادهها را در یک خوشه قرار میدهد و در هر تکرار از الگوریتم، هر خوشه به خوشههای کوچک‌تر شکسته میشود و این کار تا زمانی ادامه مییابد که یا هر کدام از خوشهها تنها شامل یک داده باشند و یا شرط خاتمه الگوریتم برقرار گردد. شرط خاتمه معمولاً تعداد کلاستر یا خوشه میباشد.

۲-۲-۱-۳- روش‌های مبتنی بر چگالی[۸]

اکثر روش‌های خوشهبندی که به این روش عمل میکنند معمولاً از تابع فاصله به عنوان تابع معیار خود بهره میبرند. استفاده از چنین معیاری باعث میگردد که الگوریتم خوشهبندی تنها قادر به ایجاد خوشههایی با اشکال منظم باشد. در صورتیکه خوشههای واقعی در دادهها دارای اشکال غیر منظمی باشند، این الگوریتمها در خوشهبندی آن‌ها با مشکل مواجه میگردند. برای حل این‌گونه مشکلات یکسری از روش‌ها برای خوشهبندی پیشنهاد گردیدهاند که عمل خوشهبندی را بر مبنای چگالی داده ها انجام می‌دهند. ایده‌ی اصلی در این روش‌ها بر این اساس است که تا زمانی که دادههای قرار گرفته در همسایگی خوشه‌ها از حد معینی بیشتر باشند، آن‌ها رشد میکنند و بزرگ میشوند. چنین روش‌هایی قادرند خوشههایی با شکل‌های نامنظم نیز ایجاد نمایند.

البته دسته‌های دیگری از روش‌های خوشهبندی مانند روش‌های مبتنی بر گرید، روش‌های مبتنی بر مدل و غیره وجود دارند که میتوانید آن‌ها را در [۴] مطالعه نمایید.

۲-۲-۲- طبقه بندی

فرایند طبقهبندی در واقع نوعی یادگیری با ناظر میباشد که در طی دو مرحله انجام میگردد. در مرحله اول مجموعهای از دادهها که در آن هر داده شامل تعدادی خصوصیت دارای مقدار و یک خصوصیت بنام خصوصیت کلاس میباشد، برای ایجاد یک مدل داده بکار میروند که این مدل داده در واقع توصیف کننده مفهوم و خصوصیات آن مجموعه دادهها است. مرحله دوم فرآیند طبقهبندی، اعمال یا بکارگیری مدل ایجاد شده، بر روی داده‌هایی است که شامل تمام خصوصیات دادههایی که برای ایجاد مدل بکار گرفته شدهاند، میباشند، بجز خصوصیت کلاس، و هدف از عمل طبقهبندی نیز تخمین مقدار این خصوصیت میباشد.

الگوریتمها و روش‌های مختلفی برای طبقهبندی تاکنون پیشنهاد شدهاند که برای مثال میتوان از روش‌های طبقهبندی با استفاده از درخت تصمیم، طبقهبندی بیزین، [۹]SVM، طبقهبندی با استفاده از شبکه‌های عصبی، طبقهبندی مبتنی بر قواعد و غیره نام برد.[۶] در اینجا ما قصد نداریم وارد مباحث مربوط به الگوریتمها و روش‌های طبقهبندی شویم و تنها روش طبقهبندی مبتنی بر قواعد را معرفی خواهیم نمود. در صورت نیاز به مطالعه بیشتر میتوانید به مرجع [۴] مراجعه نمایید.

۲-۲-۲-۱- طبقه بندی مبتنی بر قواعد

در این قسمت قصد داریم نگاهی به بحث طبقهبندی مبتنی بر قواعد داشته باشیم. در این روش، مدل ایجاد شده از روی دادهها به صورت مجموعهای از قواعد میباشد. میتوان گفت که هر قاعده به صورت یک قاعده IF P THEN C میباشد که در آن P مجموعهای از شرایط بوده و C نیز مشخص کننده برچسب یک کلاس یا طبقه خاص میباشد. یک قاعده بدست آمده از مجموعه دادههای آموزشی با استفاده از دو معیار coverage و accuracy میتواند ارزیابی گردد.

که در تعاریف مذکور تعداد دادههایی در مجموعه داده D است که توسط قاعده پوشش داده میشوند. تعداد دادههایی است که توسط قاعده به درستی طبقهبندی شدهاند. |D| تعداد داده‌های موجود در D میباشد.

نکته مهمی که باید اینجا به آن اشاره کرد این بحث است که چگونه دادهها توسط این قواعد طبقه‌بندی میگردند. همان‌طور که اشاره گردید این قواعد دارای یک قسمت شرط (P) و یک قسمت C هستند. P یک الگو به صورت میباشد که هر کدام از p_iها بیان کننده‌ی یک محدودیت برای یکی از خصوصیات هستند. اگر خصوصیات دادهای محدودیتهای مذکور قاعدهای را برآورده سازد آنگاه کلاس یا طبقهبند آن داده، کلاس یا طبقهای است که آن قاعده بیان میکند(C). اما مسأله مهمی که اینجا پیش میآید، این است که اگر یک داده در قسمت شرط (P) بیش از یک قاعده صدق کند، آنگاه کدام قاعده را باید انتخاب کرد. بسته به استراتژیهای مختلف، این مشکل جواب‌های مختلفی می‌تواند داشته باشد. دو نمونه از مهم‌ترین استراتژیهایی که معمولاً برای حل این مشکل بکار میروند، استراتژی‌های مرتب‌سازی بر اساس اندازه[۱] و مرتب‌سازی بر اساس قاعده[۲] میباشند.

در استراتژی مرتب‌سازی بر اساس اندازه، چنانچه یک داده در بیش از یک قاعده صدق کند، قاعده‌ای برای طبقهبندی داده انتخاب میشود که خصوصیات بیشتری را برای مشخص نمودن کلاس داده تست کرده باشد. در استراتژی مرتب‌سازی بر اساس قاعده، پیش قواعد اولویت دهی میشوند و هنگام طبقهبندی، قاعده با اولویت بالاتر، مشخص کننده کلاس داده خواهد بود. اولویت‌دهی به قواعد هم به طرق مختلفی ممکن است انجام گردد. برای مثال ممکن است که ابتدا کلاس‌ها اولویتدهی شوند و قواعد مربوط به هر کلاس نیز با تأثیر پذیری از این اولویت‌دهی، اولویت بگیرند. اولویت کلاس‌ها نیز ممکن است بر اساس اهمیت کلاس یا تعداد دادههای متعلق به آن کلاس و یا غیره مشخص گردند. استراتژیهای دیگری نیز در این زمینه وجود دارند که ما در اینجا درباره آن‌ها صحبت نمیکنیم. مسأله دیگری که ممکن است پیش بیاید این است که یک داده با هیچ‌کدام از قواعد هم‌خوانی نداشته باشد. برای این مسأله هم میتوان راهحل‌هایی ارائه نمود. معمولترین راهحل این است که چنانچه دادهای با هیچ‌یک از قواعد هم‌خوانی نداشت، کلاسی به عنوان کلاس آن داده انتخاب گردد که بیشترین تعداد داده در بین دادهها به آن کلاس تعلق دارد.

[۱] Size ordering

[۲] Rule ordering

[۱]Dataset

[۲] Clustering

[۳] Classification

[۴] Association rule mining

[۵] Hierarchical Clustering Algorithms

[۶] bottom-up

[۷] top-down

[۸] Density-Based Clustering

[۹] Support vector machine

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.

مطالب پیشنهادی:

تحقیق داده‌کاوی و خوشه بندی و روش های آن و الگوریتم خوشه بندی

پیشینه تحقیق کاربرد داده‌کاوی در مدیریت دانش مشتری

برای ثبت نظر خود کلیک کنید ...

به راهنمایی نیاز دارید؟ کلیک کنید

تحقیق داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی

فهرست مطالب

منابع

۲-۱ مقدمه

۲-۲- دادهکاوی

۲-۱- خوشه بندی

۲-۲-۱-۱- روش‌های خوشه‌بندی مبتنی بر تقسیم‌بندی

۲-۲-۱-۲- روش‌های سلسله مراتبی[۵]

۲-۲-۱-۳- روش‌های مبتنی بر چگالی[۸]

۲-۲-۲- طبقه بندی

۲-۲-۲-۱- طبقه بندی مبتنی بر قواعد

ارسال نظر

جستجو پیشرفته

نوشته‌های تازه

بایگانی

دسته‌ها

آخرین بروز رسانی

تحقیق داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی

فهرست مطالب

منابع

۲-۱ مقدمه

۲-۲- داده­کاوی

۲-۱- خوشه ­بندی

۲-۲-۱-۱- روش‌های خوشه‌بندی مبتنی بر تقسیم‌بندی

۲-۲-۱-۲- روش‌های سلسله مراتبی[۵]

۲-۲-۱-۳- روش‌های مبتنی بر چگالی[۸]

۲-۲-۲- طبقه ­بندی

۲-۲-۲-۱- طبقه ­بندی مبتنی بر قواعد

ارسال نظر

جستجو پیشرفته

نوشته‌های تازه

بایگانی

دسته‌ها

آخرین بروز رسانی

۲-۲- دادهکاوی

۲-۱- خوشه بندی

۲-۲-۲- طبقه بندی

۲-۲-۲-۱- طبقه بندی مبتنی بر قواعد