تحقیق روش‏های زبان ‏شناسی و یادگیری ماشین جهت تشخیص مرجع مشترک

تحقیق روش‏های زبان ‏شناسی و یادگیری ماشین جهت تشخیص مرجع مشترک

دسته: رشته مهندسی فناوری اطلاعات

فرمت : word | صفحات : 48

قیمت: 5000 تومان
617 views

پیشینه تحقیق روش‏های زبان ‏شناسی و یادگیری ماشین جهت تشخیص مرجع مشترک دارای ۴۸ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

۱٫ پیشینه تشخیص مرجع مشترک   ۶
۲. روش‏های زبان‏شناسی   ۲۲
۲-۱.فاکتورهای «حذف کننده»   ۲۳
۲-۱-۱٫تطبیق جنس و عدد   ۲۳
۲-۱-۲ .تطبیق معنایی   ۲۳
۲-۲. فاکتورهای امتیازدهنده   ۲۴
۲-۲-۱٫ مشابهت نحوی   ۲۴
۲-۲-۲٫ مشابهت معنایی   ۲۴
۲-۲-۳٫بارز بودن   ۲۵
۳. روش‏های یادگیری ماشینی   ۲۶
۳-۱. ویژگی‏ها:   ۲۸
۳-۲. مدل‏های جفت اشاره:   ۲۸
روال کار تولید نمونه‏های آموزشی   ۳۰
۳-۲-۱.رده‏بندی جفت عبارت‏های اسمی:   ۳۱
۳-۲-۱-۱٫درخت تصمیم   ۳۲
۳-۲-۲. افراز:   ۳۴
۱) استراتژی بهترین- اولین:   ۳۵
۲)تولید مجموعه آموزشی :   ۳۵
۳-۲-۲-۱. درخت بل   ۳۵
مزایا و معایب روش درختِ بل   ۳۷
۳-۲-۲-۲.افراز گراف   ۳۸
مزایا و معایب روش افراز گراف   ۴۰
۳-۳.روش‏های مبتنی بر پیکره   ۴۰
مزایا و معایب روش‏های مبتنی بر پیکره:   ۴۴
۳-۴.روش‏های جایگزین:   ۴۴
۳-۴-۱.روش هم‏آموزی   ۴۴
۳-۴-۲.مدل احتمالاتی مرتبه اول   ۴۵
مزایا و معایب مد ل احتمالی مرتبه اول   ۴۶
۳-۴-۳.رتبه‏بندی   ۴۷
مزایای رتبه‏بندی   ۴۸
۳-۴-۴. فیلدهای تصادفی شرطی   ۴۸
مزایا و معایب روش فیلد تصادفی شرطی   ۵۰
۳-۴-۵. خوشه‏بندی   ۵۰
مزایای روش‏های خوشه‏بندی   ۵۶
. فهرست منابع:   ۵۷

منابع:

۳٫ A. Blum and T. Mitchell, “combining labeled and unlabeled data with containing”, Proceedings of COLT, 1998, pages 92–۱۰۰٫

۴٫ A. Culotta, M.Wick,. and A. McCallum, “First-Order Probabilistic Models for Coreference Resolution”, Proceedings of NAACL HLT 2007, pages 81–۸۸٫

۵٫ A. Haghighi and D. Klein,“Unsupervised coreference resolution in a nonparametric bayesian model.” In Proceedings of the Association for ComputaDItional Linguistics, 2007.

۶٫ A. Haghighi, D. Klein, “An Entity –Level Approach To IE “.

۷٫ A. McCallum and B.Wellner,“Conditional models of identity uncertainty with application to proper noun Coreference”, proceedings of Neural Information Processing Systems 2004, (NIPS).

۸٫ ACE (Automatic Content Extraction), “English Annotation Guidelines for Entities”, Version 6.06 2008.06.13.

۹٫ ۱۰٫ ۱۱٫ B. H. Partee, “Opacity, coreference, and pronouns”. In D. Davidson and G. Harman,eds., Semantics for Natural Language, pages 415–۴۴۱٫ Dordrecht, Holland: D.Reidel. 1972.

۱۲٫ Bansal, M and Klein,D , “Coreference Semantics From Web Features”, Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics, pages 389–۳۹۸,Jeju, Republic of Korea, 8-14 July 2012.

۱۳٫ C.Aone and S.W.Bennett, “Applying Machin Learning to Anaphora Resolution”.

پیشینه تشخیص مرجع مشترک

تشخیص مرجع مشترک، یکی از مهمترین وظایف استخراج اطلاعات است که با شناسایی عبارات اسمی (اشاره‏هایی) که به یک موجودیت واحد اشاره دارند، همراه می‏باشد.[۵۸]به این ترتیب که این اشاره‏ها تشکیل یک زنجیره‏ی هم‏مرجع را می‏دهند. در این مقاله برخی از روش‏هایی که در زمینه تشخیص مرجع مشترک بکارگرفته شده‏اند را بررسی می‏نماییم.

به طور کلی روش‏های تشخیص مرجع مشترک به دو دسته کلی زبان‏شناسی و روش‏های یادگیری ماشین تقسیم می‏شوند. به این ترتیب که در روش‏های زبان‏شناسی، بسیار نیازمند دانش زبان‏شناسی هستیم. استخراج این دانش از متن، فرآیندی زمان‏بر و پر‏خطاست. نخستین الگوریتم‏های زبان‏شناسی مرتبط با تشخیص مرجع مشترک در اواخر دهه هفتاد ارائه شدند که در آن‏ها از دانش زبان‏شناسی و معنایی بسیاری استفاده شده‏است.[۱۹،۶۰] پس از آن، با گذر زمان و فراهم شدن پیکره‏های زبان‏شناسی، این روش‏ها، جای خود را به روش‏های آماری دادند. در روش‏های آماری، دانش مورد نیاز بیشتر با استفاده از پیکره‏های بزرگ و روش‏های آماری کسب می‏شود و نسبت به روش قبل، به دانش زبان‏شناسی کمتری نیاز است و همچنین به نتایج بهتری نیز بدست می‏آید.[۱۰۵] در ادامه‏ی این بخش نخست به مرور مختصری از شیوه‏های کلی روش‏های زبان‏شناسی می‏پردازیم. سپس روش‏های یادگیری ماشین را با تفصیل بیشتری بیان خواهیم نمود.

۲. روش‏های زبان‏شناسی

عموماً روش‏های زبان‏شناسی به منظور تشخیص مرجع مشترک، از مجموعه‏ای از فاکتورها بهره می‏گیرند. تطابق[۱] جنس و عدد (چندم شخص ، مفرد/ جمع)، محدودیت‏های تطبیق معنایی، مشابهت معنایی[۲]، مشابهت نحوی[۳]، بارز بودن[۴]، مجاورت[۵] و غیره از جمله فاکتورهای متداول برای تشخیص مرجع مشترک می‏باشند. این فاکتورها می‏توانند «حذف‏کننده[۶]» یا «امتیاز‏دهنده[۷]» باشند. جدول ۲-۱ این فاکتورها را به تفکیک «حذف‏کننده» و «امتیازدهنده» نمایش می‏دهد.

جدول۲-۱: فاکتورهای متداول برای تشخیص مرجع مشترک

«حذف‏ کننده»

«امتیاز‏دهنده»

تطبیق جنس و تعداد

تطبیق معنایی

مشابهت معنایی

مشابهت نحوی

بارز بودن

مجاورت

در روش‏های زبان‏شناسی، روال کار به این صورت است که ابتدا به ازای یک عبارت تالی، عبارات مقدم(عبارات هم‏مرجع) کاندیدای آن تعیین می‏گردد. پس از آن با استفاده از فاکتورهای «حذف‏کننده»، برخی از کاندیداها حذف می‏شوند، سپس فاکتورهای امتیازدهنده به امتیازدهی کاندیداهای باقیمانده می‏پردازند. در نهایت نیز کاندیدایی که بیشترین امتیاز را کسب کرده باشد به عنوان عبارت مقدم که با عبارت اسمی مورد نظر هم‏مرجع می‏باشد، انتخاب خواهد شد.

۲-۱.فاکتورهای «حذف کننده»

۲-۱-۱٫تطبیق جنس و عدد

این دو فاکتور بررسی می‏پردازند که آیا دو عبارت اسمی از نظر جنس و تعداد با یکدیگر مطابق هستند یا خیر.

Ali_i asked Zahra_j and Her_j sisters_k that leave him_i alone مثال۱:

همان طور که مشاهده می‏شود در مثال بالا “her sisters” نمی‏تواند با “him” هم‏مرجع باشد چراکه از نظر جنس و تعداد با یکدیگر مطابقت ندارند.

۲-۱-۲ .تطبیق معنایی

این فاکتور از این جهت به کار می‏رود که اگر یک عبارت اسمی در یک حوزه معنایی صادق بود، عبارت اسمی هم‏مرجع آن نیز باید در آن محدوده‏ی معنایی صادق باشد.

Ali_i closed the window_j and cleaned it_{j :}مثال ۲

همانطور که مشاهده می‏شود، ضمیر it”” تنها می‏تواند با عبارت اسمی “window” که غیرجاندار و قابل تمیز کردن است هم‏مرجع باشد.

۲-۲. فاکتورهای امتیازدهنده

فاکتورهای امتیازدهنده، برخلاف فاکتورهای حذف‏کننده که الزاماً باید بررسی شوند اجباری نیستند. به این ترتیب لزومی ندارد که تمامی عبارت‏های اسمی با مرجع مشترک دارای این فاکتورها باشند. در این بخش سه فاکتور مشابهت نحوی، مشابهت معنایی و بارز بودن را به همراه مثال شرح می‏دهیم.

۲-۲-۱٫ مشابهت نحوی

این امتیاز زمانی به یک عبارت اسمی تعلق می‏گیرد که نقش نحوی آن با عبارت اسمی هم‏مرجع کاندیدا یکسان باشد.

The programmer_i finally combined the Prolog_j with Pascal_k, currently he_iمثال۳:

had combined it_j with C_m

در مثال فوق، از آن جایی که عبارت اسمی “prolog” با “it” نقش نحوی یکسانی دارد، برای هم‏مرجع بودن با آن امتیاز بیشتری به عبارت اسمی “Pascal” دارد.

۲-۲-۲٫ مشابهت معنایی

مشابهت معنایی، نسبت به فاکتور قبل، تاثیر بیشتری در امتیازدهی دارد. با این تفاوت که تنها سیستم‏هایی می‏توانند از آن بهره ببرند که قادر به تعیین خودکار نقش معنایی هر عبارت باشند. این فاکتور، به عبارت اسمی که نقش معنایی یکسانی با عبارت اسمی مورد نظر داشته باشد، امتیاز بیشتری می‏دهد.

[۱] معادل پارسی واژه انگلیسی Agreement

[۲] معادل پارسی عبارت انگلیسی Syntactic parallelism

[۳] معادل پارسی عبارت انگلیسیSemantic parallelism

[۴] معادل پارسی واژه انگلیسی Salience

[۵] معادل پارسی واژه انگلیسی Proximity

[۶] معادل پارسی واژه انگلیسیEliminating

[۷] معادل پارسی واژه انگلیسیPreferential

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.

مطالب پیشنهادی:

تحقیق یادگیری و اسناد و نظریه ها ی آن و نقش اسنادها در مهارت های روان شناختی و ورزشی

تحقیق نقش هورمون های استروئیدی و بیس فنول آ بر یادگیری و حافظه

تحقیق سبک های مدیریت ، یادگیری خود تنظیمی و پیشرفت تحصیلی و نظریه های آن

تحقیق یادگیری طبقه بندی کننده های فازی و معرفی الگوریتم رقابت استعماری

تحقیق یادگیری حرکتی و کانونی نمودن توجه و تئوری های آن