پیشینه تحقیق روشهای زبان شناسی و یادگیری ماشین جهت تشخیص مرجع مشترک دارای ۴۸ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.
۱٫ پیشینه تشخیص مرجع مشترک ۶
۲. روشهای زبانشناسی ۲۲
۲-۱.فاکتورهای «حذف کننده» ۲۳
۲-۱-۱٫تطبیق جنس و عدد ۲۳
۲-۱-۲ .تطبیق معنایی ۲۳
۲-۲. فاکتورهای امتیازدهنده ۲۴
۲-۲-۱٫ مشابهت نحوی ۲۴
۲-۲-۲٫ مشابهت معنایی ۲۴
۲-۲-۳٫بارز بودن ۲۵
۳. روشهای یادگیری ماشینی ۲۶
۳-۱. ویژگیها: ۲۸
۳-۲. مدلهای جفت اشاره: ۲۸
روال کار تولید نمونههای آموزشی ۳۰
۳-۲-۱.ردهبندی جفت عبارتهای اسمی: ۳۱
۳-۲-۱-۱٫درخت تصمیم ۳۲
۳-۲-۲. افراز: ۳۴
۱) استراتژی بهترین- اولین: ۳۵
۲)تولید مجموعه آموزشی : ۳۵
۳-۲-۲-۱. درخت بل ۳۵
مزایا و معایب روش درختِ بل ۳۷
۳-۲-۲-۲.افراز گراف ۳۸
مزایا و معایب روش افراز گراف ۴۰
۳-۳.روشهای مبتنی بر پیکره ۴۰
مزایا و معایب روشهای مبتنی بر پیکره: ۴۴
۳-۴.روشهای جایگزین: ۴۴
۳-۴-۱.روش همآموزی ۴۴
۳-۴-۲.مدل احتمالاتی مرتبه اول ۴۵
مزایا و معایب مد ل احتمالی مرتبه اول ۴۶
۳-۴-۳.رتبهبندی ۴۷
مزایای رتبهبندی ۴۸
۳-۴-۴. فیلدهای تصادفی شرطی ۴۸
مزایا و معایب روش فیلد تصادفی شرطی ۵۰
۳-۴-۵. خوشهبندی ۵۰
مزایای روشهای خوشهبندی ۵۶
. فهرست منابع: ۵۷
تشخیص مرجع مشترک، یکی از مهمترین وظایف استخراج اطلاعات است که با شناسایی عبارات اسمی (اشارههایی) که به یک موجودیت واحد اشاره دارند، همراه میباشد.[۵۸]به این ترتیب که این اشارهها تشکیل یک زنجیرهی هممرجع را میدهند. در این مقاله برخی از روشهایی که در زمینه تشخیص مرجع مشترک بکارگرفته شدهاند را بررسی مینماییم.
به طور کلی روشهای تشخیص مرجع مشترک به دو دسته کلی زبانشناسی و روشهای یادگیری ماشین تقسیم میشوند. به این ترتیب که در روشهای زبانشناسی، بسیار نیازمند دانش زبانشناسی هستیم. استخراج این دانش از متن، فرآیندی زمانبر و پرخطاست. نخستین الگوریتمهای زبانشناسی مرتبط با تشخیص مرجع مشترک در اواخر دهه هفتاد ارائه شدند که در آنها از دانش زبانشناسی و معنایی بسیاری استفاده شدهاست.[۱۹،۶۰] پس از آن، با گذر زمان و فراهم شدن پیکرههای زبانشناسی، این روشها، جای خود را به روشهای آماری دادند. در روشهای آماری، دانش مورد نیاز بیشتر با استفاده از پیکرههای بزرگ و روشهای آماری کسب میشود و نسبت به روش قبل، به دانش زبانشناسی کمتری نیاز است و همچنین به نتایج بهتری نیز بدست میآید.[۱۰۵] در ادامهی این بخش نخست به مرور مختصری از شیوههای کلی روشهای زبانشناسی میپردازیم. سپس روشهای یادگیری ماشین را با تفصیل بیشتری بیان خواهیم نمود.
عموماً روشهای زبانشناسی به منظور تشخیص مرجع مشترک، از مجموعهای از فاکتورها بهره میگیرند. تطابق[۱] جنس و عدد (چندم شخص ، مفرد/ جمع)، محدودیتهای تطبیق معنایی، مشابهت معنایی[۲]، مشابهت نحوی[۳]، بارز بودن[۴]، مجاورت[۵] و غیره از جمله فاکتورهای متداول برای تشخیص مرجع مشترک میباشند. این فاکتورها میتوانند «حذفکننده[۶]» یا «امتیازدهنده[۷]» باشند. جدول ۲-۱ این فاکتورها را به تفکیک «حذفکننده» و «امتیازدهنده» نمایش میدهد.
جدول۲-۱: فاکتورهای متداول برای تشخیص مرجع مشترک | |
«حذف کننده» | «امتیازدهنده» |
تطبیق جنس و تعداد
تطبیق معنایی |
مشابهت معنایی
مشابهت نحوی بارز بودن مجاورت |
در روشهای زبانشناسی، روال کار به این صورت است که ابتدا به ازای یک عبارت تالی، عبارات مقدم(عبارات هممرجع) کاندیدای آن تعیین میگردد. پس از آن با استفاده از فاکتورهای «حذفکننده»، برخی از کاندیداها حذف میشوند، سپس فاکتورهای امتیازدهنده به امتیازدهی کاندیداهای باقیمانده میپردازند. در نهایت نیز کاندیدایی که بیشترین امتیاز را کسب کرده باشد به عنوان عبارت مقدم که با عبارت اسمی مورد نظر هممرجع میباشد، انتخاب خواهد شد.
این دو فاکتور بررسی میپردازند که آیا دو عبارت اسمی از نظر جنس و تعداد با یکدیگر مطابق هستند یا خیر.
Alii asked Zahraj and Herj sistersk that leave himi alone مثال۱:
همان طور که مشاهده میشود در مثال بالا “her sisters” نمیتواند با “him” هممرجع باشد چراکه از نظر جنس و تعداد با یکدیگر مطابقت ندارند.
این فاکتور از این جهت به کار میرود که اگر یک عبارت اسمی در یک حوزه معنایی صادق بود، عبارت اسمی هممرجع آن نیز باید در آن محدودهی معنایی صادق باشد.
Alii closed the windowj and cleaned itj : مثال ۲
همانطور که مشاهده میشود، ضمیر it”” تنها میتواند با عبارت اسمی “window” که غیرجاندار و قابل تمیز کردن است هممرجع باشد.
فاکتورهای امتیازدهنده، برخلاف فاکتورهای حذفکننده که الزاماً باید بررسی شوند اجباری نیستند. به این ترتیب لزومی ندارد که تمامی عبارتهای اسمی با مرجع مشترک دارای این فاکتورها باشند. در این بخش سه فاکتور مشابهت نحوی، مشابهت معنایی و بارز بودن را به همراه مثال شرح میدهیم.
این امتیاز زمانی به یک عبارت اسمی تعلق میگیرد که نقش نحوی آن با عبارت اسمی هممرجع کاندیدا یکسان باشد.
The programmeri finally combined the Prologj with Pascalk, currently heiمثال۳:
had combined itj with Cm
در مثال فوق، از آن جایی که عبارت اسمی “prolog” با “it” نقش نحوی یکسانی دارد، برای هممرجع بودن با آن امتیاز بیشتری به عبارت اسمی “Pascal” دارد.
مشابهت معنایی، نسبت به فاکتور قبل، تاثیر بیشتری در امتیازدهی دارد. با این تفاوت که تنها سیستمهایی میتوانند از آن بهره ببرند که قادر به تعیین خودکار نقش معنایی هر عبارت باشند. این فاکتور، به عبارت اسمی که نقش معنایی یکسانی با عبارت اسمی مورد نظر داشته باشد، امتیاز بیشتری میدهد.
[۱] معادل پارسی واژه انگلیسی Agreement
[۲] معادل پارسی عبارت انگلیسی Syntactic parallelism
[۳] معادل پارسی عبارت انگلیسیSemantic parallelism
[۴] معادل پارسی واژه انگلیسی Salience
[۵] معادل پارسی واژه انگلیسی Proximity
[۶] معادل پارسی واژه انگلیسیEliminating
[۷] معادل پارسی واژه انگلیسیPreferential
تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.
ارسال نظر