ویژگی‌های مبتنی بر طول دو جمله ۴۹
نرخ کلمات مشترک ۵۰
۴-۳-۳٫ ویژگی‌های مبتنی بر همترازی در سطح کلمه یک جفت جمله ۵۰
کلمات همتراز نشده ۵۰
باروری ۵۱
محدوده پیوسته ۵۲
نمره همترازی ۵۳
۴-۴٫ بالا بردن دقت جفت جملات موازی استخراج شده ۵۴
۴-۵٫ شیوه ارزیابی مدل ۵۵

 

    1. ارزیابی و نتیجه گیری ۵۸

 

۵-۱٫ ارزیابی طبقه‌بند آنتروپی بیشینه ۵۸
۵-۱-۱٫ ارزیابی ویژگی‌ها ۵۸
۵-۱-۲٫ حساسیت به دامنه ۶۰
۵-۲٫ تنظیمات و آزمایشات ساخت پیکره موازی از پیکره تطبیقی ۶۳
۵-۲-۱٫ پیکره تطبیقی مورد استفاده ۶۳
پیکره تطبیقی فارسی – انگلیسی دانشگاه تهران (UTPECC) 63
پیکره تطبیقی گرفته شده از مقالات ویکی پدیا ۶۵
۵-۲-۲٫ پارامترهای تنظیم شده و ابزار مورد استفاده ۶۶
انتخاب جفت جملات کاندید: ۶۶
انتخاب جفت جملات موازی: ۶۸
بالا بردن دقت جفت جملات استخراج شده: ۶۹
۵-۲-۳٫ ارزیابی جملات موازی استخراج شده با بهره گرفتن از ماشین ترجمه ۶۹
۵-۳٫ نتیجه گیری ۷۲
۵-۴٫ پیشنهادات آینده ۷۵
فهرست جداول
عنوان صفحه
جدول ۵-۱٫ مجموعه ویژگی‌ها ۵۹
جدول ۵-۲٫ ارزیابی مجموعه ویژگی‌ها ۵۹
جدول ۵-۳٫ حساسیت کارآیی طبقه‌بند به دامنه داده‌های آموزشی و آزمایشی ۶۱
جدول ۵-۴٫ کارآیی طبقه‌بند در برابر داده‌های آزمایشی و آموزشی با دامنه‌های مختلف ۶۲
جدول ۵-۵٫ شرح پیکره‌های آموزشی مورد استفاده در هر اجرا ۷۰
جدول ۵-۶٫ نمره بلوی به دست آمده به ازای پیکره‌های آموزشی متفاوت ۷۱
جدول ۵-۷٫ نمره بلوی به دست آمده به ازای پیکره‌های آموزشی متفاوت ۷۲
جدول ۵-۸٫ارزیابی ماشین‌ترجمه ساخته شده با پیکره‌های آموزشی متفاوت در قالب نرخ n-gram‌ های مشترک ۷۲
فهرست شکل‌ها
عنوان صفحه
شکل ۱-۱٫ دسته‌بندی روش‌های ترجمه ماشینی ۳
شکل ۲-۱٫ نمونه‌ای از دو متن همتراز شده در سطح جمله ۲۰
شکل ۲-۲٫ همترازی لغوی بین دو جمله فارسی و انگلیسی در شکل گراف دو بخشی ۲۱
شکل ۲-۳٫ همترازی لغوی بین دو جمله فارسی و انگلیسی در شکل جدول همترازی ۲۱
شکل ۲-۴٫ مثالی از نحوه محاسبه نمره TER 25
شکل ۴-۱٫ شمای کلی مدل تولید پیکره موازی از روی پیکره تطبیقی ۴۰
شکل ۴-۲٫ کلمات مشترک بین دو جمله فارسی و انگلیسی ۴۱
شکل ۴-۳٫ الگوریتم یافتن نرخ کلمات مشترک ۴۷
شکل ۴-۴٫ همترازی در سطح کلمه بین دو جمله غیرموازی ۵۲
شکل ۴-۵٫ همترازی در سطح کلمه بین دو جمله موازی ۵۳
شکل ۴-۶٫ فرایند ارزیابی جفت جملات موازی استخراج شده ۵۶

موضوعات: بدون موضوع
[پنجشنبه 1400-07-29] [ 01:41:00 ب.ظ ]