Университет Джон Хопкинс

статистически

Университет Джон Хопкинс

Университет Джон Хопкинс

Университет Джон Хопкинс

Университет Джон Хопкинс

Университет Джон Хопкинс

Университет Джон Хопкинс

Университет Джон Хопкинс

Добавено е ново предупреждение за цитиране!

Този сигнал е добавен успешно и ще бъде изпратен на:

Ще бъдете уведомени всеки път, когато е цитиран запис, който сте избрали.

За да управлявате вашите предпочитания за предупреждения, щракнете върху бутона по-долу.

Сигнал за ново цитиране!

Запазване в Binder
EACL '12: Сборник от 13-та конференция на Европейската глава на Асоциацията за компютърна лингвистика

РЕЗЮМЕ

Оценяваме параметрите на базирана на фрази статистическа система за машинен превод от едноезичен корпуси вместо a двуезичен успореден корпус. Ние разширяваме съществуващите изследвания върху двуезичната индукция на лексикон, за да оценим и двете лексикални и фразови вероятности за превод за таблици с фрази на MT-скала. Ние предлагаме нов алгоритъм за оценка на пренареждането на вероятностите от едноезични данни. Отчитаме резултатите от превода за система за превод от край до край, използвайки само тези едноезични функции. Нашият метод изисква само едноезични корпуси на изходни и целеви езици, малък двуезичен речник и малък биттекст за настройка на тежестите на функциите. В тази статия ние изследваме идеализация, където е дадена таблица с фрази. Проучваме влошаването на ефективността на превода, когато се изчистват вероятностите за двуезичен превод и показваме, че 80% + от загубата може да бъде възстановена само с едноезични прогнозни характеристики. Освен това показваме, че нашите едноезични функции добавят 1,5 BLEU точки, когато се комбинират със стандартни двуезични характеристики на таблицата с фрази.