Hybrydowe tłumaczenie maszynowe
Hybrydowe tłumaczenie maszynowe to metoda tłumaczenia maszynowego charakteryzująca się wykorzystaniem wielu podejść do tłumaczenia maszynowego w ramach jednego systemu tłumaczenia maszynowego. Motywacja do opracowywania hybrydowych systemów tłumaczenia maszynowego wynika z niepowodzenia jakiejkolwiek pojedynczej techniki w osiągnięciu zadowalającego poziomu dokładności. Wiele hybrydowych systemów tłumaczenia maszynowego odniosło sukces w poprawie dokładności tłumaczeń, a istnieje kilka popularnych systemów tłumaczenia maszynowego, które wykorzystują metody hybrydowe.
Podchodzi do
Wielosilnikowy
Takie podejście do hybrydowego tłumaczenia maszynowego obejmuje równoległe uruchamianie wielu systemów tłumaczenia maszynowego. Ostateczny wynik jest generowany przez połączenie wyników wszystkich podsystemów. Najczęściej systemy te wykorzystują podsystemy translacji statystycznej i opartej na regułach, ale zbadano inne kombinacje. Na przykład naukowcy z Carnegie Mellon University odnieśli pewien sukces, łącząc podsystemy tłumaczeń opartych na przykładach , transferach , wiedzy i statystyce w jeden system tłumaczenia maszynowego.
Generowanie reguł statystycznych
Podejście to polega na wykorzystaniu danych statystycznych do generowania reguł leksykalnych i składniowych . Dane wejściowe są następnie przetwarzane z tymi regułami, tak jakby były translatorem opartym na regułach . Podejście to ma na celu uniknięcie trudnego i czasochłonnego zadania tworzenia zestawu kompleksowych, precyzyjnych reguł językowych poprzez wyodrębnienie tych reguł z korpusu szkoleniowego. Podejście to nadal boryka się z wieloma problemami związanymi z normalnym statystycznym tłumaczeniem maszynowym , a mianowicie, że dokładność tłumaczenia będzie w dużej mierze zależeć od podobieństwa tekstu wejściowego do tekstu korpusu szkoleniowego. W rezultacie technika ta odniosła największy sukces w zastosowaniach specyficznych dla domeny i ma takie same trudności z adaptacją domeny, jak wiele systemów statystycznego tłumaczenia maszynowego .
Wieloprzepustowy
Podejście to obejmuje szeregowe przetwarzanie danych wejściowych wiele razy. Najpowszechniejszą techniką stosowaną w wieloprzebiegowych systemach tłumaczenia maszynowego jest wstępne przetwarzanie danych wejściowych za pomocą systemu tłumaczenia maszynowego opartego na regułach . Dane wyjściowe preprocesora opartego na regułach są przekazywane do statystycznego tłumaczenia maszynowego system, który wytwarza ostateczną produkcję. Ta technika służy do ograniczenia ilości informacji, które system statystyczny musi wziąć pod uwagę, znacznie zmniejszając wymaganą moc obliczeniową. Eliminuje to również potrzebę, aby system oparty na regułach był kompletnym systemem tłumaczeniowym dla języka, znacznie zmniejszając ilość ludzkiego wysiłku i pracy niezbędnej do zbudowania systemu.
Oparte na zaufaniu
Podejście to różni się od innych podejść hybrydowych tym, że w większości przypadków stosowana jest tylko jedna technologia tłumaczenia. Dla każdego przetłumaczonego zdania tworzona jest miara ufności, na podstawie której można podjąć decyzję, czy wypróbować wtórną technologię tłumaczenia, czy kontynuować wstępne tłumaczenie. SMT jest również używany, gdy pojawiają się typowe wzorce błędów, takie jak wiele powtarzających się słów w sekwencji, jak to ma miejsce w przypadku NMT, gdy mechanizm uwagi jest zdezorientowany.