Użyteczność oprogramowania do tłumaczenia maszynowego
Poniższe sekcje zawierają obiektywne kryteria oceny użyteczności wyników oprogramowania do tłumaczenia maszynowego .
Stacjonarność lub forma kanoniczna
Czy powtarzane tłumaczenia zbiegają się w jednym wyrażeniu w obu językach? tzn. czy metoda translacji wykazuje stacjonarność , czy też tworzy formę kanoniczną ? Czy tłumaczenie staje się nieruchome bez utraty pierwotnego znaczenia? Ten wskaźnik był krytykowany jako słabo skorelowany z BLEU (BiLingual Evaluation Understudy).
Adaptacja do kolokwializmu, argotu lub slangu
Czy system dostosowuje się do kolokwializmu , żargonu lub slangu ? Język francuski ma wiele zasad tworzenia słów w mowie i piśmie kultury popularnej . Dwie takie zasady to: (a) Odwrotna pisownia słów takich jak femme na meuf . (Nazywa się to verlan .) (b) Dołączenie przyrostka -ard do rzeczownika lub czasownika w celu utworzenia rzeczownika własnego. Na przykład rzeczownik faluche oznacza „kapelusz ucznia”. słowo faluchard utworzone z faluche potocznie może oznaczać, w zależności od kontekstu, „grupę studentów”, „zgromadzenie studentów” i „zachowanie typowe dla ucznia”. Tłumacz Google na dzień 28 grudnia 2006 r. nie wyprowadza skonstruowanych słów, jak na przykład z reguły (b), jak pokazano tutaj:
Il ya une chorale falucharde mercredi, venez nombreux, les faluchards chantent des paillardes! ==> Jest stowarzyszenie chóralne falucharde Środa, chodź wielu, faluchardy śpiewają rozwiązłe kobiety!
Francuski argot ma trzy poziomy użycia:
- rodzinna lub przyjacielska, akceptowana wśród przyjaciół, rodziny i rówieśników, ale nie w pracy
- bardziej wulgarne lub przekleństwa, akceptowane wśród przyjaciół i rówieśników, ale nie w pracy ani w rodzinie
- verlan lub slang getta, akceptowany wśród klas niższych, ale nie wśród klas średnich i wyższych
Amerykański Narodowy Instytut Standardów i Technologii przeprowadza coroczne oceny [1] systemów tłumaczenia maszynowego w oparciu o kryterium BLEU -4 [2] . Połączona metoda o nazwie IQmt, która obejmuje BLEU i dodatkowe metryki NIST, GTM, ROUGE i METEOR, została wdrożona przez Gimeneza i Amigo [3] .
Dobrze sformułowane dane wyjściowe
Czy wynik jest gramatyczny lub dobrze sformułowany w języku docelowym? Korzystanie z interlingua powinno być w tym względzie pomocne, ponieważ przy stałym interlingua powinno się być w stanie napisać odwzorowanie gramatyczne z interlingua na język docelowy. Rozważmy następujące w języku arabskim i tłumaczenie na język angielski z tłumacza Google na dzień 27 grudnia 2006 r. [4] . To wyjście tłumacza Google nie analizuje przy użyciu rozsądnej gramatyki języka angielskiego :
وعن حوادث التدافع عند شعيرة رمي الجمرات -التي كثيرا ما يسقط فيها العديد م ن الضحايا- أشار الأمير نايف إلى إدخال "تحسينات كثيرة في جسر الجمرات ستمنع بإذن الله حدوث أي تزاحم". ==> I incydenty przy pchnięciu rytuału rzucania Karbunkułami, które często padają tam, gdzie wiele ofiar – książę Nayef wskazał na wprowadzenie „wielu ulepszeń w brydżu Karbunkuły Bóg powstrzymałby występowanie jakiejkolwiek konkurencji”.
Zachowanie semantyki
Czy wielokrotne ponowne tłumaczenia zachowują semantykę oryginalnego zdania? Rozważmy na przykład następujące dane wprowadzone w języku angielskim przekazywane wielokrotnie do iz języka francuskiego za pomocą tłumacza Google według stanu na dzień 27 grudnia 2006 r.:
Lepiej dzień wcześniej niż dzień później. ==>
Améliorer un jour plus tôt qu'un jour tard. ==>
Poprawić dzień wcześniej niż dzień później. ==>
Pour améliorer un jour plus tôt qu'un jour tard. ==>
Poprawić dzień wcześniej niż dzień później.
Jak wspomniano powyżej i w, tego rodzaju tłumaczenie w obie strony jest bardzo niewiarygodną metodą oceny.
Wiarygodność i bezpieczeństwo
Interesującą osobliwością Tłumacza Google na dzień 24 stycznia 2008 r. (Poprawione na dzień 25 stycznia 2008 r.) Jest następujący wynik tłumaczenia z angielskiego na hiszpański, który pokazuje osadzony żart w słowniku angielsko-hiszpańskim, który ma trochę dodatkowej ostrości, biorąc pod uwagę ostatnie wydarzenia:
Heath Ledger nie żyje ==>
Tom Cruise jest muerto
Rodzi to kwestię wiarygodności w przypadku polegania na systemie tłumaczenia maszynowego osadzonym w systemie krytycznym dla życia, w którym system tłumaczenia ma wkład w proces podejmowania decyzji o znaczeniu krytycznym dla bezpieczeństwa. Łącznie rodzi to pytanie, czy w danym zastosowaniu oprogramowanie systemu tłumaczenia maszynowego jest bezpieczne przed hakerami .
Nie wiadomo, czy ta funkcja Tłumacza Google była wynikiem żartu/haku, czy może niezamierzoną konsekwencją zastosowania metody, takiej jak statystyczne tłumaczenie maszynowe . Reporterzy z CNET Networks poprosili Google o wyjaśnienie 24 stycznia 2008 r.; Google powiedział tylko, że był to „wewnętrzny problem z Tłumaczem Google”. Błędne tłumaczenie było przedmiotem wielu żartów i spekulacji w Internecie.
Jeśli jest to niezamierzona konsekwencja zastosowania metody, takiej jak statystyczne tłumaczenie maszynowe , a nie żart/hack, to zdarzenie to jest demonstracją potencjalnego źródła krytycznej zawodności w metodzie statystycznego tłumaczenia maszynowego.
W tłumaczeniach wykonywanych przez ludzi, w szczególności ze strony tłumaczy ustnych , często komentuje się wybiórczość tłumacza w wykonywaniu przekładu, gdy jedna z dwóch stron obsługiwanych przez tłumacza zna oba języki.
Prowadzi to do pytania, czy dane tłumaczenie można uznać za weryfikowalne . W takim przypadku zbieżne tłumaczenie w obie strony byłoby rodzajem weryfikacji.
Zobacz też
- Porównanie aplikacji do tłumaczenia maszynowego
- Ocena tłumaczenia maszynowego
- Tłumaczenie w obie strony
- Tłumaczenie
Notatki
- Gimenez, Jesus i Enrique Amigo. (2005) IQmt: Ramy oceny tłumaczenia maszynowego .
- NIST. Roczne oceny systemu tłumaczenia maszynowego i plan oceny .
- Papineni, Kishore, Salim Roukos, Todd Ward i Wei-Jing Zhu. (2002) BLEU: Metoda automatycznej oceny tłumaczenia maszynowego. proc. 40. doroczne spotkanie ACL, lipiec 2002, s. 311–318.