Anusaaraka
Napisane w | CLIPS, Python, Perl, C, C++ |
---|---|
System operacyjny | Kompatybilny z POSIX |
Dostępne w | angielski-hindi |
Typ | Tłumaczenie maszynowe |
Licencja | Powszechna Licencja Publiczna GNU |
Strona internetowa | https://ltrc.iiit.ac.in/Anusaaraka/anu_home.html |
Anusaaraka to oprogramowanie umożliwiające dostęp (tłumaczenie) z języka angielskiego na hindi , które wykorzystuje algorytmy pochodzące z Ashtadhyayi (reguły gramatyki) Pāṇiniego . Oprogramowanie jest rozwijane przez Chinmaya International Foundation (CIF) w Międzynarodowym Instytucie Technologii Informacyjnych w Hyderabad (IIIT-H) i University of Hyderabad (Wydział Studiów nad Sanskrytem) . Anusaaraka jest postrzegana jako połączenie tradycyjnych zaawansowanych indyjskich śastr i zaawansowanych współczesnych technologii.
Anusaaraka ma na celu umożliwienie użytkownikom dostępu do tekstu w dowolnym języku indyjskim po przetłumaczeniu z języka źródłowego (tj. angielskiego lub innego regionalnego języka indyjskiego). W dzisiejszej epoce informacyjnej dostępne są duże ilości informacji w języku angielskim – czy to informacje do egzaminów konkursowych, czy do czytania ogólnego. Jednak wiele osób, których głównym językiem jest hindi lub jakikolwiek inny język indyjski, nie ma dostępu do informacji w języku angielskim. Anusaaraka ma na celu pokonanie tej bariery językowej, umożliwiając użytkownikowi wprowadzenie tekstu w języku angielskim do Anusaaraka i przeczytanie go w wybranym przez siebie języku indyjskim.
Anusaaraka wywodzi swoją nazwę od sanskryckiego słowa „anusaran”, które oznacza „podążać”. Nazywa się to tak, ponieważ przetłumaczony wynik Anusaaraki pojawia się w warstwach – czyli sekwencji kroków, które następują po sobie, aż do wyświetlenia ostatecznego tłumaczenia użytkownikowi.
Cechy
Wierne odwzorowanie tekstu w języku źródłowym
W różnych warstwach danych wyjściowych Anusaaraka dokłada się starań, aby użytkownik był w stanie zrozumieć informacje zawarte w zdaniu angielskim. Wysiłkowi temu przypisuje się większe znaczenie niż pisanie perfekcyjnych zdań w języku hindi, ponieważ bezcelowe byłoby posiadanie tłumaczenia, które dobrze się czyta, ale tak naprawdę nie oddaje informacji zawartych w tekście źródłowym.
Warstwowe wyjście jest unikalne dla Anusaaraki. W ten sposób użytkownik może uzyskać dostęp do informacji tekstowych w języku źródłowym oraz sposobu, w jaki ostatecznie uzyskano tłumaczenie na hindi. Krytyczną cechą wyjścia warstwowego jest to, że przesyłanie informacji odbywa się w sposób kontrolowany na każdym kroku, co umożliwia powrót bez utraty informacji. Ponadto wszelkie uszkodzenia informacji, których nie można uniknąć w procesie tłumaczenia, są następnie wykonywane stopniowo. Dlatego nawet jeśli przetłumaczone zdanie nie jest tak „doskonałe” jak tłumaczenie ludzkie, przy pewnym wysiłku i orientacji w czytaniu dorobku Anusaaraki, jednostka może zrozumieć, co sugeruje tekst źródłowy, patrząc na warstwy i kontekst, w którym to zdanie się pojawia.
Odwracalność
Cecha stopniowego przenoszenia informacji z jednej warstwy do drugiej daje Anusaarace dodatkową zaletę polegającą na zapewnieniu odwracalności w procesie tłumaczenia – cechy, której nie można osiągnąć za pomocą konwencjonalnego systemu tłumaczenia maszynowego. Dwujęzyczny użytkownik Anusaaraka może w dowolnym momencie uzyskać dostęp do tekstu w języku źródłowym w języku angielskim, ze względu na przejrzystość danych wyjściowych. W tym celu wymagana byłaby pewna orientacja w czytaniu danych wyjściowych Anusaaraki.
Przezroczystość
Wyświetlanie warstw tłumaczenia krok po kroku zwiększa poziom pewności użytkownika końcowego, ponieważ może on prześledzić źródło i uzyskać jasność co do przetłumaczonego tekstu poprzez analizę warstw wyjściowych i odniesienie do kontekstu.
Przykładowe wyjście
Kolory na wydruku wskazują kategorię słów:
fraza rzeczownikowa |
fraza |
czasownikowa fraza |
przymiotnikowa fraza |
przysłówkowa przyimek |
spójniki |
wykrzykniki |