Anusaaraka

Anusaaraka
Napisane w CLIPS, Python, Perl, C, C++
System operacyjny Kompatybilny z POSIX
Dostępne w angielski-hindi
Typ Tłumaczenie maszynowe
Licencja Powszechna Licencja Publiczna GNU
Strona internetowa https://ltrc.iiit.ac.in/Anusaaraka/anu_home.html

Anusaaraka to oprogramowanie umożliwiające dostęp (tłumaczenie) z języka angielskiego na hindi , które wykorzystuje algorytmy pochodzące z Ashtadhyayi (reguły gramatyki) Pāṇiniego . Oprogramowanie jest rozwijane przez Chinmaya International Foundation (CIF) w Międzynarodowym Instytucie Technologii Informacyjnych w Hyderabad (IIIT-H) i University of Hyderabad (Wydział Studiów nad Sanskrytem) . Anusaaraka jest postrzegana jako połączenie tradycyjnych zaawansowanych indyjskich śastr i zaawansowanych współczesnych technologii.

Anusaaraka ma na celu umożliwienie użytkownikom dostępu do tekstu w dowolnym języku indyjskim po przetłumaczeniu z języka źródłowego (tj. angielskiego lub innego regionalnego języka indyjskiego). W dzisiejszej epoce informacyjnej dostępne są duże ilości informacji w języku angielskim – czy to informacje do egzaminów konkursowych, czy do czytania ogólnego. Jednak wiele osób, których głównym językiem jest hindi lub jakikolwiek inny język indyjski, nie ma dostępu do informacji w języku angielskim. Anusaaraka ma na celu pokonanie tej bariery językowej, umożliwiając użytkownikowi wprowadzenie tekstu w języku angielskim do Anusaaraka i przeczytanie go w wybranym przez siebie języku indyjskim.

Anusaaraka wywodzi swoją nazwę od sanskryckiego słowa „anusaran”, które oznacza „podążać”. Nazywa się to tak, ponieważ przetłumaczony wynik Anusaaraki pojawia się w warstwach – czyli sekwencji kroków, które następują po sobie, aż do wyświetlenia ostatecznego tłumaczenia użytkownikowi.

Cechy

Wierne odwzorowanie tekstu w języku źródłowym

W różnych warstwach danych wyjściowych Anusaaraka dokłada się starań, aby użytkownik był w stanie zrozumieć informacje zawarte w zdaniu angielskim. Wysiłkowi temu przypisuje się większe znaczenie niż pisanie perfekcyjnych zdań w języku hindi, ponieważ bezcelowe byłoby posiadanie tłumaczenia, które dobrze się czyta, ale tak naprawdę nie oddaje informacji zawartych w tekście źródłowym.

Warstwowe wyjście jest unikalne dla Anusaaraki. W ten sposób użytkownik może uzyskać dostęp do informacji tekstowych w języku źródłowym oraz sposobu, w jaki ostatecznie uzyskano tłumaczenie na hindi. Krytyczną cechą wyjścia warstwowego jest to, że przesyłanie informacji odbywa się w sposób kontrolowany na każdym kroku, co umożliwia powrót bez utraty informacji. Ponadto wszelkie uszkodzenia informacji, których nie można uniknąć w procesie tłumaczenia, są następnie wykonywane stopniowo. Dlatego nawet jeśli przetłumaczone zdanie nie jest tak „doskonałe” jak tłumaczenie ludzkie, przy pewnym wysiłku i orientacji w czytaniu dorobku Anusaaraki, jednostka może zrozumieć, co sugeruje tekst źródłowy, patrząc na warstwy i kontekst, w którym to zdanie się pojawia.

Odwracalność

Cecha stopniowego przenoszenia informacji z jednej warstwy do drugiej daje Anusaarace dodatkową zaletę polegającą na zapewnieniu odwracalności w procesie tłumaczenia – cechy, której nie można osiągnąć za pomocą konwencjonalnego systemu tłumaczenia maszynowego. Dwujęzyczny użytkownik Anusaaraka może w dowolnym momencie uzyskać dostęp do tekstu w języku źródłowym w języku angielskim, ze względu na przejrzystość danych wyjściowych. W tym celu wymagana byłaby pewna orientacja w czytaniu danych wyjściowych Anusaaraki.

Przezroczystość

Wyświetlanie warstw tłumaczenia krok po kroku zwiększa poziom pewności użytkownika końcowego, ponieważ może on prześledzić źródło i uzyskać jasność co do przetłumaczonego tekstu poprzez analizę warstw wyjściowych i odniesienie do kontekstu.

Przykładowe wyjście

Przykładowe wyjście systemu Anusaaraka.

Kolory na wydruku wskazują kategorię słów:

fraza rzeczownikowa
fraza
czasownikowa fraza
przymiotnikowa fraza
przysłówkowa przyimek
spójniki
wykrzykniki

Zobacz też

Linki zewnętrzne