Rdzenne tweety

Zrzut ekranu strony głównej rdzennych tweetów w kwietniu 2011 r

Indigenous Tweets to strona internetowa, która rejestruje wiadomości na Twitterze w języku mniejszości , aby pomóc tubylczym użytkownikom kontaktować się ze sobą. Została założona w marcu 2011 roku przez Kevina Scannella , który prowadzi badania w dziedzinie lingwistyki komputerowej na Wydziale Matematyki i Informatyki na Uniwersytecie Saint Louis w St. Louis, Missouri , Stany Zjednoczone. Celem serwisu jest umożliwienie użytkownikom języków mniejszości komunikowania się w Internecie.

Na swojej stronie głównej witryna wyświetla listę języków mniejszości przechowywanych w pamięci podręcznej. Po wybraniu języka użytkownik zostaje przeniesiony do tabeli wszystkich osób tweetujących w tym języku. Indigenous Tweets udostępnia zdjęcie profilowe każdego użytkownika Twittera oraz statystyki dotyczące liczby obserwujących każdą osobę. Oprócz dostarczania statystyk dotyczących odsetka tweetów, które dana osoba pisze w różnych językach, Indigenous Tweets zawiera wybór popularnych tematów w różnych językach mniejszości.

Historia

W momencie powstania strony internetowej w marcu 2011 r. skatalogowano 35 języków. 16 kwietnia 2011 r. zarejestrowała tweety w 76 językach mniejszości. Do 26 kwietnia 2011 r. Witryna obsługiwała 82. Skatalogowane języki obejmują „ezoteryczny” Gamilaraay i „bardziej znany” haitański kreolski i baskijski , które mają odpowiednio pierwsze i drugie pod względem liczby tweeterów. Welsh zajmuje trzecie miejsce w rdzennych tweetach.

Kapampangan , który zajął siódme miejsce w ostatnim tygodniu kwietnia 2011 r., był pierwszym językiem filipińskim obsługiwanym przez stronę internetową.

Eksploracja danych

Wielu ludzi patrzy z pewnym niepokojem na technologię i rzeczy takie jak tłumaczenie maszynowe i sieci społecznościowe, ponieważ czują, że będzie to promować globalne języki, kulturę amerykańską i kulturę języka angielskiego.

Postrzegam rzeczy takie jak Twitter i media społecznościowe jako szansę dla mniejszych języków. Strona taka jak rdzenni mieszkańcy jest dobrym przykładem strony internetowej, która pozwala ludziom łączyć się i komunikować oraz używać ich języka w naturalny sposób online.

Kevin Scannell, kwiecień 2011

Indigenous Tweets wykorzystuje bank danych słów i zwrotów z języków mniejszości, aby zlokalizować osoby mówiące tymi językami. W wywiadzie dla BBC News z kwietnia 2011 r. Scannell powiedział, że spędził 8 lat na budowaniu banku danych obejmującego około 500 języków, przeglądając blogi, gazety i strony internetowe.

API Twittera, przeszukując bank danych słów i fraz z języków mniejszości. Wyszukiwarka witryny nie może rozszyfrować języka tweeta, gdy słowo jest w więcej niż jednym języku. Aby uniknąć tej zagadki, Scannell wprowadza słowa, które są unikalne dla danego języka.

Linki zewnętrzne