Kolekcja Pangloss

Pangloss Collection to cyfrowa biblioteka , której celem jest przechowywanie i ułatwianie dostępu do nagrań dźwiękowych w zagrożonych językach świata. Opracowany przez centrum LACITO CNRS w Paryżu , zbiór zapewnia bezpłatny dostęp online do dokumentów związanych , spontanicznych, w skądinąd mało udokumentowanych językach ze wszystkich kontynentów.

Zasady

Archiwum dźwiękowe z zsynchronizowanymi transkrypcjami

Dla językoznawstwa język jest przede wszystkim językiem mówionym. Medium języka mówionego jest dźwięk. Kolekcja Pangloss zapewnia dostęp do oryginalnych nagrań jednocześnie z transkrypcjami i tłumaczeniami, jako źródło dalszych badań. Po nagraniu w kontekście kulturowym teksty zostały poddane transkrypcji we współpracy z native speakerami .

Strukturalna, otwarta architektura

Zarchiwizowane dane mają strukturę zgodną z najnowszymi standardami przetwarzania danych, jako otwarta architektura , w otwartym formacie i mogą być pobierane na licencji Creative Commons . Oprogramowanie użyte do przygotowania i rozpowszechniania jest open-source . Pangloss Collection jest członkiem OLAC oraz Digital Endangered Languages ​​and Music Archive Network (DELAMAN).

Historia

Zbiór początkowo nosił nazwę Archiwum LACITO . Projekt powstał w 1996 roku we współpracy Boyda Michajłowskiego, językoznawcy z LACITO, z inżynierem Johnem B. Lowe; później dołączył do nich Michel Jacobson, inżynier, który opracował kilka narzędzi dla projektu i udostępnił go online.

Celem archiwum było „ konserwowanie i udostępnianie do badań nagranych i spisanych tradycji ustnych oraz innych materiałów językowych w (głównie) językach niepisanych, dając jednocześnie dostęp do nagrań dźwiękowych i adnotacji tekstowych ”. Najwcześniejszymi zarchiwizowanymi korpusami w kolekcji były języki z Nepalu , Nowej Kaledonii , Afryki Wschodniej i Gujany Francuskiej .

Archiwum stale się rozrastało od początku XXI wieku, obejmując korpusy różnych lingwistów, niezależnie od tego, czy są członkami LACITO, czy nie. W 2009 roku archiwum liczyło 200 nagrań w 45 językach. W 2014 roku (nowo przemianowana) kolekcja Pangloss zawierała 1400 nagrań w 70 językach.

Od kwietnia 2021 r. Archiwum Pangloss zawiera 5038 nagrań w 196 językach, w sumie 780 godzin nagrań audio i wideo.

Główne języki reprezentowane w kolekcji Pangloss to Mwotlap ( austronezyjski ; Vanuatu ), Japhug ( chińsko-tybetański ; południowo- zachodnie Chiny ), Ersu ( chińsko-tybetański ; południowo-zachodnie Chiny ), naxi (lub Yongnin Na : chińsko-tybetański ; południowo- zachodnie Chiny ), i Cèmuhî ( austronezyjski ; Nowa Kaledonia ). Głównymi współtwórcami Pangloss (pod względem liczby zarchiwizowanych zasobów) są lingwiści Alexandre François , Katia Chirkova, Guillaume Jacques i Michel Ferlus .

Linki zewnętrzne