Kolekcja Pangloss
Pangloss Collection to cyfrowa biblioteka , której celem jest przechowywanie i ułatwianie dostępu do nagrań dźwiękowych w zagrożonych językach świata. Opracowany przez centrum LACITO CNRS w Paryżu , zbiór zapewnia bezpłatny dostęp online do dokumentów związanych , spontanicznych, w skądinąd mało udokumentowanych językach ze wszystkich kontynentów.
Zasady
Archiwum dźwiękowe z zsynchronizowanymi transkrypcjami
Dla językoznawstwa język jest przede wszystkim językiem mówionym. Medium języka mówionego jest dźwięk. Kolekcja Pangloss zapewnia dostęp do oryginalnych nagrań jednocześnie z transkrypcjami i tłumaczeniami, jako źródło dalszych badań. Po nagraniu w kontekście kulturowym teksty zostały poddane transkrypcji we współpracy z native speakerami .
Strukturalna, otwarta architektura
Zarchiwizowane dane mają strukturę zgodną z najnowszymi standardami przetwarzania danych, jako otwarta architektura , w otwartym formacie i mogą być pobierane na licencji Creative Commons . Oprogramowanie użyte do przygotowania i rozpowszechniania jest open-source . Pangloss Collection jest członkiem OLAC oraz Digital Endangered Languages and Music Archive Network (DELAMAN).
Historia
Zbiór początkowo nosił nazwę Archiwum LACITO . Projekt powstał w 1996 roku we współpracy Boyda Michajłowskiego, językoznawcy z LACITO, z inżynierem Johnem B. Lowe; później dołączył do nich Michel Jacobson, inżynier, który opracował kilka narzędzi dla projektu i udostępnił go online.
Celem archiwum było „ konserwowanie i udostępnianie do badań nagranych i spisanych tradycji ustnych oraz innych materiałów językowych w (głównie) językach niepisanych, dając jednocześnie dostęp do nagrań dźwiękowych i adnotacji tekstowych ”. Najwcześniejszymi zarchiwizowanymi korpusami w kolekcji były języki z Nepalu , Nowej Kaledonii , Afryki Wschodniej i Gujany Francuskiej .
Archiwum stale się rozrastało od początku XXI wieku, obejmując korpusy różnych lingwistów, niezależnie od tego, czy są członkami LACITO, czy nie. W 2009 roku archiwum liczyło 200 nagrań w 45 językach. W 2014 roku (nowo przemianowana) kolekcja Pangloss zawierała 1400 nagrań w 70 językach.
Od kwietnia 2021 r. Archiwum Pangloss zawiera 5038 nagrań w 196 językach, w sumie 780 godzin nagrań audio i wideo.
Główne języki reprezentowane w kolekcji Pangloss to Mwotlap ( austronezyjski ; Vanuatu ), Japhug ( chińsko-tybetański ; południowo- zachodnie Chiny ), Ersu ( chińsko-tybetański ; południowo-zachodnie Chiny ), naxi (lub Yongnin Na : chińsko-tybetański ; południowo- zachodnie Chiny ), i Cèmuhî ( austronezyjski ; Nowa Kaledonia ). Głównymi współtwórcami Pangloss (pod względem liczby zarchiwizowanych zasobów) są lingwiści Alexandre François , Katia Chirkova, Guillaume Jacques i Michel Ferlus .
Linki zewnętrzne
- Strona główna kolekcji Pangloss
- tekst ze zbioru: „Ogr Kanayongba” , opowieść w języku nepalskim Limbu , przedstawiona w formacie dwujęzycznym.
- Dostęp do kolekcji Pangloss poprzez mapę językową
- Dostęp do kolekcji Pangloss poprzez interfejs wyszukiwania CoCoON .
- Dostęp do kolekcji Pangloss poprzez interfejs wyszukiwania OLAC . Zarchiwizowane 2021-04-24 w Wayback Machine