Reporter zamiany mowy na tekst
Reporter mowy na tekst ( STTR ), znany również jako autor napisów , to osoba, która słucha tego, co jest mówione, i wprowadza to słowo w słowo ( dosłownie ), jako poprawnie napisane teksty . Wielu twórców napisów korzysta z narzędzi (takich jak klawiatura stenograficzna , oprogramowanie do rozpoznawania mowy lub system oprogramowania CAT (Computer Aided Transcription) ), które zwykle konwertują ustnie przekazywane informacje na słowa pisane, które można skomponować jako tekst. Odtworzony tekst może być następnie odczytany przez niesłyszące lub niedosłyszące , osoby uczące się języków lub osoby z zaburzeniami przetwarzania słuchowego .
Historia
Wielu STTR rozpoczynało swoją karierę jako reporterzy sądowi . W sądach system służy do rejestrowania postępowań i udostępniania transkrypcji na żądanie. Umiejętności nabyte w tym zakresie sprawiły, że są one również nieocenione w zakresie dostępu komunikacyjnego dla osób niesłyszących lub późno głuchoniemych, ponieważ są przyzwyczajone do transkrypcji dużej ilości informacji ustnych z niezwykle wysokim stopniem dokładności i dostarczania niesłyszącym konsumentom opisywanie indywidualnej autonomii za pomocą funkcji Communication Access Realtime Translation (CART) . [ potrzebne źródło ]
Metody
Napisy w czasie rzeczywistym obejmują stenografię , pisanie głosowe i automatyczne rozpoznawanie mowy . Wyszkoleni, wysoko wykwalifikowani i doświadczeni pisarze pracujący w czasie rzeczywistym, czy to za pomocą metod stenograficznych, czy głosowych, osiągają bardzo wysokie wskaźniki dokładności, przekraczające 98 procent, przy prędkości zwykle dochodzącej do 300 słów na minutę. Powszechnie oczekuje się, że STTR osiągnie stały poziom dokładności 98,5% i więcej. [ potrzebne źródło ]
Pisarze głosowi często wytwarzają wiele takich samych produktów, jak ich koledzy stenotypowi / stenograficzni, w tym transkrypcje w formatach elektronicznych i drukowanych. Stenograficzni reporterzy dosłowni w czasie rzeczywistym podłączają swoje maszyny stenograficzne do laptopów, do programów przeglądających w czasie rzeczywistym i mogą zapewnić prawnikom lub innym klientom wyświetlanie w czasie rzeczywistym tekstu postępowania, a także plików komputerowych natychmiast po zakończeniu sesji. [ potrzebne źródło ]
Pisanie głosowe
Reporterzy piszący głosy zamieniający mowę na tekst są podobni do wczesnych pisarzy masek, którzy często powtarzali język mówiony w stożku tłumiącym dźwięk. Pisanie głosowe to metoda używana do raportowania sądowego i przez niektórych transkrybentów medycznych. Korzystając z metody pisania głosowego, protokolant sądowy mówi bezpośrednio do stenomaski lub tłumika głosu — ręcznej maski zawierającej jeden lub dwa mikrofony i materiały tłumiące głos. System zapisu głosowego składa się ze stenomaski, zewnętrznego digitizera dźwięku, laptopa, oprogramowania do rozpoznawania mowy i oprogramowania CAT. [ potrzebne źródło ]
Słowa lektora przechodzą przez kabel maski do zewnętrznego procesora sygnału cyfrowego USB, a następnie do mechanizmu rozpoznawania mowy komputera w celu konwersji na tekst przesyłany strumieniowo. Reporterzy pracujący w czasie rzeczywistym mogą przesyłać strumieniowo tekst do a) Internetu; b) plik komputerowy; c) stacja telewizyjna do tworzenia napisów; d) użytkownikowi końcowemu, który odczytuje napisy za pomocą laptopa, tabletu, smartfona lub e) oprogramowaniu, które formatuje wyniki w sposób najbardziej znany sędziom, adwokatom lub konsumentom tworzącym napisy. [ potrzebne źródło ]
Stenografia
Palantyp i stenotyp
Istnieją dwa rodzaje klawiatur akordowych szeroko stosowanych w raportowaniu zamiany mowy na tekst:
- system Palantype;
- system stenotypów .
Oba są używane w Wielkiej Brytanii, ale w Stanach Zjednoczonych dominującym typem klawiatury jest 23-klawiszowa, zaawansowana technologia, skomputeryzowana maszyna stenograficzna używana przez stenografów. Stąd STTRs są czasami określane jako palantypiści i stenografowie . Inaczej niż w przypadku QWERTY , każda litera w słowie nie jest naciskana pojedynczo, lecz ściskana razem jak akord na klawiaturze fortepianu. Kilka klawiszy zostanie naciśniętych jednocześnie jednym „pociągnięciem”, które reprezentuje całe sylaby lub słowa, lub skróty zwane „majtkami”, które reprezentują długie słowa lub frazy. [ potrzebne źródło ]
Oprogramowanie
Specjalnie zaprojektowane oprogramowanie komputerowe może być używane przez stenografów do konwersji uderzeń fonetycznych z klawiatury akordowej z powrotem na angielski, który można następnie wyświetlić, aby ktoś mógł przeczytać. Oprogramowanie komputerowe może wykorzystywać wstępnie zaprogramowane słownictwo specyficzne dla kontekstu, informacje, które dopasowują grupy sylab do form pisanych i może sugerować alternatywne napisy, spośród których wybiera STTR. Błędy wynikają z błędnego zrozumienia słów przez STTR oraz z konieczności podjęcia przez STTR decyzji, zanim niejednoznaczne stwierdzenie zostanie wyjaśnione w kontekście kolejnych słów dostarczonych przez oprogramowanie. [ potrzebne źródło ]
Co użytkownik serwisu zobaczy na ekranie?
Każde wypowiedziane słowo pojawi się na ekranie w przystępnym formacie, choć można poprosić o zmianę koloru i rozmiaru czcionki. Oprócz każdego wypowiedzianego słowa zwykle pojawiają się słowa „NOWY MÓWCA:” lub „>>” oznaczający zmianę mówcy. Jeśli przed wydarzeniem wyśle się do STTR (autora głosu/palantypistę/stenografa) nazwiska osób uczestniczących w konferencji lub spotkaniu, można je również zaprogramować w komputerze, co ułatwi rozpoznanie, kto mówi. Mogą również pojawić się inne wyrażenia w nawiasach, takie jak {śmiech} lub {oklaski}, aby wskazać odpowiednie dźwięki otoczenia. [ potrzebne źródło ]
Sporadyczne błędy jednostopniowe mogą być widoczne w napisach kodowanych, gdy oprogramowanie komputerowe nie rozróżnia, gdzie w strumieniu sylab występuje podział wyrazów. Na przykład wiadomość o „wielkiej paradzie” może być opatrzona napisem „najazd dziadka”. Mon Degreens w tym kontekście wynikają z potrzeby napisów, które nadążają za szybkim tempem komunikacji na żywo. [ potrzebne źródło ]
Szkolenie
Aby zostać STTR, potrzebne jest intensywne szkolenie: w przypadku Palantype / Stenography formalne szkolenie trwa zwykle dwa lata na powiązanym sprzęcie i oprogramowaniu oraz co najmniej dodatkowe dwa lata budowania szybkości w miejscu pracy, budowania słownika / słownictwa , poprawiając celność i zdobywając doświadczenie.
W przypadku pisania głosowego formalne szkolenie jest nieco krótsze. Dwa lata nauki pisania głosowego na powiązanym sprzęcie i oprogramowaniu, wymagana praktyka, budowanie szybkości, słownik/słownictwo, poprawa dokładności i zdobywanie doświadczenia.
Tylko wtedy można przystąpić do egzaminów certyfikacyjnych w USA i/lub Wielkiej Brytanii. W Stanach Zjednoczonych NCRA i NVRA oferują certyfikaty potwierdzające odbycie niezbędnego szkolenia.
Istnieje wiele poziomów certyfikacji. NCRA i NVRA certyfikują pisarzy stenograficznych lub głosowych, odpowiednio, jako reporterów sądowych, reporterów czasu rzeczywistego, dostawców CART i autorów napisów telewizyjnych. Certyfikat NCRA lub NVRA wyraźnie pokazuje, że reporter osiągnął wysoki poziom profesjonalizmu i umiejętności.
Programy testów certyfikacyjnych NCRA i NVRA są dostępne dla ich członków. Testy odbywają się w regularnych odstępach czasu przez cały rok w różnych miejscach na terenie całego kraju.
W Wielkiej Brytanii Unitised CACDP Examinations i członkostwo w Rejestrze CACDP potwierdzają osiągnięcie wymaganego poziomu minimalnego. Większość zarejestrowanych STTR jest również członkami Stowarzyszenia Verbatim Speech-to-Text Reporters.
Stowarzyszeniem zawodowym STTR jest Association of Verbatim Speech-to-Text Reporters. Rada ds. Zaawansowanej Komunikacji z Głuchymi i Królewski Narodowy Instytut dla Głuchych również dostarczają więcej informacji na temat STTR.