Tekst na mowę w telewizji cyfrowej

Tekst na mowę w telewizji cyfrowej odnosi się do produktów telewizji cyfrowej , które wykorzystują syntezę mowy (mowę generowaną komputerowo, która „rozmawia” z użytkownikiem końcowym), aby umożliwić dostęp osobom niewidomym lub niedowidzącym . Łącząc telewizję cyfrową ( telewizor , dekoder , osobisty magnetowid lub inny rodzaj odbiornika ) z silnikiem syntezy mowy, osoby niewidome i słabowidzące mogą uzyskać dostęp do informacji, które normalnie są wyświetlane wizualnie, w celu obsługi menu i elektroniczne przewodniki po programach odbiornika.

Potrzeba użytkownika

Korzystanie z nośnika audiowizualnego powoduje problemy dla niektórych osób niepełnosprawnych, zwłaszcza osób z ubytkiem wzroku lub słuchu. Problemy te można podzielić na dostępności interfejsu i utrudnienia w korzystaniu z samej treści. Funkcje zamiany tekstu na mowę w produktach telewizyjnych pomagają rozwiązać bariery dostępności interfejsu dla osób niewidomych i niedowidzących, które mogą nie być w stanie korzystać ze standardowego interfejsu wizualnego, a nawet funkcji specjalnych, takich jak duże czcionki, lupy, regulowane schematy kolorów itp.

Rozwiązania telewizji cyfrowej są często bardziej skomplikowanymi produktami w porównaniu do ich analogowych przodków. Możliwość poruszania się po wielu menu, przeglądania informacji o programach na ekranie oraz przeglądania elektronicznych przewodników po programach lub list treści na ekranie w celu sprawdzenia, co jest dostępne do oglądania, jest niezbędna do korzystania z telewizji cyfrowej.

Decydenci na całym świecie uznali znaczenie dostępu do (cyfrowej) telewizji:

  • Motyw 64 unijnej dyrektywy o audiowizualnych usługach medialnych (AVMS) stanowi: „ Prawo osób niepełnosprawnych i osób starszych do uczestnictwa i integracji w życiu społecznym i kulturalnym Wspólnoty jest nierozerwalnie związane z zapewnianiem dostępnych mediów audiowizualnych usługi. "
  • Wstępny raport z badania Komisji Europejskiej „Mierzenie postępów w eDostępności w Europie” odnosi się do telewizji jako jednej z wielu dziedzin, „ które są obecnie niezbędnymi elementami życia społecznego i gospodarczego”.
  • Konwencja Narodów Zjednoczonych o prawach osób niepełnosprawnych zawiera szczególne odniesienie do dostępu do telewizji w art. 30 ust. 1 („Uczestnictwo w życiu kulturalnym, rekreacji, wypoczynku i sporcie”): „Państwa Strony uznają prawo osób niepełnosprawnych do uczestniczą na równych zasadach z innymi osobami w życiu kulturalnym i podejmują wszelkie odpowiednie środki w celu zapewnienia, aby osoby niepełnosprawne: […] b. Korzystały z dostępu do programów telewizyjnych, filmów, teatru i innych działań kulturalnych w dostępnych formatach”.

Historia

Oprogramowanie do zamiany tekstu na mowę jest szeroko dostępne dla komputerów stacjonarnych od lat 90. XX wieku, a wzrost możliwości procesora i pamięci zgodnie z prawem Moore'a przyczynił się do ułatwienia ich włączenia do rozwiązań programowych i sprzętowych. W następstwie tych trendów zamiana tekstu na mowę trafia do codziennej elektroniki użytkowej . Oprócz rozwiązań zamiany tekstu na mowę dla komputerów, teraz widzimy mówiące zegarki i zegary, kalendarze, termometry, pomoce kuchenne i wiele innych produktów. Powszechnie stosowane są również książki mówione i systemy nawigacji GPS.

Organizacje reprezentujące osoby niewidome i słabowidzące od dawna wspierają technologię zamiany tekstu na mowę w elektronice użytkowej. W Wielkiej Brytanii Królewski Narodowy Instytut Osób Niewidomych (RNIB) od początku wieku opowiada się za mówiącymi produktami radiowymi i telewizyjnymi oraz wspiera producentów w tworzeniu takich rozwiązań.

Digital TV Group , brytyjskie stowarzyszenie branżowe zajmujące się telewizją cyfrową, po raz pierwszy omówiło ten temat w 2007 r., a następnie w 2009 r. zgromadziło branżę, aby napisać specyfikację techniczną zamiany tekstu na mowę na rynku horyzontalnym. Ta współpraca była częścią brytyjskiego rządu BERR Plan działania dotyczący użyteczności. Po ukończeniu plan został przesłany do Digital Europe w celu standaryzacji ETSI, a także opublikowany jako biała księga. Następnie plan został włączony do U-Book - UK Digital TV Usability and Accessibility Guidelines, w tym zamiana tekstu na mowę.

W 2010 roku w Wielkiej Brytanii pojawiły się dwa mówiące produkty do telewizji cyfrowej. Sky Talker to dodatek do dekodera Sky . Zapewnia funkcje mówienia w celu uzyskania informacji o programie i kanale oraz sterowania odtwarzaniem. Sky Talker jest obsługiwany za pomocą standardowego pilota Sky. na rynek brytyjski wprowadzono również dekoder Smart Talk Freeview ( naziemne nadawanie cyfrowe ). Jest to dekoder Freeview marki Goodmans , opracowany przez partnerstwo pomiędzy Harvard International Ltd i RNIB . Było to pierwsze kompletne rozwiązanie do rozmów dla telewizji cyfrowej w Wielkiej Brytanii, w tym mówiło o elektronicznym przewodniku po programach, menu i zapewniało pomoc głosową podczas konfiguracji.

W Japonii zarówno Panasonic , jak i Mitsubishi Electric produkują telewizory i produkty Blu-ray od 2010 roku. Według informacji zebranych przez japońską organizację Lighthouse for the Blind, istnieje około 70 produktów Mitsubishi i Panasonic z funkcją mówienia .

Ministerstwo Przemysłu, Turystyki i Handlu bezpłatnie rozprowadziło mówiący dekoder oparty na systemie Linux, korzystający z bezpłatnego mechanizmu przetwarzania tekstu na mowę Festival , dla osób niewidomych i niedowidzących. Niestety ten produkt nie jest już dostępny.

W 2012 roku firma Panasonic wprowadziła na rynek brytyjski rozwiązanie do prowadzenia głosowego. Voice Guidance to zestaw funkcji głosowych dla serii Viera 2012 (i nie tylko). Wskazówki głosowe ogłaszają na ekranie informacje dotyczące najważniejszych menu i obsługują przypomnienia, nagrania i funkcje odtwarzania. Jest dostępny dla odbiorników Freesat i Freeview . Tworząc swoje rozwiązanie, firma Panasonic wzięła pod uwagę porady ekspertów RNIB.

Również w 2012 roku, TVonics , były brytyjski producent cyfrowych rejestratorów wideo, wprowadził na rynek swoje mówiące rozwiązanie PVR: nagrywarkę Freeview HD z dwoma tunerami opartą na silniku Ivona TTS, która jest powszechnie chwalona przez grupy osób niepełnosprawnych za wysoką jakość głosu. Rozwiązanie TVonics było zasadniczo dodatkiem programowym do istniejącej platformy i może być wdrażane jako aktualizacja oprogramowania dla klientów korzystających z istniejących produktów. TVonics wszedł do produkcji w czerwcu 2012 r. RNIB nabył podstawowy adres IP DVR , w tym system zamiany tekstu na mowę. Marka TVonics została kupiona przez firmę z Peterborough Puls ósmy .

Lista możliwych funkcji zamiany tekstu na mowę

  • Wstępna konfiguracja i konfiguracja — w przypadku podłączonych telewizorów może to obejmować konfigurację sieci , w tym uwierzytelnianie w sieci domowej.
  • Kontrola cyklu zasilania (włączanie, wyłączanie, czuwanie).
  • Zapowiedź aktualnie wyświetlanego kanału i programu oraz listy dostępnych kanałów.
  • Pomoc i informacje zwrotne dotyczące podstawowych funkcji odbiornika, takich jak zmiana kanału i regulacja głośności.
  • Wypowiadanie się na temat elektronicznego przewodnika po programach (EPG) i pomaganie użytkownikowi w poruszaniu się po EPG i innych listach usług i treści, w tym przeglądanie na żądanie, nadrabianie zaległości, wcześniej nagranych lub pobranych treści, jak również dostosowywanych przez użytkownika list (ulubione, itp.).
  • Komunikaty głosowe do zgłaszania i zmiany stanu usług dostępowych (np. audiodeskrypcja ).
  • Funkcje mówiące wspierające odtwarzanie i nagrywanie obejmują zarządzanie harmonogramem nagrywania.
  • Powiadomienie o pay-per-view i innych treściach objętych ograniczeniami, ograniczeniach i warunkach oraz kontrola nad tymi funkcjami, w tym mechanizmem autoryzacji.
  • Informacje zwrotne i kontrola banerów informacyjnych, okien dialogowych i menu na ekranie (w tym monitów modalnych i innych monitów poza pasmem).

Interakcja z interaktywnymi usługami i widżetami .

  • Dostosowanie funkcji mówienia.
  • Mówiąc o podręcznikach ekranowych i stronach pomocy.

Wskazówki dotyczące wdrażania i standaryzacji

Wczesna próba uchwycenia wymagań użytkowników i zdefiniowania specyfikacji funkcjonalnej została podjęta przez Digital TV Group (DTG) w Wielkiej Brytanii, która opublikowała białą księgę na ten temat. Biała księga została od tego czasu przesłana do publikacji UK Digital TV Usability and Accessibility Guidelines (znanej jako U-Book). Ta sama biała księga została również wykorzystana jako podstawa do dyskusji między grupami użytkowników niepełnosprawnych a DigitalEurope , europejskim organem branżowym zrzeszającym producentów sprzętu konsumenckiego, na temat zamiany tekstu na mowę dla telewizji. Strumień pracy DigitalEurope doprowadził do Międzynarodowa Komisja Elektrotechniczna (IEC) powołująca grupę projektową (IEC 62731) w celu stworzenia międzynarodowego standardu zamiany tekstu na mowę w telewizji cyfrowej. Pierwsza edycja normy, IEC 62731:2013, została oficjalnie opublikowana jako norma międzynarodowa w styczniu 2013 r. Norma nie narzuca implementacji, ale zawiera funkcjonalny opis tego, jak powinien zachowywać się produkt telewizyjny z funkcją zamiany tekstu na mowę i jakie powinny być wypowiedziane, gdy jest właściwie używane.