Sztuczny pasażer

Sztuczny pasażer to opracowane przez IBM urządzenie telematyczne , które wchodzi w interakcję werbalną z kierowcą, aby zmniejszyć prawdopodobieństwo zaśnięcia za kierownicą pojazdu. Opiera się na wynalazkach objętych patentem US 6,236,968. Podczas gdy urządzenie telematyczne wykonuje szereg funkcji, zbierając dane o lokalizacji pojazdu i aktywności oraz przekształcając je w informacje biznesowe. Również maszyna telematyczna działa poprzez przechwytywanie danych o lokalizacji pojazdu za pomocą urządzenia obsługującego GPS zainstalowanego w pojeździe. Sztuczny Pasażer jest przystosowany do angażowania operatora pojazdu poprzez prowadzenie rozmów, granie w gry słowne, sterowanie systemem stereo pojazdu i tak dalej. Monitoruje również wzorce mowy kierowcy w celu wykrycia zmęczenia iw odpowiedzi może zasugerować kierowcy zrobienie sobie przerwy lub przespanie się. Sztucznego Pasażera można również zintegrować z usługami bezprzewodowymi w celu dostarczania informacji o pogodzie i drogach, wskazówek dojazdu i innych podobnych systemów powiadomień.

Interfejs sterowania głosowego

Według Dimitri Kanevsky'ego, byłego badacza IBM, obecnie w Google, Sztuczny pasażer został opracowany przy użyciu systemu mowy Conversational Interactivity for Telematics (CIT), który polega na naturalnej mowie kierowcy zamiast użycia rąk. CIT opiera się na systemie rozumienia języka naturalnego (NLU), który jest trudny do opracowania ze względu na systemy komputerowe o niskim poborze mocy dostępne w samochodach. IBM sugeruje, aby ten system był umieszczony na serwerze i dostępny za pośrednictwem technologii bezprzewodowych samochodów. IBM twierdzi również, że pracuje nad „quasi-NLU”, który zużywa mniej zasobów procesora i może być używany w samochodzie. W skład systemu CIT wchodzi inny system o nazwie Dialog Manager (DM). DM przejmuje obciążenie systemu NLU poprzez interakcję z pojazdem, kierowcą i systemami zewnętrznymi, takimi jak systemy pogodowe, poczta elektroniczna, telefony i inne.

System NLU otrzymuje polecenie głosowe od kierowcy i przegląda system plików, aby wymyślić akcję do wykonania i ją wykonuje. DM współpracuje z pytaniami zadawanymi przez kierowcę, takimi jak „Jak daleko stąd jest lotnisko Gallatin Field?” System NLU nadal nie będzie w stanie zrozumieć wszystkiego, co mówi kierowca. Powodem tego są różne idiomy i dialekty różnych regionów. IBM pracuje nad opracowaniem systemu, który rozpoznaje, gdzie znajduje się kierowca, i rozpoznaje regionalną dykcję używaną na tym obszarze.

Innym systemem wykorzystywanym w ramach tej technologii jest system Learning Transformation (LT), który monitoruje działania osób znajdujących się w samochodzie i samochodów wokół niego, uczy się wzorców w mowie kierowcy i przechowuje te dane oraz uczy się na podstawie tych danych, aby spróbować poprawić wydajność technologii jako całości.

Rozpoznawanie mowy

Proces rozpoznawania mowy składa się z trzech etapów. Front-end odfiltrowuje wszelkie niepożądane dźwięki, takie jak hałas z samochodu, muzyka w tle lub pasażerowie w tle. Pozbywa się wszystkich rozpoznawanych sygnałów o niskiej energii i wysokiej zmienności. Etykietujący dzieli mowę i przeszukuje bazę danych, aby rozpoznać, co zostało powiedziane. Zaczyna się szeroko, sprawdzając, na jaki temat mówi kierowca. Następnie przechodzi do bardziej szczegółowych informacji na temat tego, o co tak naprawdę pyta kierowca. Następnie dekoder pobiera wszystkie te informacje i formułuje odpowiedź dla sterownika. IBM twierdzi, po wielu eksperymentach, że rozpoznawanie mowy jest bardzo dokładne, ale proces nie został w pełni udoskonalony i nadal ma w sobie załamania.

Główną częścią Sztucznego Pasażera jest destrukcyjne rozpoznawanie mowy. Technologia ta prowadzi rozmowę z kierowcą i analizuje, co i w jaki sposób mówi kierowca. Może rozpoznawać fluktuacje w głosie kierowcy, aby określić, czy kierowca jest śpiący, zdenerwowany lub w dobrym nastroju, poprzez różne wzorce wibracji w mowie kierowcy. Rejestruje również czas potrzebny kierowcy na odpowiedź w rozmowie i na tej podstawie określa, czy kierowca przysypia, czy też jest czymś rozproszony.

Zapobieganie senności kierowcy

Gdy komputer rozpozna, że ​​kierowca drzemie, wysyła sygnał do ingerencji. Komputer wkroczy, zmieniając radio, próbując bawić się z kierowcą lub otwierając okno, aby obudzić kierowcę. W ten sposób komputer chce poprawić ich czujność. Jeśli okaże się, że kierowca ciągle przysypia, system komputerowy jest zaprogramowany tak, aby poprosił o telefon do pobliskiego hotelu i zarezerwował pokój lub zasugerował kierowcy zrobienie sobie przerwy.

Sztuczny Pasażer będzie próbował czytać dowcipy, grać w gry, zadawać pytania lub czytać interaktywne książki, aby pobudzić kierowcę. Kierowcy, którzy wykazują większą senność, otrzymają treści bardziej stymulujące niż kierowca, który nie jest tak senny.

Dystrybucyjny interfejs użytkownika między samochodami

IBM zdaje sobie sprawę, że kierowca jest bardziej narażony na niebezpieczeństwo niż on sam. Proponuje się, aby Sztuczny Pasażer pracował między samochodami, przekazując między sobą informacje. Informacje mogą obejmować rejestry jazdy, aby pokazać, czy w przeszłości byli złymi kierowcami, lub analizę wszystkich kierowców na czas, aby pokazać, którzy z nich stają się senni i mogą zakłócać te informacje. Może również pokazać, czy kierowca jest rozpraszany przez gry lub urządzenia bezprzewodowe i przeszkadzać wszystkim kierowcom w pobliżu.

Zobacz też