Interfejs użytkownika w języku naturalnym
Interfejs użytkownika w języku naturalnym ( LUI lub NLUI ) to rodzaj komputerowego interfejsu użytkownika , w którym zjawiska językowe, takie jak czasowniki, frazy i klauzule, działają jako kontrolki interfejsu użytkownika do tworzenia, wybierania i modyfikowania danych w aplikacjach.
W projektowaniu interfejsów poszukiwane są interfejsy w języku naturalnym ze względu na ich szybkość i łatwość użycia, ale większość z nich ma trudności ze zrozumieniem wielu różnych niejednoznacznych danych wejściowych . Interfejsy języka naturalnego są aktywnym obszarem badań w dziedzinie przetwarzania języka naturalnego i lingwistyki komputerowej . Intuicyjny ogólny interfejs w języku naturalnym jest jednym z aktywnych celów sieci semantycznej .
Interfejsy tekstowe są „naturalne” w różnym stopniu. Wiele formalnych (nienaturalnych) języków programowania zawiera idiomy naturalnego języka ludzkiego. Podobnie, tradycyjna wyszukiwarka słów kluczowych może być opisana jako „płytki” interfejs użytkownika w języku naturalnym.
Przegląd
Wyszukiwarka w języku naturalnym teoretycznie znalazłaby ukierunkowane odpowiedzi na pytania użytkowników (w przeciwieństwie do wyszukiwania słów kluczowych). Na przykład, w obliczu pytania w formie „który USA ma najwyższy podatek dochodowy ?”, konwencjonalne wyszukiwarki ignorują pytanie i zamiast tego wyszukują słowa kluczowe „państwo”, „dochód” i „podatek”. Z drugiej strony wyszukiwanie w języku naturalnym próbuje wykorzystać przetwarzanie w języku naturalnym, aby zrozumieć naturę pytania, a następnie przeszukać i zwrócić podzbiór sieci, który zawiera odpowiedź na pytanie. Jeśli to zadziała, wyniki będą miały większą trafność niż wyniki z wyszukiwarki słów kluczowych, ze względu na uwzględnienie pytania. [ potrzebne źródło ]
Historia
Interfejsy Prototype Nl pojawiły się już na przełomie lat sześćdziesiątych i siedemdziesiątych.
- SHRDLU , interfejs w języku naturalnym, który manipuluje blokami w wirtualnym „świecie bloków”
- Lunar , interfejs w języku naturalnym do bazy danych zawierającej analizy chemiczne skał księżycowych Apollo-11 autorstwa Williama A. Woodsa .
- Chat-80 przekształcił angielskie pytania w wyrażenia Prologu , które zostały porównane z bazą danych Prologu. Kod Chat-80 był szeroko rozpowszechniany i stanowił podstawę kilku innych eksperymentalnych interfejsów Nl. Demo online jest dostępne na stronie internetowej LPA.
- ELIZA , napisana w MIT przez Josepha Weizenbauma w latach 1964-1966, naśladowała psychoterapeutę i była obsługiwana przez przetwarzanie odpowiedzi użytkowników na skrypty. Nie wykorzystując prawie żadnych informacji o ludzkich myślach ani emocjach, scenariusz DOCTOR czasami zapewniał zaskakująco ludzką interakcję. Demo online jest dostępne na stronie internetowej LPA.
- Janus jest również jednym z nielicznych systemów obsługujących pytania doczesne.
- Intelekt z Trinzic (utworzony przez połączenie AICorp i Aion).
- Parlance BBN zbudował na doświadczeniach z rozwoju systemów Rus i Irus .
- Dostęp do języka IBM
- Pytania i odpowiedzi od firmy Symantec .
- Datatalker firmy Natural Language Inc.
- Loqui z BIM Systems.
- Angielski Wizard z Linguistic Technology Corporation .
Wyzwania
Interfejsy w języku naturalnym w przeszłości prowadziły użytkowników do antropomorfizacji komputera lub przynajmniej do przypisywania maszynom większej inteligencji, niż jest to uzasadnione. Po stronie użytkownika doprowadziło to do nierealistycznych oczekiwań co do możliwości systemu. Takie oczekiwania utrudnią poznanie ograniczeń systemu, jeśli użytkownicy przypiszą mu zbyt duże możliwości, i ostatecznie doprowadzą do rozczarowania, gdy system nie będzie działał zgodnie z oczekiwaniami, jak miało to miejsce w zimie lat 70. i 80. XX wieku .
Artykuł z 1995 roku zatytułowany „Interfejsy języka naturalnego do baz danych – wprowadzenie” opisuje niektóre wyzwania:
- Załącznik modyfikujący
- Żądanie „Wymień wszystkich pracowników w firmie posiadających prawo jazdy” jest niejednoznaczne, chyba że wiesz, że firmy nie mogą mieć praw jazdy.
- Koniunkcja i dysjunkcja
- „Wymień wszystkich kandydatów, którzy mieszkają w Kalifornii i Arizonie” jest niejednoznaczna, chyba że wiesz, że dana osoba nie może mieszkać w dwóch miejscach jednocześnie.
- Rozdzielczość anafory
- określa, co użytkownik rozumie przez „on”, „ona” lub „to” w zapytaniu odnoszącym się do samego siebie.
Inne cele, które należy rozważyć bardziej ogólnie, to szybkość i wydajność interfejsu, we wszystkich algorytmach te dwa punkty są głównym punktem, który określi, czy niektóre metody są lepsze od innych, a zatem odnoszą większy sukces na rynku. Ponadto lokalizacja w wielu witrynach językowych wymaga dodatkowej uwagi — opiera się ona na różnej strukturze zdań i odmianach składni językowej w większości języków.
Wreszcie, jeśli chodzi o zastosowane metody, głównym problemem do rozwiązania jest stworzenie ogólnego algorytmu, który będzie w stanie rozpoznać całe spektrum różnych głosów, bez względu na narodowość, płeć czy wiek. Istotne różnice między wyodrębnionymi cechami – nawet od mówiących to samo słowo lub frazę – muszą być skutecznie przezwyciężane.
Zastosowania i zastosowania
Interfejs języka naturalnego daje początek technologii wykorzystywanej w wielu różnych zastosowaniach.
Niektóre z głównych zastosowań to:
- Dyktowanie jest obecnie najczęstszym zastosowaniem systemów automatycznego rozpoznawania mowy (ASR). Obejmuje to transkrypcje medyczne, dyktanda prawne i biznesowe oraz ogólne przetwarzanie tekstu. W niektórych przypadkach stosuje się specjalne słowniki w celu zwiększenia dokładności systemu.
- Systemy dowodzenia i kontroli , systemy ASR, które są przeznaczone do wykonywania funkcji i działań w systemie, są określane jako systemy dowodzenia i kontroli. Wypowiedzi takie jak „Otwórz Netscape” i „Rozpocznij nowy xterm” właśnie to zrobią.
- Telefonia , niektóre systemy PBX/ poczty głosowej umożliwiają dzwoniącym wydawanie poleceń zamiast naciskania przycisków w celu wysłania określonych tonów.
- Urządzenia do noszenia , ponieważ dane wejściowe są ograniczone w przypadku urządzeń do noszenia, mówienie jest naturalną możliwością.
- Medycyna, niepełnosprawność , wiele osób ma trudności z pisaniem z powodu ograniczeń fizycznych, takich jak urazy związane z powtarzającym się przeciążeniem (RSI), dystrofia mięśniowa i wiele innych. Na przykład osoby niedosłyszące mogą użyć systemu podłączonego do ich telefonu, aby przekonwertować mowę rozmówcy na tekst.
- Wbudowane aplikacje , niektóre nowe telefony komórkowe obejmują rozpoznawanie mowy C&C, które umożliwia wypowiedzi takie jak „zadzwoń do domu”. Może to być głównym czynnikiem w przyszłości automatycznego rozpoznawania mowy i Linuksa .
Poniżej wymieniono i zdefiniowano niektóre aplikacje, które wykorzystują rozpoznawanie języka naturalnego, a więc mają zintegrowane narzędzia wymienione powyżej.
Wszechobecność
Ubiquity, dodatek do przeglądarki Mozilla Firefox , to zbiór szybkich i łatwych poleceń pochodzących z języka naturalnego, które działają jak połączenie usług sieciowych, umożliwiając użytkownikom uzyskiwanie informacji i powiązanie ich z bieżącymi i innymi stronami internetowymi.
Wolfram Alfa
Wolfram Alpha to usługa online, która bezpośrednio odpowiada na zapytania dotyczące faktów, obliczając odpowiedź na podstawie danych strukturalnych, zamiast dostarczać listę dokumentów lub stron internetowych, które mogą zawierać odpowiedź, jak zrobiłaby to wyszukiwarka . Został on ogłoszony w marcu 2009 roku przez Stephena Wolframa i został upubliczniony 15 maja 2009 roku.
Siri
Siri to aplikacja inteligentnego asystenta osobistego zintegrowana z systemem operacyjnym iOS . Aplikacja wykorzystuje przetwarzanie języka naturalnego do odpowiadania na pytania i formułowania rekomendacji.
Marketingowe twierdzenia Siri obejmują, że z czasem dostosowuje się do indywidualnych preferencji użytkownika i personalizuje wyniki, a także wykonuje zadania, takie jak dokonywanie rezerwacji kolacji podczas próby złapania taksówki.
Inni
- Ask.com – Pierwotną ideą Ask Jeeves (Ask.com) było tradycyjne wyszukiwanie słów kluczowych z możliwością uzyskania odpowiedzi na pytania zadane w codziennym, naturalnym języku. Obecny Ask.com nadal to obsługuje, z dodaną obsługą pytań matematycznych, słownikowych i konwersyjnych.
- Braina – Braina to interfejs języka naturalnego dla systemu operacyjnego Windows , który umożliwia pisanie lub wypowiadanie zdań w języku angielskim w celu wykonania określonej czynności lub znalezienia informacji.
- GNOME Do – umożliwia szybkie znajdowanie różnych artefaktów środowiska GNOME (aplikacje, kontakty Evolution i Pidgin, zakładki Firefox, artyści i albumy Rhythmbox itd.) itp.).
- hakia – hakia była wyszukiwarką internetową. Firma wynalazła alternatywną nową infrastrukturę do indeksowania, która wykorzystywała algorytm SemanticRank, połączenie rozwiązań z dziedzin semantyki ontologicznej, logiki rozmytej, lingwistyki komputerowej i matematyki. hakia zamknięta w 2014 roku.
- Lexxe – Lexxe była wyszukiwarką internetową wykorzystującą przetwarzanie zapytań w języku naturalnym (wyszukiwanie semantyczne). Wyszukiwania można przeprowadzać za pomocą słów kluczowych, wyrażeń i pytań, takich jak „Ile lat ma Wikipedia?” Lexxe zamknął swoje usługi wyszukiwarek w 2015 roku.
- Pikimal – Pikimal używał języka naturalnego powiązanego z preferencjami użytkownika, aby tworzyć rekomendacje wyszukiwania według szablonu. Pikimal zamknięty w 2015 roku.
- Powerset - 11 maja 2008 r. Firma zaprezentowała narzędzie do przeszukiwania stałego podzbioru Wikipedii przy użyciu zwrotów konwersacyjnych, a nie słów kluczowych. 1 lipca 2008 roku został zakupiony przez Microsoft .
- Q-go – Technologia Q-go zapewnia użytkownikom trafne odpowiedzi na zapytania na firmowej stronie internetowej lub firmowym intranecie, formułowane zarówno w zdaniach naturalnych, jak i wprowadzanych słowach kluczowych. Q-go zostało przejęte przez RightNow Technologies w 2011 roku.
- Yebol - Yebol była pionową wyszukiwarką „decyzyjną”, która opracowała semantyczną platformę wyszukiwania opartą na wiedzy. Algorytmy sztucznej inteligencji firmy Yebol, oparte na ludzkiej inteligencji, automatycznie grupują i kategoryzują wyniki wyszukiwania, witryny internetowe, strony i treści, które są prezentowane w wizualnie indeksowanym formacie, który jest bardziej zgodny z początkowymi intencjami człowieka. Yebol wykorzystał algorytmy asocjacji, rankingu i grupowania do analizy powiązanych słów kluczowych lub stron internetowych. Yebol zintegrował przetwarzanie języka naturalnego, otwarte złożone systemy metasyntetyczne i algorytmy maszynowe z ludzką wiedzą dla każdego zapytania, aby stworzyć katalog internetowy, który faktycznie „uczy się”, używając algorytmów korelacji, grupowania i klasyfikacji do automatycznego generowania zapytania wiedzy, które było zachowane i zregenerowane do przodu.
Zobacz też
- Konwersacyjny interfejs użytkownika
- Naturalny interfejs użytkownika
- Programowanie w języku naturalnym
- Głosowy interfejs użytkownika
- Chatbot , program komputerowy symulujący ludzkie rozmowy
- Głośny tekst
- Odpowiadanie na pytanie
- Wyszukiwanie oparte na wyborze
- Wyszukiwanie semantyczne
- Zapytanie semantyczne
- Sieć semantyczna