Pobieranie Ware

Pobieranie Ware
Deweloperzy Szybkie wyszukiwanie i przesyłanie , Convera , Excalibur Technologies, oprogramowanie ConQuest, Microsoft
Wersja stabilna
8.2 / 13 października 2006 ( 13.10.2006 )
Napisane w C , C++ , Jawa
System operacyjny Międzyplatformowe
Typ Wyszukiwanie i indeks

RetrievalWare to wyszukiwarka korporacyjna kładąca nacisk na przetwarzanie języka naturalnego i sieci semantyczne , która była dostępna na rynku od 1992 do 2007 roku i jest szczególnie znana z użytku przez rządowe agencje wywiadowcze.

Historia

RetrievalWare został pierwotnie stworzony przez Paula Nelsona, Kennetha Clarka i Edwina Addisona jako część ConQuest Software. Rozwój rozpoczął się w 1989 r., Ale oprogramowanie nie było dostępne na szeroką skalę komercyjną aż do 1992 r. Wczesne finansowanie zostało zapewnione przez Rome Laboratory w ramach grantu Small Business Innovation Research .

6 lipca 1995 roku ConQuest Software zostało połączone z firmą NASDAQ, Excalibur Technologies, a produkt został przemianowany na RetrievalWare. 21 grudnia 2000 r. firma Excalibur Technologies została połączona z Intel Corporation, tworząc Convera Corporation . Wreszcie, 9 kwietnia 2007 r., oprogramowanie i firma RetrievalWare zostały zakupione przez Fast Search & Transfer, po czym produkt został oficjalnie wycofany. Firma Microsoft Corporation nadal utrzymuje produkt dla swojej istniejącej bazy klientów.

Roczne przychody RetrievalWare osiągnęły najwyższy poziom w 2001 roku i wyniosły około 40 milionów USD.

Wykorzystanie technik języka naturalnego

RetrievalWare to system wyszukiwania tekstu według rankingu istotności z ulepszeniami przetwarzania zaczerpniętymi z dziedzin przetwarzania języka naturalnego (NLP) i sieci semantycznych . Algorytmy NLP obejmują stemming oparty na słownikach (znany również jako lematyzacja ) i identyfikacja fraz oparta na słowniku. Sieci semantyczne są używane przez RetrievalWare do rozszerzania słów zapytania wprowadzonych przez użytkownika na powiązane terminy z wagami terminów określanymi na podstawie odległości od pierwotnych terminów użytkownika. Oprócz automatycznego rozwijania dostępny był tryb sprzężenia zwrotnego, w którym użytkownicy mogli wybrać znaczenie słowa przed wykonaniem rozszerzenia. Pierwsze sieci semantyczne zostały zbudowane przy użyciu WordNet .

Ponadto RetrievalWare zaimplementował formę wyszukiwania n-gramowego (oznaczoną jako APRP - Adaptive Pattern Recognition Processing), przeznaczoną do przeszukiwania dokumentów z błędami OCR . Terminy zapytania są podzielone na zestawy 2-gramowe, które służą do zlokalizowania podobnie pasujących terminów z odwróconego indeksu . Wynikowe dopasowania są ważone na podstawie podobnych miar, a następnie wykorzystywane do wyszukiwania dokumentów.

Wszystkie te funkcje były dostępne nie później niż w 1993 roku, a oprogramowanie ConQuest twierdziło, że był to pierwszy komercyjny system wyszukiwania tekstu, który zaimplementował te techniki.

Inne godne uwagi funkcje

Inne godne uwagi funkcje RetrievalWare obejmują rozproszone serwery wyszukiwania, synchronizatory do indeksowania zewnętrznych systemów zarządzania treścią i relacyjnych baz danych , heterogeniczny model bezpieczeństwa, kategoryzację dokumentów , dopasowywanie zapytań do dokumentów w czasie rzeczywistym (profilowanie), wielojęzyczne wyszukiwania (zapytania zawierające terminy z wielu języków wyszukiwania dokumentów zawierających terminy z wielu języków) oraz wyszukiwania międzyjęzykowego (zapytania w jednym języku wyszukujące dokumenty w innym języku).

Uczestnictwo w TRECu

Firma RetrievalWare uczestniczyła w konferencji Text REtrieval Conference w 1992 (TREC-1), 1993 (TREC-2) i 1995 (TREC-4).

W TREC-1 i TREC-4 oprogramowanie RetrievalWare dla ręcznie wprowadzonych zapytań dało najlepsze wyniki w oparciu o 11-punktowe średnie ze wszystkich wyszukiwarek, które brały udział w kategorii ad hoc, w której wyszukiwarki mają jedną możliwość przetworzenia wcześniej nieznanych zapytania do istniejącej bazy danych.

Linki zewnętrzne