Gerarda Saltona

Gerarda Saltona
Urodzić się ( 08.03.1927 ) 8 marca 1927
Zmarł 28 sierpnia 1995 ( w wieku 68) ( 28.08.1995 )
Alma Mater Uniwersytet Harwardzki
Znany z
ojciec nagrody Gerarda Saltona za wyszukiwanie informacji
Kariera naukowa
Pola wyszukiwanie informacji
Instytucje Uniwersytet Cornella
Praca dyplomowa   System automatycznego przetwarzania danych do rozliczania dochodów użyteczności publicznej (1958)
Doradca doktorski Howarda Aikena
Doktoranci

Gerard A. „Gerry” Salton (8 marca 1927 w Norymberdze - 28 sierpnia 1995) był profesorem informatyki na Uniwersytecie Cornell . Salton był prawdopodobnie czołowym informatykiem pracującym w dziedzinie wyszukiwania informacji w swoim czasie i „ojcem wyszukiwania informacji”. Jego grupa w Cornell opracowała SMART Information Retrieval System , który zainicjował, gdy był na Harvardzie. Był to pierwszy system wykorzystujący popularny obecnie model przestrzeni wektorowej do wyszukiwania informacji.

Salton urodził się jako Gerhard Anton Sahlmann 8 marca 1927 roku w Norymberdze w Niemczech . Uzyskał tytuł licencjata (1950) i magistra (1952) z matematyki na Brooklyn College oraz doktorat. z Harvardu w matematyce stosowanej w 1958 roku, ostatni z doktorantów Howarda Aikena , i wykładał tam do 1965 roku, kiedy dołączył do Cornell University i był współzałożycielem wydziału informatyki.

Salton był prawdopodobnie najbardziej znany z opracowania obecnie szeroko stosowanego modelu przestrzeni wektorowej do wyszukiwania informacji. W tym modelu zarówno dokumenty, jak i zapytania są reprezentowane jako wektory zliczeń terminów, a podobieństwo między dokumentem a zapytaniem określa cosinus między wektorem terminów a wektorem dokumentu. W tym artykule przedstawił również model TF-IDF , czyli częstotliwość odwrotnej częstotliwości dokumentu, w którym wynik terminu w dokumencie jest stosunkiem liczby terminów w tym dokumencie podzielonym przez częstotliwość liczbę dokumentów, w których występuje ten termin. (Koncepcja odwrotnej częstotliwości dokumentów, miary specyficzności, została wprowadzona w 1972 r. przez Karen Sparck-Jones .) Później zainteresował się automatycznym podsumowywaniem i analizą tekstu, a także automatycznym generowaniem hipertekstu. W swoim życiu opublikował ponad 150 artykułów naukowych i 5 książek.

Salton był redaktorem naczelnym Communications of the ACM i Journal of the ACM oraz przewodniczył Grupie ds. Wyszukiwania Informacji (SIGIR). Był zastępcą redaktora ACM Transactions on Information Systems . Był członkiem ACM Fellow (wybranym w 1995 r.), otrzymał nagrodę Award of Merit od American Society for Information Science (1989) i był pierwszym laureatem nagrody SIGIR Award za wybitny wkład w badania nad wyszukiwaniem informacji (1983) — obecnie nazywaną nagrodę Gerarda Saltona .

Bibliografia

  • Salton, Automatyczna organizacja i wyszukiwanie informacji , 1968.
  •   Gerarda Saltona (1975). Teoria indeksowania . Towarzystwo Matematyki Przemysłowej i Stosowanej. P. 56 . ISBN 9780898710151 .
  •   --- i Michael J. McGill, Wprowadzenie do nowoczesnego wyszukiwania informacji , 1983. ISBN 0-07-054484-0
  •   Gerarda Saltona (1989). Automatyczne przetwarzanie tekstu . Wydawnictwo Addison-Wesley. P. 530 . ISBN 978-0-201-12227-5 .
  • Gerard Salton z DBLP Bibliography Server Edit this at Wikidata
  • G. Salton, A. Wong i CS Yang (1975), „ A Vector Space Model for Automatic Indexing ”, Communications of the ACM , tom. 18, nr. 11, strony 613–620. (Artykuł, w którym przedstawiono model przestrzeni wektorowej)

Zobacz też

Linki zewnętrzne

  • Ku pamięci
  • Fraktale zmian: przeszukaj pasmo pamięci
  • Najbardziej wpływowy artykuł, którego Gerard Salton nigdy nie napisał - ten artykuł Davida Dubina dotyczący trendów bibliotecznych z 2004 r. Służy jako historyczny przegląd metamorfozy modelu wartości dyskryminacji terminowej (TDV) w model przestrzeni wektorowej jako model wyszukiwania informacji (VSM jako model IR ). Ten artykuł podaje w wątpliwość to, co społeczność badaczy zajmujących się wyszukiwaniem informacji uważała, że ​​model przestrzeni wektorowej Saltona miał pierwotnie modelować. To, co znacznie później stało się modelem wyszukiwania informacji, było pierwotnie zorientowanym na dane modelem matematyczno-obliczeniowym używanym jako narzędzie wyjaśniające. Ponadto artykuł Dubina wskazuje, że często cytowany artykuł Saltona z 1975 r. nie istnieje, ale jest prawdopodobnie połączeniem dwóch innych artykułów, z których żaden faktycznie nie odnosi się do VSM jako modelu IR.