Catpac

Catpac to program komputerowy, który analizuje próbki tekstu w celu zidentyfikowania kluczowych pojęć zawartych w próbce. Został wymyślony głównie przez Richarda Holmesa, programistę komputerowego ze stanu Michigan, oraz dr Josepha Woelfela , socjologa z uniwersytetów w Albany i uniwersytetów w Buffalo , w celu analizy formowania się postaw i zmian w kontekście socjologicznym. Wkład Roba Zimmelmana, studenta studiów licencjackich i magisterskich na Uniwersytecie w Albany, w latach 1981-1984 na komputerze mainframe Univac 1100, obejmował włączenie oprogramowania CATPAC do systemu Galileo*Telegal, etykietowanie tekstowe i przeniesienie danych wyjściowych CATPAC dla Galileo system wizualizacji koncepcyjnej z porównaniem par. CATPAC i system Galileo są nadal w użyciu komercyjnym, a dzięki niedawnemu wkładowi w gromadzenie danych i wizualizację nadal się rozwijają. Wkład innych studentów uniwersytetu zaowocował oprogramowaniem, które jest nadal używane komercyjnie. Wykorzystuje pliki tekstowe jako dane wejściowe i generuje dane wyjściowe, takie jak częstotliwości słów i liter, a także różne rodzaje analizy skupień.

Projekt

Catpac to samoorganizująca się , tj. nienadzorowana, interaktywna sztuczna sieć neuronowa aktywująca i współzawodnicząca (IAC) używana do analizy tekstu. Program generuje wielowymiarowe skalarne dane wyjściowe, porządkując słowa w całym tekście, tworząc ważoną macierz słowo po słowie, która określa centralne wektory własne pojęć. Matryca słowo po słowie przedstawia związek między jednym słowem a wystąpieniem innego. Catpac identyfikuje ważne słowa i wzorce na podstawie organizacji tekstu. Ten proces naśladuje połączenia między neuronami w ludzkim mózgu, wzmacniając połączenia poprzez warunkowanie, aby wygenerować wzór podobieństw między wszystkimi słowami w tekście.

Używać

Catpac był używany w badaniach komercyjnych, w badaniach naukowych do badania ogromnych zbiorów danych tekstowych, jako silne narzędzie do analizy sieci semantycznej, do analiz podłużnych, do analiz wielojęzycznych, jako predyktor wykorzystania mediów i jako potężne narzędzie do analizy treści.

Dostępność

Catpac, pomyślany ponad 30 lat temu jako ulepszenie prostego oprogramowania do liczenia słów, jest obecnie dostępny w 32-bitowym formacie Windows.

Linki zewnętrzne