Kluczowe słowo w kontekście

Słowo kluczowe w kontekście ( KWIC ) to najpopularniejszy format wierszy konkordancji . Termin KWIC został po raz pierwszy ukuty przez Hansa Petera Luhna . System opierał się na koncepcji zwanej słowami kluczowymi w tytułach , która została po raz pierwszy zaproponowana dla bibliotek w Manchesterze w 1864 roku przez Andreę Crestadoro .

Indeks KWIC jest tworzony przez sortowanie i wyrównywanie słów w tytule artykułu, aby umożliwić wyszukiwanie alfabetyczne każdego słowa w tytule (z wyjątkiem słów pomijanych ) w indeksie. Była to użyteczna metoda indeksowania instrukcji technicznych, zanim powszechne stało się komputerowe wyszukiwanie pełnotekstowe .

Na przykład zapytanie zawierające wszystkie słowa z przykładowej definicji („KWIC jest akronimem słowa kluczowego w kontekście, najpopularniejszego formatu wierszy konkordancji”) i slogan Wikipedii w języku angielskim („wolna encyklopedia”), wyszukane na stronie Wikipedii, może dać indeks KWIC w następujący sposób. Indeks KWIC zwykle wykorzystuje szeroki układ, aby umożliwić wyświetlanie maksymalnej liczby informacji „w kontekście” (nie pokazano w poniższym przykładzie).

KWIC jest skrót od słowa kluczowego w kontekście, ... Strona 1
... słowo kluczowe w kontekście, najbardziej wspólny format wierszy konkordancji. Strona 1
... najpopularniejszy format dla linie zgodności . Strona 1
... to akronim słowa kluczowego w Kontekst , najpopularniejszy format ... Strona 1
Wikipedia, Wolny Encyklopedia strona 0
... W kontekście najczęściej format linii konkordancji. Strona 1
Wikipedii, Wolna encyklopedia strona 0
KWIC to skrót od kluczowe W kontekście najbardziej... Strona 1
  KWIC to akronim słów kluczowych... Strona 1
... wspólny format zgodności linie . Strona 1
... dla słowa kluczowego w kontekście, najpopularniejszy format konkordancji... Strona 1
  Wikipedia , wolna encyklopedia strona 0
KWIC to skrót od słowa klucz Słowo w kontekście, najczęściej... Strona 1

Indeks KWIC jest szczególnym przypadkiem indeksu permutowanego . Termin ten odnosi się do faktu, że indeksuje wszystkie cykliczne permutacje nagłówków. Książki składające się z wielu krótkich sekcji z własnymi opisowymi nagłówkami, w szczególności zbiory stron podręcznika , często kończyły się zmienioną sekcją indeksu, umożliwiającą czytelnikowi łatwe znalezienie sekcji po dowolnym słowie z jej nagłówka. Ta praktyka, znana również jako słowo kluczowe wyrwane z kontekstu ( KWOC ), nie jest już powszechna.

Odniesienia w literaturze

Uwaga: Pierwsze odniesienie nie pokazuje indeksu KWIC, chyba że zapłacisz za przeglądanie artykułu. Drugie odniesienie w ogóle nie wymienia artykułu.

  • David L. Parnas używa indeksu KWIC jako przykładu wykonywania projektowania modułowego w swoim artykule On the Criteria To Be Use in Decomposing Systems into Modules , dostępnym jako klasyczny artykuł ACM
  •   Christopher D. Manning i Hinrich Schütze opisują indeks KWIC i zgodność komputerową w sekcji 1.4.5 swojej książki Foundations of Statistical Natural Language Processing . Cambridge, Mass: MIT Press, 1999. ISBN 9780262133609 . Cytują artykuł HP Luhna z 1960 r. „Indeks słów kluczowych w kontekście literatury technicznej (indeks kwic)”.
  • Według Concordantia et Indices Missalium Romanorum ks. Gerarda O'Connora „Większość konkordancji powstałych w ostatnim czasie i przy pomocy oprogramowania komputerowego używa zarówno formatu KWIC (słowo kluczowe w kontekście), jak i KWICn (słowo kluczowe w środku), które wymienia słowo kluczowe, zwykle wyróżnione pogrubioną czcionką w spójnej pozycji, w ograniczonej ilości tekstu kontekstowego, tj. trzy [lub] cztery słowa tekstu poprzedzające słowo kluczowe i taką samą ilość tekstu następującego po nim. Ten format jest niezwykle przydatny, ponieważ słowo kluczowe można łatwo zidentyfikować wraz z kontekstem. ... Konkordancja Mszału Rzymskiego jest wydawana zarówno w formacie KWIC, jak i KWICn i jest godna uwagi, ponieważ każda forma słowa jest wymieniona tak, jak pojawia się w tekście, to znaczy nie jest lematyzowana”.

Zobacz też