Współcytowanie

Rysunek przedstawiający współcytowanie po lewej stronie i udoskonalenie współcytowania, Analiza bliskości współcytowania (CPA) po prawej stronie.

Współcytowanie to częstotliwość, z jaką dwa dokumenty są cytowane razem przez inne dokumenty. Jeżeli co najmniej jeden inny dokument cytuje dwa wspólne dokumenty, mówi się, że dokumenty te są współcytowane . Im więcej współcytowań otrzymują dwa dokumenty, tym większa siła ich współcytowania i tym większe prawdopodobieństwo, że są one powiązane semantycznie. Podobnie jak sprzężenie bibliograficzne , współcytowanie jest semantyczną miarą podobieństwa dokumentów, która wykorzystuje analizę cytowań .

Rysunek po prawej ilustruje koncepcję współcytowania i nowszą odmianę współcytowania, która odpowiada za umieszczanie cytatów w pełnym tekście dokumentów. Obraz po lewej stronie przedstawia dokumenty A i B, które są cytowane w dokumentach C, D i E; zatem Dokumenty A i B mają siłę współcytowania lub wskaźnik współcytowania wynoszący trzy. Wynik ten jest zwykle ustalany za pomocą indeksów cytowań . Dokumenty o dużej liczbie współcytowań są uważane za bardziej podobne.

Prawy obraz na rysunku przedstawia dokument cytujący, który cytuje Dokumenty 1, 2 i 3. Zarówno Dokumenty 1 i 2, jak i Dokumenty 2 i 3 mają siłę współcytowania równą jeden, biorąc pod uwagę, że są cytowane razem przez dokładnie jeden inny dokument . Jednak Dokumenty 2 i 3 są cytowane w dokumencie cytującym znacznie bliżej siebie w porównaniu z Dokumentem 1. Aby uczynić współcytowanie bardziej znaczącym miernikiem w tym przypadku, można wprowadzić indeks bliskości współcytowań (CPI ) . uwzględniać rozmieszczenie cytatów względem siebie. Dokumenty współcytowane w większych odległościach względnych w pełnym tekście uzyskują niższe wartości CPI. Gipp i Beel jako pierwsi zaproponowali użycie zmodyfikowanych wag współcytowania opartych na bliskości.

Henry Small i Irina Marshakova są uznawani za wprowadzenie analizy kocytowania w 1973 r. Obaj badacze wymyślili tę miarę niezależnie, chociaż Marshakova zyskała mniejsze uznanie, prawdopodobnie dlatego, że jej praca została opublikowana w języku rosyjskim.

Analiza współcytowania zapewnia wybiegającą w przyszłość ocenę podobieństwa dokumentów w przeciwieństwie do łączenia bibliograficznego, które ma charakter retrospektywny. Cytowania artykułu w przyszłości zależą od ewolucji dziedziny akademickiej, dlatego częstotliwość współcytowania może się zmieniać. Na sąsiednim diagramie, na przykład, Doc A i Doc B mogą być nadal współcytowane przez przyszłe dokumenty, na przykład Doc F i Doc G. Ta cecha współcytowania pozwala na dynamiczny system klasyfikacji dokumentów w porównaniu z Bibliographic Coupling .

Przez dziesięciolecia badacze proponowali warianty lub ulepszenia pierwotnej koncepcji współcytowania. Howard White przedstawił analizę współcytowania autora w 1981 r. Gipp i Beel zaproponowali analizę bliskości współcytowania (CPA) i wprowadzili CPI jako ulepszenie pierwotnej koncepcji współcytowania w 2009 r. Analiza bliskości współcytowania uwzględnia bliskość cytowań w pełnych tekstach do obliczenia podobieństwa, a zatem pozwala na bardziej szczegółową ocenę podobieństwa semantycznego dokumentu niż czyste współcytowanie.

Rozważania

Motywacje autorów do cytowania literatury mogą być bardzo różne i wynikać z różnych powodów, poza zwykłym odwoływaniem się do dokumentów o znaczeniu naukowym. Cole i Cole wyrazili tę obawę w oparciu o obserwację, że naukowcy częściej cytują przyjaciół i kolegów z badań, co jest stronniczością znaną jako kumoterstwo . Ponadto zaobserwowano, że prace akademickie, które już zyskały duże uznanie i reputację w danej dziedzinie, zwykle otrzymują jeszcze większe uznanie, a tym samym cytowania w przyszłej literaturze, obserwacja nazwana efektem Mateusza w nauce .

Zobacz też

CITREC , ramy oceny dla miar podobieństwa opartych na cytowaniach, w tym sprzężenie bibliograficzne , współcytowanie, analiza bliskości współcytowania i inne.