Duplikat treści

Zduplikowana treść to termin używany w dziedzinie optymalizacji pod kątem wyszukiwarek do opisania treści , które pojawiają się na więcej niż jednej stronie internetowej. Zduplikowana treść może stanowić znaczną część treści w obrębie domen lub między domenami i może być dokładnie zduplikowana lub bardzo podobna. Gdy wiele stron zawiera zasadniczo tę samą treść, wyszukiwarki , takie jak Google i Bing , mogą nałożyć karę lub zaprzestać wyświetlania kopiowanej witryny w odpowiednich wynikach wyszukiwania.

typy

Niezłośliwe

Niezłośliwe zduplikowane treści mogą zawierać odmiany tej samej strony, takie jak wersje zoptymalizowane pod kątem zwykłego kodu HTML, urządzeń mobilnych lub przyjazności dla drukarki, lub przechowywać elementy, które można wyświetlać za pośrednictwem wielu różnych adresów URL. Problemy ze zduplikowanymi treściami mogą również wystąpić, gdy witryna jest dostępna w wielu subdomenach, na przykład z „www” lub bez niego. lub gdy witryny nie obsługują poprawnie końcowego ukośnika w adresach URL. Innym powszechnym źródłem niezłośliwych zduplikowanych treści jest podział na strony , w którym treść i/lub odpowiednie komentarze są dzielone na osobne strony.

Syndykowana treść to popularna forma powielania treści. Jeśli witryna syndykuje treści z innych witryn, ogólnie uważa się, że ważne jest upewnienie się, że wyszukiwarki mogą stwierdzić, która wersja treści jest oryginalna, aby oryginał mógł uzyskać korzyści z większej widoczności w wynikach wyszukiwania. Sposoby na to obejmują umieszczenie tagu rel=canonical na stronie konsorcjalnej, który wskazuje z powrotem na oryginał, NoIndexing konsorcjalnej kopii lub umieszczenie łącza w konsorcjalnej kopii, która prowadzi z powrotem do oryginalnego artykułu. Jeśli żadne z tych rozwiązań nie zostanie wdrożone, konsorcjalna kopia może być traktowana jak oryginał i odnosić korzyści.

Liczba adresów URL możliwych do indeksowania generowanych przez oprogramowanie po stronie serwera również utrudnia robotom internetowym unikanie pobierania zduplikowanych treści. Istnieją nieskończone kombinacje HTTP GET (opartych na adresach URL), z których tylko niewielki wybór faktycznie zwróci unikalną treść. Na przykład prosta internetowa galeria zdjęć może oferować użytkownikom trzy opcje określone przez HTTP GET w adresie URL. Jeśli istnieją cztery sposoby sortowania obrazów, trzy opcje miniatur , dwa formaty plików i opcja wyłączenia treści dostarczonych przez użytkownika, to ten sam zestaw treści może być dostępny za pomocą 48 różnych adresów URL, z których wszystkie mogą być połączone na Strona. Ta matematyczna kombinacja stwarza problem dla robotów indeksujących, ponieważ muszą one sortować nieskończone kombinacje stosunkowo niewielkich zmian w skrypcie, aby pobrać unikalną treść.

Na różnych stronach internetowych mogą znajdować się podobne treści w postaci podobnych treści dotyczących produktów. Jest to zwykle zauważane w witrynach e-commerce, gdzie użycie podobnych słów kluczowych dla podobnych kategorii produktów prowadzi do tej formy niezłośliwych zduplikowanych treści. Dzieje się tak często, gdy pojawiają się nowe iteracje i wersje produktów, ale sprzedawca lub modyfikacje witryny e-commerce nie zawierają pełnych opisów produktów.

Złośliwy

Złośliwa zduplikowana treść odnosi się do treści celowo powielonych w celu manipulowania wynikami wyszukiwania i zwiększenia ruchu. Jest to znane jako spam w wyszukiwarce . Dostępnych jest wiele narzędzi pozwalających zweryfikować unikalność treści. W niektórych przypadkach wyszukiwarki nakładają kary na rankingi witryn i poszczególnych naruszających zasady stron na stronach wyników wyszukiwania (SERP) za zduplikowane treści uważane za „spam”.

Wykrywanie zduplikowanych treści

Postanowienia

Jeśli treść została skopiowana, istnieje wiele rozwiązań dostępnych dla obu stron.

Aby usunąć treść z witryny kopiarki, skontaktuj się z właścicielem zduplikowanej treści i poproś go o usunięcie skopiowanej treści.
Zatrudnij adwokata , który wyśle żądanie usunięcia treści do kopiarki.
Przepisz treść, aby treść witryny znów była wyjątkowa.

Przekierowanie HTTP 301 (301 Moved Permanently) to metoda radzenia sobie ze zduplikowanymi treściami w celu przekierowania użytkowników i robotów wyszukiwarek do jednej odpowiedniej wersji treści.

Zobacz też

Spinanie artykułów – Technika spamowania w celu optymalizacji pod kątem wyszukiwarek
Kanoniczny element linku – Typ hiperłącza
Deduplikacja danych – technika przetwarzania danych w celu wyeliminowania zduplikowanych kopii powtarzających się danych
Normalizacja adresów URL — proces, w ramach którego identyfikatory URI są standaryzowanymi