Agencja marketingowa » Słownik Marketingowy » Co to jest Canonical?
Co to jest Canonical?
Canonical (link kanoniczny, rel=”canonical”, canonical URL tag) – Ten tag HTML to jeden z tych, które można umieścić w nagłówku strony. Jest on przydatny do oznaczania głównej, oryginalnej wersji strony. Ta metoda jest skutecznym sposobem na ograniczenie problemu duplikacji treści oraz informowanie robotów wyszukiwarek, która strona zduplikowana zawiera oryginalną treść.
Linki kanoniczne a roboty Google
Google, w swoim artykule na portalu Google Search Central, omawia proces wybierania wersji kanonicznej przez algorytm spośród zidentyfikowanych duplikatów tej samej strony. Jeśli nie sprecyzujemy jasno, która strona jest oryginalna, Google podejmie tę decyzję za nas.
W przypadku robotów Google, strony nie muszą być identyczne w stu procentach, aby zostały uznane za duplikaty. Niewielkie modyfikacje polegające na wprowadzeniu zmian w liście (np. dla stron zawierających sortowanie) nie spowodują, że dany adres URL będzie uznany za unikatowy. Jeśli nie określimy samodzielnie, który link kanoniczny wybieramy jako najbardziej reprezentatywny dla zbioru duplikatów, Google podejmie tę decyzję za nas. Tag rel canonical służy jedynie jako sugestia, a ostateczny wybór należy do wyszukiwarki Google.
Link kanoniczny a duplicate content
Głównym celem stosowania linków kanonicznych jest minimalizowanie problemu powtarzalności treści, zwanej również duplikacją treści. Często wielu właścicieli stron internetowych nie zdaje sobie sprawy z istnienia poważnego problemu, jakim jest duplikacja wewnętrzna. Jej działanie skutecznie utrudnia osiągnięcie wysokich pozycji w rezultatach wyszukiwania.
Przykładem dobrze znanej duplikacji wewnętrznej jest sytuacja, która często ma miejsce w przypadku sklepów internetowych. W takich przypadkach ta sama zawartość może być wyświetlana pod różnymi adresami URL. Najczęściej występuje to, gdy filtracja produktów w sklepie generuje adresy URL z dodatkowymi parametrami.
https://przykladowy-sklep-odzieżowy.pl/kategoria/bluzy – adres oryginalny (kanoniczny)
https://przykladowy-sklep-odzieżowy.pl/kategoria/bluzy?kolor=czarne – adres z parametrem „kolor=czarne”
https://sklep-odzieżowy.pl/kategoria/bluzy?material=bawełna – adres z parametrem „material=bawełna”
W powyższym przykładzie każda strona ma tylko różnice w liście wyświetlanych produktów w listingu, pozostałe elementy strony pozostają bez zmian. Aby roboty Google uwzględniały tylko oryginalną wersję, istotne jest określenie głównej strony kategorii jako kanonicznej. W kodzie strony oryginalnej istnieje możliwość dodania adresu URL, który odnosi się do tej samej strony (self-referencing canonical).
W przypadku sklepów internetowych często spotykamy się z powielonymi treściami, takimi jak identyczne nagłówki czy opisy na stronach kategorii z możliwością sortowania produktów. W takiej sytuacji ważne jest, aby oznaczyć duplikaty za pomocą tagu canonical.
https://przykladowy-sklep-odzieżowy.pl/kategoria/bluzy/1/default/3 – adres URL z sortowaniem po cenie w CMS Shoper
https://przykladowy-sklep-odzieżowy.pl/kategoria/bluzy/1/default/2 – adres z sortowaniem po nazwie w Shoper
Canonical w nagłówku HTTP
Istnieje możliwość ustalenia adresu kanonicznego dla zasobów, które nie są plikami HTML. W sytuacji, gdy treść pliku PDF jest taka sama lub bardzo podobna do zawartości strony internetowej, Google może ustalić, że plik PDF jest kanonicznym źródłem informacji. W efekcie to właśnie ten plik będzie wyświetlany w wynikach wyszukiwania.
W przypadku takiej sytuacji zalecanym rozwiązaniem jest oznaczenie strony kanonicznej przez dodanie rel = „canonical” w niestandardowym nagłówku HTTP.
<Files bluza-z-kapturem.pdf>
Header add Link '<https://przykladowy-sklep-odzieżowy.pl/bluza-z-kapturem.html>; rel=”canonical”’
</Files>
Aby spersonalizować nagłówek w pliku . htaccess, który będzie dotyczył wszystkich plików PDF o określonej nazwie niezależnie od ich położenia, należy dodać niestandardową konfigurację. Zalecane jest utworzenie osobnego pliku . htaccess w katalogu, gdzie znajduje się interesujący nas dokument, a następnie umieszczenie w nim odpowiednich nagłówków.
Duplikaty w Google Search Console
W Google Search Console istnieje możliwość sprawdzenia duplikatów stron za pomocą raportu „Stan – Wykluczono”.
Canonical w źródle strony internetowej
W nagłówku strony HTML, w miejscu, gdzie znajdują się meta tagi takie jak tytuł, opis czy meta robots, należy umieścić linki kanoniczne.
W atrybucie rel=”canonical” należy umieścić kanoniczny adres, czyli adres oryginalny strony zawierającej identyczną treść.
Adres kanoniczny może być ustawiony także w nagłówku HTTP zamiast tagu HTML.