Polska firma
SEO

Kluczowe czynniki maj膮ce wp艂yw na prawid艂owe indeksowanie si臋 strony internetowej

Dzia艂anie strony internetowej ma bezpo艣redni wp艂yw na stan jej zaindeksowania, kt贸ry jest procesem polegaj膮cym na zebraniu zawarto艣ci strony internetowej i przedstawieniu jej w wyszukiwarce. W trakcie indeksowania wszystkie tre艣ci, grafiki oraz linki trafiaj膮 do indeksu, kt贸ry jest baz膮 danych. Za przeprowadzanie tych czynno艣ci odpowiedzialny jest robot indeksuj膮cy, lecz zdarzaj膮 si臋 sytuacje, 偶e nie trafi on na nasz膮 stron臋 internetow膮. W贸wczas nale偶y znale藕膰 przyczyn臋 tej sytuacji i naprawi膰 wyst臋puj膮cy problem. Problemy z indeksowaniem mog膮 dotyczy膰 zar贸wno starej jak i nowej strony internetowej. W obu przypadkach mo偶na podj膮膰 skuteczne dzia艂a pozwalaj膮ce poprawi膰 obecn膮 sytuacj臋. Dlatego w tym artykule om贸wimy najwa偶niejsze czynniki maj膮ce wp艂yw na prawid艂owe indeksowanie si臋 strony internetowej.

Blokowanie indeksowania

Jest to dzia艂anie, kt贸re zawsze powinno dotyczy膰 nowych stron internetowych, kt贸re nie s膮 jeszcze uko艅czone. W贸wczas strona w wersji roboczej nie powinna by膰 pokazana 艣wiatu zewn臋trznemu, poniewa偶 mog艂aby stanowi膰 duplikat dla starej strony lub jej samej po przeniesieniu na docelow膮 domen臋 po zako艅czeniu prac programistycznych. Bezpiecznymi sposobami blokuj膮cymi indeksowanie jest wykorzystanie kodu Meta robots oraz plik robots.txt.

Meta Robots

Jest to fragment kodu, kt贸ry zawsze powinien znajdowa膰 si臋 w sekcji nag艂贸wkowej HEAD. Dyrektywa Meta robots blokuj膮cy indeksowanie ma tak膮 struktur臋:

<meta name="robots" content="parametr" />

Powy偶szy kod ma prost膮 struktur臋, kt贸ra mo偶e zawiera膰 r贸偶ne parametry wykazuj膮ce konkretne dzia艂anie:

  • all 鈥 pozwala zaindeksowa膰 wszystko, co znajduje si臋 na danej podstronie, podobne dzia艂anie ma zastosowanie jednocze艣nie index, follow,
  • index 鈥 strona b臋dzie indeksowana,
  • follow 鈥 zostan膮 zaindeksowane linki,
  • noindex 鈥 blokowanie wy艣wietlania strony w wyszukiwarce, powinna znale藕膰 zastosowanie podczas prac nad robocz膮 kopi膮 nowej strony internetowej,
  • nofollow 鈥 blokowanie indeksowania link贸w,
  • none 鈥 blokowanie indeksowania strony i link贸w, takie samo dzia艂anie ma zastosowanie jednocze艣nie noindex, nofollow,
  • noarchive 鈥 blokowanie zapisu strony w pami臋ci Cache wyszukiwarki przez co
  • nosnippet 鈥 blokowanie pokazywania kr贸tkiego opisu w wynikach wyszukiwania
  • max-snippet:[liczba] 鈥 okre艣lenie maksymalnej liczby znak贸w opisu wy艣wietlanego w wynikach wyszukiwania

Plik robots.txt

Plik ten zawsze powinien znajdowa膰 si臋 w g艂贸wnym katalogu witryny. Ma on prost膮 struktur臋, w kt贸rej okre艣lone s膮 parametry blokuj膮ce dost臋p robota indeksuj膮cego do danego katalogu strony internetowej. W robots.txt powinny si臋 znale藕膰 informacje o zezwoleniu dost臋pu do wybranych katalog贸w oraz 艣cie偶ce do mapy witryny:

Struktura strony internetowej i adresy URL

To jak zbudowana jest nasza strona internetowa znajduje odwzorowanie w zaindeksowanych wynikach. Dotyczy to wszystkich podstron, wpis贸w kategorii oraz tag贸w, lecz tutaj nie brakuje problem贸w. Wynikaj膮 one g艂贸wnie ze 藕le przemy艣lanej architektury strony, w kt贸rej cz臋艣膰 wpis贸w jest zduplikowana i nieprzypisana do 偶adnej kategorii lub jest i za du偶o. Dochodz膮 do tego jeszcze nieprzyjazne adresy URL, kt贸re mog膮 zawiera膰 automatyczne parametry. Dlatego struktura strony powinna by膰 nast臋puj膮ca:

Mapa witryny i Google Search Console

Mapa witryny jest plikiem XML, kt贸ry zazwyczaj ma nazw臋 sitemap.xml. W przypadku stron opartych na systemach CMS mapa witryny jest generowana przy wykorzystaniu wtyczek. Jednak mo偶na j膮 utworzy膰 r臋cznie samemu, lecz nale偶y pami臋ta膰 o jej aktualizacji po publikacji nowych wpis贸w lub podstron. Mapa witryny jest drogowskazem dla robot贸w indeksuj膮cych stron臋 internetow膮, poniewa偶 w sitemapie zawarte powinny by膰 wszystkie podstrony, kt贸re chcemy zaindeksowa膰.

Przyk艂adowa sitemapa ma tak膮 struktur臋:

Utworzenie sitemapy idzie w parze z dodaniem jej do narz臋dzia Google Search Console, kt贸re pe艂ni wa偶n膮 rol臋 w procesie indeksowania strony internetowej. To w艂a艣nie w Google Search Console jest mo偶liwo艣膰 sprawdzenia stanu indeksowania i weryfikacj臋 wyst臋puj膮cych b艂臋d贸w, o kt贸rych zostaniemy poinformowani. Przyk艂adem jest cho膰by ustawienie parametru noindex w zaindeksowanych podstronach lub pojawienie si臋 b艂臋d贸w 404. GSC powiadamia r贸wnie偶 o innych b艂臋dach zwi膮zanych z schema oraz wielko艣ci膮 element贸w na konkretnych podstronach:

Przydatn膮 funkcj膮 Google Search Console jest mo偶liwo艣膰 r臋cznego indeksowania podstron po zmianach, lecz efekt takiego dzia艂ania jest skorelowany z szeregiem czynnik贸w wymienionych przez nas czynnik贸w i czas jego trwania jest r贸偶ny. Zazwyczaj r臋czne indeksowanie powinno w przeci膮gu paru minut wprowadzi膰 zaktualizowan膮 stron臋 do indeksu.

Dodaj komentarz

Tw贸j adres e-mail nie zostanie opublikowany. Wymagane pola s膮 oznaczone *

Naszych Klient贸w stawiamy
na pierwszym miejscu!

Skontaktuj si臋 z nami

ul. Madali艅skiego 109/3
50-443 Wroc艂aw
+48 79 848 33 33

Porozmawiajmy
wi臋c o Twoich
potrzebach

Otrzymaj od nas bezp艂atn膮 wycen臋 w ci膮gu 24h
Skontaktuj si臋 z nami za pomoc膮 formularza
lub zadzwo艅 pod numer +48 79 848 33 33