A Google Search Console rengetegféleképp segíti az életünket, ha egy weboldal tulajdonosai vagyunk. Az alkalmazása mára elengedhetetlenné vált, kiváltképp azok számára, akik szeretnének jól teljesíteni a Google találati listájában. Gyakran kapunk tőle azonban olyan üzeneteket, amelyek nem mindig érthetőek – ezek közül fejtünk meg néhányat ebben a cikkünkben.
A Search Console kiváló eszköz, amely igyekszik kommunikálni az irányunkba, ha SEO-szempontból valami nem megfelelően működik az oldalunkon. A teljesítményünk mérése mellett a honlapunk lefedettsége kapcsán is nyerhetünk belőle adatokat, az itt keletkezett problémák sokszor különböző, feltérképezéskor keletkezett hibákhoz vezethetők vissza. Ebben a cikkben körüljárjuk a leggyakoribb hibaüzeneteket a Search Console “Feltérképezés” menüpontján belül, hiszen ezek megismerése elengedhetetlenül fontos a gondjaink orvoslásához.
Indexelni, vagy nem indexelni: a legegyszerűbb esetek
Természetesen a legkönnyebb helyzet az, amikor az oldalaink a “Beküldött és indexelt” kategórián belül esnek, hiszen ez azt jelzi, a Google olyan oldalakat vett az indexébe, amelyeket mi küldtünk be neki a webhelytérképünkben ebből a célból. Az “Indexelve, nincs beküldve webhelytérképben” kifejezés is magáért beszél, ilyenkor a Google olyan oldalakat vett az indexébe, amiket mi nem küldtünk ugyan be webhelytérképen, de a botok megtalálták az oldalunkon, és értékesnek találták, ezért indexelték is. Érdemes lehet ilyen esetben ellenőrizni, hogy tényleg olyan oldalainkat kerültek-e az indexbe, amelyek hasznosak és értékesek a felhasználók számára, és nem például admin oldalak, amelyek csak a weboldal szerkesztői számára fontosak.
Ha egy oldalunk kizárásra került a Search Console-ból, az sem feltétlenül jelent okot a pánikra. Lehet, hogy mi rendelkeztünk így a robots.txt fájlban, vagy láttuk el az oldalt noindex címkével, ilyenkor javasolt az ilyen URL-eket is átnézni. Hasonlóan egyértelmű a helyzet, ha az “Átirányítást tartalmazó oldal” üzenetet látjuk magunk előtt – ezek egyszerűen azért nem kerülnek be az indexbe, mert más oldalra irányítják át a felhasználót, és a Google igyekszik eleve a céloldalt listázni a találatok között.
Egy fokkal biztosan problémásabb viszont a helyzet, ha a “Robots.txt által letiltott, beküldött URL’ csoportban találunk oldalakat. Ez ugyanis arra enged következtetni, hogy a Robots.txt fájlunk és a webhelytérképünk nincs összhangban, és olyan URL indexelését tiltottuk, amelyet magunk küldtünk be. Ebben az esetben lehetséges például, hogy bár a robots.txt fájlban tiltottuk egy admin oldal indexelését, az URL-t mégis beküldtük a webhelytérképen. Az is előfordulhat, hogy egy, a felhasználók számára teljesen értékes oldalt jogosan küldtünk be a webhelytérképen, és véletlenül tiltottuk a robots.txt fájlban. Ilyenkor érdemes megvizsgálni a szóban forgó oldalakat, és ha azokat valóban el szeretnénk zárni az indexelés elől, akkor el kell távolítani őket a webhelytérképből, ha pedig indexelnénk őket, akkor a robots.txt-ből. Adott esetben akár az is megtörténhet, hogy annak ellenére, hogy egy oldalt kizártunk robots.txt-vel, az erre mutató nagy számú belső és külső linkek miatt a Google értékes oldalnak ítéli, és ezért mégis indexelni kezdi. Ne feledjük: az indexelést a “noindex” címke használatával is tilthatjuk. Amennyiben tehát egy oldalunkat akarná indexelni a Google, amit mi nem szeretnénk, hogy az indexébe vegyen, az adott oldal forráskódjában a “noindex” címke alkalmazása javasolt.
Mitől lesz “lágy” a 404-es hiba?
Rengeteg weboldal esetében gyakori, visszatérő problémát okoz a jól ismert “404 – az oldal nem található” hibaüzenet. SEO szempontból erre azért fontos odafigyelnünk, mert amennyiben a Search Console ilyen problémát jelez, az azt jelenti, hogy a weboldalunkon vagy a webhelytérképünkben található olyan hivatkozás, ami jelenleg nem elérhető, 404-es oldalra visz. Amennyiben egy oldal esetében ez a probléma tartósan fennáll, esetleg a 404-es oldalak száma folyamatosan növekszik, szükséges lehet beavatkoznunk.
Az ilyen esetekben először mindig fel kell mérnünk, elérhető volt-e korábban az adott URL-en bármiféle oldal, és ha igen, akkor az milyen szerepet töltött be a honlapunk életében. Ha például egy már alapvetően megszűnt szolgáltatáshoz kötődő információk voltak rajta megtalálhatóak, akkor nem gond, hogy az oldal nem létezik, viszont érdemes eltávolítanunk a rá mutató belső linkjeinket és ki kell vennünk a webhelytérképből. Bizonyos oldalak, termékoldalak megszűnését követően érdemes lehet átirányítanunk a látogatót egy hasonlóan releváns oldalra, kiváltképp, ha a megszűnt oldal jelentős organikus forgalommal rendelkezett.
Gyakran előfordul azonban, hogy “lágy 404-es hibával” is találkozunk a Search Console hasábjain, ami rengeteg nyilvánvaló és jogos kérdést vethet fel. Ezek közül a legevidensebb: mit jelent a lágy 404-es hiba kifejezés? Általában az ilyen problémák az oldalak tartalmával kapcsolatosak. Sok esetben ugyanis a Google botjai számára gyanússá válhat, hogy egyes oldalak igazából 404-es oldalak, csak nem küldenek vissza tényleges 404-es válaszkódot.
Mindezt az olyan erre utaló jelelekből szűrik le, mint például az, hogy egy oldalon alig található szöveges vagy akár képes, videós tartalom, épp ezért nagyon fontos arra figyelnünk, hogy az oldalaink jól szövegezettek, tartalmasak legyenek. Ez nem csak a Google botjainak szempontjából, hanem a felhasználóink szemszögéből nézve fontos, hisz ne feledjük: a weboldalunkat az emberek, és nem a feltérképező botok számára hoztuk létre, előbbiek elvárásainak kell elsősorban megfelelnünk. Mindezek mellett lágy 404-es oldal lehet akár kifutott termékekhez kapcsolódó, vagy átmenetileg kifutott termékekhez kötődő termékoldal is, így az érintett termékek elérhetőségét is érdemes ellenőriznünk, ha ezzel a problémával találkozunk.
Mitől lesz egy oldal gyűjtőoldal, és mik azok a párhuzamos oldalak?
A Search Console hibaüzenetei gyakran emlegetnek úgynevezett “párhuzamos oldalakat”, például a “Párhuzamos oldal felhasználó által választott gyűjtőoldal nélkül” címke esetén. A helyzet feltáráshoz meg kell értenünk, mik is lehetnek ezek a párhuzamos oldalak, és hogyan is kell őket megfelelően kezelni.
A keresőbotok szempontjából nézve nem mindig könnyű megkülönböztetni az olyan oldalakat egymástól, amelyek tartalma nagyon nagy részben megegyezik. Ha például egy ruhaüzlet webshopját üzemeltetjük, előfordulhat, hogy egy termékünk, mondjuk egy puha, téli pulcsi több színben is elérhető. Ebben az esetben talán külön oldalon található a pulcsi piros változata, egy másik URL-en pedig a kék verziója érhető el. Ezek a termékek különböző oldalakon érhetőek el, azonban tartalmilag mégis nagyban megegyeznek. A különbséget köztük talán csak egy-egy kép vagy szó jelenti. Az ilyen helyzeteket mindenképp fontos jeleznünk a Google botjainak számára.
Épp ezért érdemes ezek közül egy gyűjtőoldalt kineveznünk, jelezvén a Google-nek, hogy melyik az elsődleges, puha téli pulcsinkkal kapcsolatos oldal, az összes többi ezzel párhuzamos oldal pedig ennek a majdnem tökéletes mása, amelyek talán csak egy picit térnek el tőle, a meglétük mégis fontos a felhasználók számára. Ilyen esetekben érdemes azt az oldalt kiválasztani gyűjtőoldalnak, amely a rendelkezésre álló adataink alapján a legnépszerűbb, vagy amelyhez kapcsolódó termékünk a legkelendőbbnek mondható. Az ehhez hasonló termékoldalakat lássuk el kanonikus taggel alábbi módon:
<link rel=”canonical” href=”https://example.com/dresses/green-dresses” />
A href attribútumunkban azon oldalunk URL-jét helyezzük el, amely gyűjtőoldalként fog funkcionálni az adott oldal számára!
Fontos tudunk, hogy adott esetben a Google is kiválaszthat a több, hasonló oldal közül egyet, amely szerinte gyűjtőoldalként funkcionálhat. A probléma az, hogy nem minden esetben tudja eltalálni a számunkra legkedvezőbb opciót, ezért is érdemes a kanonikus tag alkalmazásával a saját kezünkbe venni a gyeplőt, hogy a gyűjtőoldalt mi magunk határozhassuk meg, és ne essünk el egy fontosabb oldal indexelésétől.
A paginált oldalak is okozhatnak problémát
Hasonló problémákba ütközhetünk például paginált tartalmak esetén. Előfordulhat ugyanis, hogy a különböző tartalmi elemeink hosszas listáját több oldalon kell megjelenítenünk az átláthatóság és egyszerűség jegyében. Egy webáruház esetében például sokszor több oldalon jelennek meg egy adott kategóriába tartozó termékek – ha például a “pulóverek” menüpontra kattintunk, gyakran 3-4, vagy több oldalnyi pulcsit láthatunk magunk előtt.
A botok számára érdemes jeleznünk ebben az esetben, hogy a paginált oldalak egy sorozat tagjai, és ezek az elemek egymáshoz kapcsolódnak, így általában elég, ha ezek közül a legelső oldal indexelésre kerül. Ahhoz, hogy jelezni tudjuk, hogy a paginált oldalaink esetében egyedi oldalakról, és nem duplikációról van szó, érdemes önmagukra hivatkozó kanonikus tageket (“self referencing canonical tags”) elhelyeznünk rajtuk. Ezek szimpla kanonikus tagek, amelyek használatával az oldalak a saját URL-jükre hivatkoznak. Például az example.com/zoldruhak oldal esetében ez az alábbi módon nézhet ki:
<link rel=”canonical” href=”https://example.com/zoldruhak” />
Mindezek mellett érdemes paginációs tageket is alkalmazunk az ilyen oldalakon. Ezt a módszert, az utóbbi tag elhelyezését a Google ugyan korábban diszkreditálta – állításuk szerint nem kifejezetten figyelik már ezt az oldal feltérképezésekor -, ennek ellenére más alternatívát továbbra sem ajánlottak. Ráadásul más keresőmotorok számára (pl Bing) továbbra is fontos lehet a paginációs tagek alkalmazása, így ettől továbbra sem érdemes eltérnünk.
A paginációs tagek az alábbi módon alkalmazhatóak az oldalainkon:
Az első oldal fejrészében egy ilyen kódot, jelezvén a következő oldal URL-jét:
<link rel=”next” href=”http://www.example.com/article?story=abc&page=2″ />
A második oldalon pedig az előző és következő oldal URL-jét is meg tudjuk súgni a botoknak:
<link rel=”prev” href=”http://www.example.com/article?story=abc&page=1″ />
<link rel=”next” href=”http://www.example.com/article?story=abc&page=3″ />
Ezt követően így, ebben a szellemben haladunk tovább, egészen az utolsó oldalig, ahol nyilvánvalóan már csak az azt megelőző oldalra tudunk hivatkozni. Érdemes azt is megjegyeznünk, hogy ha WordPress oldalt használunk, akkor a Yoast plugin automatikusan elhelyezi a paginációs tageket a paginált oldalainkon (a cikk írásának időpontjában a plugin ingyenes verziója is képes erre).
Persze nem minden esetben kell a weboldalunk forráskódjában turkálni a probléma megoldáshoz. Előfordulhat, hogy a Google bizonyos oldalakat olyan esetben is párhuzamos oldalaknak néz, amelyek valójában különböznek egymástól, nem állnak szoros kapcsolatban. Ebben az esetben az oldalakon valószínűleg kevés egyedi tartalom található, így a botok szemével nézve tényleg nincs közöttük jelentős különbség ezen a téren. Ahhoz, hogy ezt elkerüljük, törekedjünk arra, hogy kellően informatív, jól szövegetett, tartalmakban gazdag, egyedi oldalakat hozzunk létre a honlapunkon! Ezek megléte – ahogy már írtuk – elsősorban a felhasználók számára fontos, akik az értékes tartalmakat díjazzák.
Összegzés: a megfelelő tartalom legalább annyira fontos, mint a technikai elemek
A fenti címkék és hibaüzenetek áttekintését követően látható, hogy a botok mindent megtesznek, hogy értelmezni tudják a weboldalunk tartalmát, és a lehető legkedvezőbben járjanak el a számunkra. Azonban fontos, hogy mi is megtegyünk mindent, hogy segítsünk nekik ebben. Paginált tartalmak esetén például jelezzük a paginációt az oldalunk forráskódjában, a kanonikus tagről pedig a párhuzamos oldalaink esetén se feledkezzünk meg! A robots.txt fájlunk és a webhelytérképünk mindig legyen összhangban, ne tiltsunk előbbiben olyan oldalakat, amelyeket a sitemap tartalmaz. Ugyanennyire fontos a megfelelő, egyedi, gazdag tartalom kialakítása az oldalainkon, így további problémák is elkerülhetők. Ne feledjük: ez esetben nem csak a hibaüzenetek száma fog csökkenni a Search Consoleban, az organikus forgalmunk terén és a felhasználók visszajelzéseit illetően is pozitív változásokat tapasztalhatunk majd.