Fișiere de jurnal, cum te pot ajuta la adaptarea bugetului

Analiza de fișiere de jurnal este una dintre acele sarcini pe care nu le puteți face deseori. De cele mai multe ori din cauza disponibilității datelor și a restricțiilor de timp.

Însă cu ajutorul acestor fișiere de jurnal, puteți obține informații pe care nu le puteți descoperi altfel. În special, dacă acel website este unul de dimensiuni mari.

Dacă nu ați făcut niciodată o analiză de jurnal sau nu sunteți sigur ce anume să căutați și unde să începeți, am creat un mic ghid care să vă poată fi de folos. Datele calitative obținute în acest fel pot fi extrem de utile.

Urmați acești pași pentru a putea începe:

  • Începeți cu unele instrumente de analiză a fișierelor de jurnal;
  • Înțelegeți pentru ce sunt utile aceste fișiere de jurnal;
  • Săpați în date și gândiți-vă cum să redistribuiți mai bine resursele de accesare.

Ce sunt aceste fișiere de jurnal?

Fișierele de jurnal sunt, în esență, un jurnal al tuturor cererilor adresate website-ului dvs. pentru o anumită perioadă de timp. Datele sunt foarte specifice și mai în profunzime decât ați putea obține de la o analiză Google Analytics și Google Search Console combinate.

Analizând aceste date, puteți cuantifica dimensiunea oricărei probleme potențiale pe care o descoperiți. Puteți lua decizii mai bune cu privire la ce să căutați și ce faceți mai departe.

De asemenea, puteți descoperi probleme precum comportamentul ciudat al crawlerelor pe care nu l-ați putea identifica printr-un audit SEO tehnologic obișnuit. Analiza jurnalului este deosebit de valoroasă pentru website-urile mari în care un crawler ar necesita o cantitate mare de timp și resurse.

Instrumente de analiză pentru fișiere de jurnal

Există diferite instrumente pentru această sarcină, Screaming Frog, Botify și BigQuery pentru a menționa câteva. Puteți folosi BigQuery, care este destul de flexibil.

Un loc minunat pentru a începe, dacă nu sunteți familiarizat cu analiza jurnalului este ghidul Dom Woodman, care a scris despre ce este o analiză a fișierului de jurnal.

Indiferent de instrumentul pe care alegeți să-l utilizați, ar trebui să puteți utiliza cadrul de mai jos.

Înțelegeți pentru ce sunt utile fișierele de jurnal

Fișierele jurnal sunt o sursă foarte bună pentru:

  • descoperirea potențialelor probleme. Folosiți-le pentru a găsi lucruri pe care nu le puteți face cu o rampă de analiză, deoarece acestea nu includ memoria istorică a Google;
  • identificați ce trebuie să fie o prioritate. Știind cât de des Google vizitează URL-urile, poate fi un mod util de prioritizare a lucrurilor.

Partea cea mai bună despre fișierele de jurnal este că acestea includ toate tipurile de informații despre care poate doriți să știți și multe altele.

Cod de răspuns la pagină? Ei au. Tip de fișier de pagină? Inclus. Tipul de crawler? Ar trebui să fie acolo. Aveți ideea. Dar până când nu tăiați datele în mod semnificativ, nu veți ști pentru ce sunt utile toate aceste informații.

Căutarea în date

Când începeți să analizați jurnalele, ar trebui să tăiați informațiile în bucăți mari pentru a obține o imagine generală bună a datelor. Acest lucru ajută să înțelegeți ce și unde trebuie să acordați prioritate.

Ar trebui să comparați întotdeauna rezultatele cu numărul de sesiuni organice obținute, deoarece ajută la stabilirea dacă bugetul de accesare ar trebui distribuit diferit.

Acestea sunt criteriile pe care le puteți folosi pentru a săpa în fișierul de jurnal:

  • Top 10 URL-uri/căi cele mai solicitate;
  • 200-cod vs. pagină non-200-cod;
  • Adrese URL cu parametri vs. non parametri;
  • Cereri de tip de fișier;
  • Cereri pe subdomeniu.

Înainte de a începe

În această etapă, ar trebui să decideți și un prag pentru ceea ce reprezintă un procent semnificativ din datele dvs. De exemplu, dacă descoperiți că există 20.000 de solicitări cu un cod de răspuns 301 și numărul total de solicitări pe jurnalele sunt de 2.000.000, atunci știind că cele 301 sunt doar 1% din totalul cererilor, vă ajută să încercați acest lucru ca o problemă cu prioritate scăzută.

Acest lucru s-ar putea modifica în funcție de tip. De exemplu, 10% din paginile de categorii cu un cod de stare 404 ar putea fi mai importante decât 10% din paginile de produse cu un cod 404.

După ce începeți să obțineți rezultate din datele dvs., ar trebui să luați în considerare dacă comportamentul crawler-ului curent este cea mai bună utilizare a resurselor de crawling.

Răspunsul la această întrebare vă va spune care ar trebui să fie următoarele acțiuni.

Top 10 URL-uri/căi, cele mai solicitate față de sesiunile organice pe care le conduc

Prin analiza fișierului de jurnal, veți descoperi adesea câteva căi sau adrese URL specifice care au avut o cantitate semnificativ mai mare de solicitări în comparație cu restul.

De obicei, acestea sunt URL-uri legate de majoritatea șabloanelor, de exemplu, din navigarea principală sau din subsol, sau din surse externe, dar nu conduc deseori un număr mare de sesiuni organice.

Puteți identifica noi surse de trafic organic.

În funcție de tipul de URL-uri, este posibil sau nu să aveți nevoie să luați măsuri. De exemplu, dacă 40% din resurse sunt utilizate pentru a solicita o adresă URL specifică. Este cea mai bună utilizare a resurselor de crawling sau ar putea fi distribuite mai bine?

Cod de răspuns la pagină

Pe baza dacă, un procent ridicat din cererile de jurnal este o pagină de cod non-200, poate doriți să săpați în această zonă în continuare. Aici ar trebui să vă întrebați datele pentru a descoperi care este defalcarea paginii de cod non-200. Pe baza rezultatelor săpate în continuare, faceți o prioritate din cele cu cel mai mare procent.

În acest caz, cercetați mai detaliat fiecare cod de stare pentru a descoperi din ce tip de pagini provin și ce procent reprezintă fiecare. Ca o notă laterală, dacă întâlniți, de asemenea, un număr mare de pagini cu un cod de stare 304, acesta este un răspuns al serverului în esență echivalent cu un cod de 200 de stări.

Răspunsul 304 indică faptul că pagina nu s-a schimbat de la transmisia anterioară.

Iată câteva verificări obișnuite pe care trebuie să le faceți pe paginile de cod care nu sunt 200:

  • există modele de legături interne care indică aceste pagini? O accesare cu crawlere a website-ului ar putea răspunde la acest aspect;
  • există un număr mare de legături/domenii externe care indică aceste pagini?
  • codul de stare al acestor pagini este cauzat de anumite acțiuni/situații? (adică pe website-urile de magazine online, produsele întrerupte pot deveni 404 de pagini sau 301 redirecționate către categoriile principale);
  • numărul de pagini cu un cod de stare specific se schimbă în timp?

URL-uri cu parametri vs. non-parametri

Adresele URL cu parametri pot provoca duplicarea paginii. De fapt, foarte des sunt doar o copie a paginii fără parametri, creând un număr mare de adrese URL care nu adaugă valoare website-ului.

Într-o lume ideală, toate adresele URL descoperite de crawler nu includ parametri. Totuși, acest lucru nu este în mod obișnuit și o cantitate bună de resurse de crawling sunt utilizate pentru a crawliza adresele URL cu parametri.

Ar trebui să verificați întotdeauna ce procentaj din adresele URL cu parametri alcătuiesc totalul.

După ce știi dimensiunea problemei, iată câteva aspecte care trebuie luate în considerare:

  • Care este codul de răspuns la paginile acestor adrese URL?
  • Cum sunt descoperite adresele URL cu parametri față de crawler?
  • Există legături interne către adrese URL cu parametri?
  • Ce chei de parametri sunt cele mai găsite și care sunt scopul lor?
  • În funcție de ceea ce descoperiți în această fază, pot exista acțiuni legate de etapele anterioare care se aplică aici.

Cereri tip de fișiere de jurnal

Verificați întotdeauna defalcarea tipului de fișier pentru a descoperi rapid dacă cererile către resurse precum imagini sau fișiere JavaScript constituie o porțiune mare.

Acesta nu ar trebui să fie cazul și într-un scenariu ideal, întrucât procentul cel mai mare de solicitări ar trebui să fie pentru tipul de pagini HTML, deoarece acestea sunt paginile pe care Google nu le înțelege doar, ci sunt și paginile pe care doriți să le clasificați bine.

Dacă descoperiți că, crawlerele cheltuiesc resurse considerabile pentru fișierele care nu sunt HTML, atunci aceasta este o zonă în care să săpați în continuare.

Iată câteva lucruri importante de investigat:

  • De unde sunt descoperite/legate resursele?
  • Trebuie să fie accesate cu crawlere sau trebuie doar utilizate pentru a încărca conținutul?

Ca de obicei, trebuie să țineți cont de cea mai importantă întrebare: este aceasta cea mai bună utilizare a resurselor de crawling? Dacă nu, atunci luați în considerare blocarea crawler-urilor de accesarea acestor resurse cu un scop de indexare.

Acest lucru se poate realiza cu ușurință blocându-le pe robots.txt, cu toate acestea, înainte de a face, ar trebui să verificați întotdeauna dacă este o soluție pentru dezvoltarea web eficientă.

Cereri pe subdomeniu

Este posibil să nu aveți nevoie de acest pas dacă nu aveți subdomenii. În caz contrar, aceasta este o verificare pe care ar trebui să o faceți pentru a descoperi un comportament neobișnuit.

În special, dacă analizați jurnalele unui domeniu specific, cererile către alte domenii ar trebui să fie oarecum limitate, în funcție de modul în care este organizată conectarea dvs. internă. De asemenea, depinde dacă Google vede subdomeniile ca website-ul dvs., mai degrabă decât un subdomeniu separat.

La fel ca în pașii precedenți, aceasta este prima defalcare a datelor dvs. Pe baza rezultatelor, ar trebui să știți dacă ceva merită săpat mai departe sau nu.

Câteva lucruri de reținut în această secțiune:

  • Ar trebui ca crawler-ul să petreacă mai puțin/mai mult timp pe subdomenii?
  • Unde sunt descoperite paginile de subdomeniu pe website-ul dvs.?

Aceasta ar putea fi o altă oportunitate pentru redistribuirea bugetului de accesare la paginile pe care doriți să le descopere crawler-urile. Este un aspect de optimizare SEO care nu poate fi trecut cu vederea.

Concluzii fișiere de jurnal

Ca și în cazul multor sarcini SEO, există multe modalități diferite de a face o analiză de jurnal. Ghidul pe care l-am distribuit este menit să vă ofere o metodă organizată, care vă ajute să vă gândiți la accesarea resurselor bugetare și cum să le utilizați mai bine.

Dacă aveți nevoie de o analiză SEO pentru website-ul dvs., sau alte servicii SEO, datele noastre de contact sunt la dispoziția dvs. Nu uitați că, website-ul este cartea dvs. de vizită în mediul online.

Lasă un comentariu