Prohledat tento blog

čtvrtek 10. května 2012

O souboru sitemap. xml

Soubor Sitemap pomáhá indexovacím robotům poznat strukturu webových stránek a zajistit jejich lepší indexaci. Dále pak prohlížečům sděluje, jaká je jejich důležitost, a informuje o jejich aktualizaci. 
 
Každý soubor Sitemap může obsahovat maximálně 50 000 adres URL a rozbalený nesmí být větší než 50 MB. Je-li soubor Sitemap větší než uvedené hodnoty, doporučuje se rozdělit na několik menších souborů. Při vytváření souboru sitemap.xml je nutné dodržet protokol sitemaps.org.

Soubor sitemap.xml se ukládá do kořenového adresáře webu. Cestu k tomuto souboru lze také definovat v robots.txt: Sitemap: http://www.vase-domena.cz/sitemap.xml

Soubory Sitemap jsou obzvláště užitečné, pokud:
  • Vaše stránky mají dynamický obsah. 
  • Váš web obsahuje stránky, které nejsou během procházení prohledávačem Googlebot snadno zjistitelné – například stránky obsahující multimediální prvky AJAX nebo obrázky.
  • Stránky jsou nové a směřuje na ně málo odkazů. (Prohledávač Googlebot prochází web pomocí odkazů z jedné stránky na druhou. To znamená, že pokud webové stránky nejsou dobře propojené, může být pro nás obtížné je objevit.)
  • Váš web obsahuje rozsáhlý archiv stránek s obsahem, které nejsou dobře propojeny nebo na ně nevedou vůbec žádné odkazy.
Upozornění: Google nezaručuje, že bude procházet či indexovat všechny vaše adresy URL.

Ukázkový kód souboru sitemap.xml:

<?xml  version=“1.0“ encoding=“UTF-8“?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.vase-domena.cz/</loc>
<lastmod>2011-11-22</lastmod>
<changefreq>monthly</changefreq>
<priority>1</priority>
</url>
<url>
<loc>http://www.vase-domena.cz/o-nas.html</loc>
<lastmod>2011-11-22</lastmod>
<changefreq>monthly</changefreq>
<priority>0.7</priority>
</url>
</urlset>

Soubor Sitemap obsahuje povinné i volitelné parametry

Značka


Popis
<urlset> Povinná Uzavírá všechny informace o množině adres URL v souboru Sitemap.
<url> Povinná Uzavírá všechny informace o konkrétní adrese URL. Adresa URL stránky musí být v absolutním tvaru a končit zpětným lomítkem.

<loc> Povinná
Uvádí adresu URL. U obrázků a videí uvádí vstupní stránku (stránku přehrání, odkazující stránku). Adresa URL musí být jedinečná. Musí být kratší než 2 048 znaků.
<lastmod> Nepovinná Datum poslední úpravy adresy URL (uvedení času je volitelné).
<changefreq> Nepovinná Napovídá, jak často se stránka pravděpodobně bude měnit. Platné hodnoty jsou:
  • always (pokaždé) – Tuto hodnotu použijte pro stránky, které se mění při každém přístupu.
  • hourly (každou hodinu)
  • daily (denně)
  • weekly (týdně)
  • monthly (měsíčně)
  • yearly (ročně)
  • never (nikdy) – Tuto hodnotu použijte pro archivované adresy URL.
<priority> Nepovinná Popisuje prioritu adresy URL v porovnání se všemi ostatními adresami na daných stránkách. Tato priorita má rozsah od 1,0 (mimořádně důležité) do 0,1 (zcela nedůležité). 


Ukázky správného použití položky Priority:

0.8-1.0: Hlavní stránka, subdomény, informace o výrobcích nebo službách, hlavní vlastnosti výrobků, služeb. 
0.4-0.7: Články a příspěvky na blogu, stránky kategorií, časté otázky (FAQ). 
0.0-0.3: Neaktuální novinky, informace, které již nejsou relevantní, archivní zprávy, pozvánky na již konané akce atd.

Veškeré priority ze sitemap.xml slouží pouze k rozhodování robota v rámci webu. Nemají proto žádný vliv na pořadí stránek ve výsledcích hledání. Pokud má priorita pro robota něco znamenat, měla by se u jednotlivých URL lišit.

Soubor Sitemap lze použít také pro obrázky a pomocí něho Googlu sdělit další informace o obrázcích na adresách URL webu. Pomůžete tak Googlu objevit obrázky, které by jinak indexovací robot najít nemusel (například obrázky zobrazované pomocí formulářů v JavaScriptu). Také tímto způsobem lze označit, které obrázky na stránce jsou nejdůležitější.


Použitá literatura:

Google - Nástroje pro webmastery: O souborech sitemap.

Seznam Nápověda: Sitemaps.

Rick DeJarnette. "The Ultimate Guide to XML Sitemaps" (1. 5. 2012, Internet Marketing Ninjas).

Michal Kubíček, Jan Linhart, 333 tipů a triků pro SEO, Computer Press, a.s., Brno 2011.  



Žádné komentáře:

Okomentovat

Vážený uživateli,

používej blog k tématickým obsahům nikoliv k tvorbě obsahu, který s danným tématem nemá nic společného. Komentáře, které nesouvisí s obsahem napsaného článku nebudou publikovány nebo budou následně odstraněny.