Alles over de Sitemap.xml

Sitemap.xml

 

Wat is een SiteMap.xml.

Allereerst wat is XML.
Dit zei WIKIPEDIA erover

Extensible Markup Language (XML) is een standaard van het World Wide Web Consortium
voor de syntaxis van formele ‘markuptalen’ waarmee men gestructureerde gegevens
kan weergeven in de vorm van platte tekst.
Deze representatie is zowel machineleesbaar als leesbaar voor de mens. Het XML-formaat
wordt gebruikt om gegevens op te slaan (zoals in het OpenDocument-formaat) en om
gegevens over het internet te versturen (zoals in AJAX).

Voorbeeld van een xml

<?xml version=”1.0″ encoding=”utf-8″?>
<speellijst name=”LijstVanMij” xml:lang=”nl”>
<lied>
<titel>Little Fluffy Clouds</titel>
<artiest>the Orb</artiest>
</lied>
<lied>
<titel>Goodbye mother Earth</titel>
<artiest>Underworld</artiest>
</lied>
</speellijst>

XML is een vereenvoudigde vorm van Standard Generalized Markup Language (SGML),
een complexe standaard om de structuur van documenten vast te leggen.
XML-talen gebruiken zogenaamde elementen en attributen om gegevens te structureren.
De XML-specificatie definieert de syntaxis van elementen, attributen en de andere
structuren die in XML-bestanden kunnen voorkomen.

De XML-specificatie legt echter geen namen vast voor deze elementen en attributen,
precies omdat deze keuze afhangt van het doel van het XML-bestand.
Een oudere van SGML afgeleide markuptaal is HyperText Markup Language (HTML). HTML
heeft voor een doorbraak in SGML-achtig vormgegeven tekst gezorgd, maar gegevens
die op een HTML-pagina staan zijn voor computers niet als zodanig te herkennen:
in HTML kan men bijvoorbeeld wel titels en paragrafen markeren (tekstuele structuur),
maar men kan niet vastleggen dat een bepaald gegeven een persoonsnaam, een telefoonnummer
of een datum is (betekenis of semantische structuur). Met XML kan men echter markuptalen
ontwikkelen waarmee dit wel kan.

Het mooie er van is vooral dat men eigen namen kan geven aan de tags zoals deze
<tekst>dit is mijn tekst</tekst> en wat er dat tussen staat, dat is
alleen belangrijk voor de ontvanger van het bericht.

Maar nu de sitemap.xml!

In mijn blog staat in het Engels het één en ander. Hier een verkorte nederlandstalige versie.
Waar wordt dit bestand voor gemaakt? Voor de zoekmachines zoals Google, Bing, Yahoo
enzo. Deze engines zoeken de site door en als daar een bestand is, met alle informatie
bijelkaar, vinden ze dat erg fijn en gebruiken dat.

Maar wat moet er instaan?

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″
xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″>
<url>
<loc>http://www.YourSiteName.com</loc>
<lastmod>2011-05-01</lastmod>
<changefreq>weekly</changefreq>
<priority>0.9</priority>
</url>
</urlset>

Er zijn altijd meerdere url tags, maar de </urlset> is altijd de laatste.
Het interessant na de URL-tag.
loc = location
lastmod = laatste keer gewijzigd
changefreq = Verander frequency : dagelijks, wekelijks, maandelijks, jaarlijks????
priority= van 0.1 tot 1.0 (gebruik geen komma zoals 0,5 maar punten )

Als u bijv. een contactformulier heeft dier erg belangrijk is voor u dan geeft u
dat zo aan:

<url>
<loc>http://www.YourSiteName.com/Contact_Us.aspx</loc>
<lastmod>2011-05-01</lastmod>
<changefreq>weekly</changefreq>
<priority>0.9</priority>
</url>

Het is erg handig dat u ook aangeeft dat er een plaatje op deze pagina staat!

<image:image>
<image:loc>http://www.YourSiteName.com/Images/Logical_ImageName.png</image:loc>
</image:image>

Gebruik png in plaats van jpg, Het is kleiner van formaat en zorgt ervoor dat uw
site site laadt.

<url>
<loc>http://www.YourSiteName.com/about_Us.aspx</loc>
<image:image>
<image:loc>http://www.YourSiteName.com/Images/Logical_ImageName.png</image:loc>
</image:image>
<lastmod>2011-05-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>

Er zijn verschillende tools beschikbaar, al dan niet gratis, op de pagina van tools.seobook