Een paar maanden geleden is de nieuwe website van wetten.overheid.nl gelanceerd. De nieuwe layout is een stuk rustiger en ook zijn er een aantal verbeteringen op het gebied van gebruiksvriendelijkheid te constateren. Ook de vindbaarheid van de site in zoekmachines is toegenomen. De site van 2003 tot 2008 vrijwel onvindbaar in zoekmachines (zie 'lege resultaten' op: Wayback Machine), doordat de robots.txt toentertijd alle bots blokkeerde en de site opgebouwd was uit frames en javascript. Dit is allemaal aangepast naar de huidige webrichtlijnen en daarom heeft deze site nu het groene label 'waarmerk drempelvrij' gekregen. Wanneer je echter de zoekresultaten van de site in Google bekijkt, vallen er toch een aantal rare dingen op.
Online Toegangsroutes tot overheidsinformatie
De meeste mensen beginnen een internetsessie met een zoekopdracht in een zoekmachine, zelfs als ze al weten waar ze naartoe willen. Zo blijkt bijvoorbeeld uit de zoekmachine Ask Top 2008 Searches dat de term 'Google' heel vaak gezocht wordt. Dit terwijl mensen ook in hun browser http://www.google.com hadden kunnen invullen.
Zo werkt het ook voor overheidswebsites. Iemand die het 'artikel 350 wetboek van strafrecht' online wil raadplegen, zal dit óf via de interne zoekmachine op wetten.overheid.nl achterhalen óf de zoekterm direct in Google invoeren in de hoop dat de juiste pagina van wetten.overheid.nl tevoorschijn komt in de zoekresultaten. Beide routes naar deze informatie moeten zodanig geoptimaliseerd zijn dat de bezoeker weinig obstakels tegenkomt. Dit wordt enerzijds gedaan door de interne zoekmachine gebruiksvriendelijk en overzichtelijk te maken en anderzijds door ervoor te zorgen dat de pagina's goed geoptimaliseerd en toegankelijk zijn voor robots van 'algemene' zoekmachines zoals Google. In dit stuk zal ik ingaan op het gebruik van 'algemene' zoekmachines en niet op de werking van de interne zoekmachine van wetten.overheid.nl.
Gebruiksvriendelijk is óók zoekmachinevriendelijk
Zoals Michel Vennema in zijn betoog over 'de taak van de e-overheid' stelt, moet de overheid rekening houden met de beperkte digitale vaardigheden van burgers. Toegang tot informatie moet eenvoudig zijn en zoekmachines als Google kunnen hier uitstekend bij helpen.
Nu blijkt bij ons voorbeeld dat de top 10 in Google voor de zoekterm 'artikel 350 wetboek van strafrecht' vooral wordt gedomineerd door sites met advertenties die ooit content vanuit het wetboek hebben gekopieerd. Het is dus voor mensen niet duidelijk of de informatie op deze sites betrouwbaar en/of up-to-date is. Er staat inderdaad een resultaat in de top 10 van wetten.overheid.nl, maar deze is vrijwel onherkenbaar (zie figuur 1).
figuur 1
Het zoekresultaat van wetten.overheid.nl uit figuur 1 is onduidelijk omdat de opmaak van de HTML-title, meta-description en URLs weinig informatief is voor bezoekers. Bovendien blijkt, wanneer je op het zoekresultaat klikt, dat je niet uitkomt op de pagina over artikel 350, maar op de landingspage van het Wetboek van Strafrecht.
Webrichtlijnen R-pd.4.3, R-pd.18.1 en R-pd.4.6
De URL-structuur van de Artikel 350 pagina op wetten.overheid.nl biedt weinig duidelijkheid:
http://wetten.overheid.nl/BWBR0001854/TweedeBoek/TitelXXVII/Artikel350/geldigheidsdatum_09-06-2009
Het is mij ten eerste niet duidelijk dat het om het wetboek van strafrecht gaat. De term BWBR0001854 mag misschien een handige referentie (?) zijn voor ambtenaren en juridisch geschoolde personen, maar het is voor mij als burger weinig informatief. Het gebruik van codes als BWBR0001854 in de URL en Title druist in tegen webrichtlijnen R-pd.4.6 'Gebruik vriendelijke URL's, die leesbaar en herkenbaar zijn' en R-pd.18.1 'Gebruik voor iedere pagina een unieke, beschrijvende titel'.
Ik had eerder één van de volgende URL-structuren verwacht:
http://wetten.overheid.nl/Wetboek-van-Strafrecht/TweedeBoek/TitelXXVII/Artikel350/
http://wetten.overheid.nl/WVS/TweedeBoek/TitelXXVII/Artikel350/
http://wetten.overheid.nl/Sr/TweedeBoek/TitelXXVII/Artikel350/
http://wetten.overheid.nl/Wetboek-van-Strafrecht/Artikel350/
Een ander serieus probleem van de huidige URL-structuur is het gebruik van een 'geldigheidsdatum'. Zoals in webrichtlijn R-pd.4.3 'Vermijd het gebruik van sessies in URL's' staat beschreven, kun je de geldigheidsdatum ook als een soort sessieid zien (vanuit het oogpunt van zoekmachines). Immers, iedere dag krijgt dezelfde pagina een nieuwe, 'geüpdatet' URL. Deze pagina's worden weer vrolijk geïndexeerd door zoekmachines alsof het nieuwe content is. De gevolgen hiervan zijn vrij ernstig:
- Voor iedere pagina van wetten.overheid.nl bestaan er diverse klonen, zo ook van onze artikel 350 pagina. Niet alleen zorgt dit voor onnodig veel duplicate content in zoekmachines, maar het kan ook leiden tot ranking penalties in zoekmachines, waardoor overheidsinformatie juist moeilijker gevonden kan worden.
- Het is niet mogelijk om naar één vaste pagina te linken. Wanneer je direct naar artikel 350 wilt linken, moet je een url nemen met een geldigheidsdatum erin. Zo krijgt in ons voorbeeld iedere kloon van artikel 350 een eigen verzameling met backlinks, waardoor het duplicate content probleem er niet beter op wordt. Ramon Eijkemans had hier in 2007 ook al over in zijn stuk 'Webrichtlijnen en SEO'.
- Zoekmachines bepalen rankings mede op basis van links naar een pagina. Is er een bepaalde kloon van artikel 350 met veel links vanaf andere websites, dan is het resulaat dat deze pagina de hoogste ranking zal behalen. Het gevolg is dat bezoekers een resultaat zien met een 'geldigheidsdatum' van bijvoorbeeld een jaar geleden. Dit roept vervolgens weer twijfels op bij de bezoeker: Is de informatie op die pagina wel up-to-date? Doe ik het wel goed?
Mijn advies is om de geldigheidsdatum uit de URLs te halen en alle pagina's een permanente url te geven. De geldigheidsdatum staat namelijk ook gewoon op de pagina zelf.
Zoekmachinevriendelijk alternatief
Het huidige zoekresultaat voor de Artikel 350 pagina in Google ziet er als volgt uit:

De overheid kan de informatie op de website eenvoudig structureren door gebruik te maken van een aantal pagina elementen, zoals de h3 en h2 op de pagina's. Dit maakt het automatisch optimaliseren van alle pagina's mogelijk:
<h2>Wetboek van Strafrecht</h2>
<h3 class='artikel-kop'>Artikel 350</h3>
(zie broncode van de pagina over artikel 350)
Door de H2 en H3 elementen van een pagina te gebruiken kun je een mooie titel formuleren:
voorbeeld:
[h3] - [h2] | [code] | Wetten.nl
resultaat:
Artikel 350 - Wetboek van Strafrecht | BWBR0001854 | Wetten.nl
Ook de meta-description kan op deze manier informatiever worden geformuleerd:
voorbeeld:
Bekijk hier de beschrijving van [h3] van het [h2]. Dit is de officiële website voor informatie over Nederlandse wet- en regelgeving.
Het totale zoekresultaat zoals hoe Google het waarschijnlijk weer zal geven is (Title; Meta-Description; URL):

Dit is niet alleen veel duidelijker voor mensen die door zoekresultaten scannen, het is ook een stuk duidelijker voor zoekmachines, wat waarschijnlijk beloond zal worden met hogere rankings voor gerelateerde zoekopdrachten. Overheid.nl is immers een website met grote autoriteit vanuit het oogpunt van zoekmachines.
Afsluitend
Ik heb de website wetten.overheid.nl als voorbeeld genomen. Er zijn natuurlijk genoeg andere (semi-)overheidswebsites die tegen dergelijke problemen aanlopen. Meer aandacht is nodig voor het formuleren van 'duidelijke en herkenbare' Titles en Meta-Descriptions en andere webrichtlijnen van de categorie 'optimalisatie voor zoekmachines'. Dit zal de toegankelijkheid van publieke informatie en de vindbaarheid van overheidswebsites in het algemeen ten goede komen.
(1) reactie
Interessant artikel. Het is natuurlijk belachelijk dat een overheidssite zo'n slechte presentatie heeft.
Heb je al eens naar http://www.onderzoekscommissie-irak.nl gekeken? Ik weet niet of dit nu officieel een overheidswebsite genoemd mag worden, maar het zit wel vreemd in elkaar. Een CMS, Cimple CMS genaamd, bouwt in 'moderne' browsers alle markup dynamisch op (vergelijk de verzonden HTML (leeg <body>-element) maar eens met een DOM-inspector). Die markup lijdt overigens aan een ernstige vorm van divitis. Heb ik JavaScript al dan niet bewust uitgeschakeld, dan zie ik helemaal niets. En tijdens de opbouw wordt ook nog een verkeerde redirect (302, moet hier 301 zijn) gebruikt, maar goed. Ik vrees het ergste v.w.b. de toegankelijkheid van deze site (schermvoorlezers en braille-leesregels).
Een tekstbrowser als Lynx, de Validator van W3C en Google krijgen daarentegen wèl een normale HTML-pagina gestuurd, althans, eentje met heel domme fouten (vele malen id="TopLink" gebruiken, bijvoorbeeld). Bizar.
Reageer
Laat zien wie je bent met een Gravatar. Hiervoor dien je wel je e-mail adres in te voeren, deze zal echter nooit getoond worden. HTML is niet toegestaan. Een URL in je reactie toevoegen werkt wel.
