Duplicate Content Gids

Voor het ranken van een website in zoekmachines als Google, is goede techniek achter de website van groot belang. Het goed optimaliseren van een website begint al voorafgaand aan de bouw van de website, zeker bij grote websites en webshops. Eén van de grootste technische (SEO) uitdagingen bij de bouw van een website is het bestrijden van het fenomeen ‘duplicate content’. In dit artikel leg ik uit wat duplicate content is en hoe je dit kunt oplossen én voorkomen.

In dit artikel geeft ik voorbeelden van een aantal grote sites waar Insyde niet aan gelieerd is. Ruim 95% van de grote sites heeft namelijk op één of andere manier last heeft van duplicate content. De voorbeelden in dit artikel willen dus niet zeggen dat deze sites ‘niet goed’ in elkaar zitten, maar geven juist aan dat duplicate content een alledaags probleem is in de wereld van zoekmachines en SEO.

Inhoudsopgave:

  1. Wat is duplicate content?
  2. Hoe kijkt een zoekmachine als Google naar duplicate content?
  3. Hoe ontstaat duplicate content?
  4. Hoe kan ik duplicate content issues analyseren voor mijn site(s)?
  5. Oplossingen: duplicate content opruimen
  6. Wat zijn de SEO best practices om duplicate content te voorkomen?
  7. Hulp bij duplicate content oplossen

Duplicate Googlebot

1. Wat is duplicate content?

De term duplicate content of ‘dubbele content’ verwijst naar de situatie waarbij identieke content beschikbaar is op meerdere adressen (URLs), waarbij zoekmachine robots toegang hebben tot deze URLs. Hierdoor ontstaan er meerdere zoekresultaten in Google en andere zoekmachines, die verwijzen naar pagina’s met identieke inhoud.

2. Hoe kijkt een zoekmachine als Google naar duplicate content?

Duplicate content hoeft niet te betekenen dat er sprake is van 100% dezelfde content. Waarschijnlijk houdt Google een bepaald percentage aan om aan te geven of een pagina een duplicate is. Bijvoorbeeld: als 90% van de content identiek is, wordt de content als duplicate of als ‘niet origineel’ beschouwd. Duplicate content is een probleem dat zoveel mogelijk vermeden moet worden om er zeker van te zijn dat Google de content indexeert en als voldoende origineel beoordeelt. De term duplicate content moet je letterlijk nemen: zodra je een stuk tekst gaat herschrijven in eigen woorden, dan is er géén sprake van duplicate content.

Wanneer Google een pagina als 100% duplicate content beschouwt dan komt deze in de secundaire index terecht. De secundaire index zijn zoekresultaten onder de link ‘de zoekopdracht herhalen met de weggelaten resultaten‘:

De secundaire zoekindex van Googl

Het plaatsen van identieke content op meerdere pagina’s of domeinen was een oude techniek eind jaren ’90 om goed te ranken in zoekmachines. Zo was het mogelijk om met een aantal domeinen met exact dezelfde content de gehele top 10 positie te bezetten. Google heeft een einde gemaakt aan deze praktijk omdat:

  1. De bezoeker een slechte gebruikerservaring krijgt (steeds dezelfde content)
  2. Het Google extra resources kost om steeds dezelfde content te indexeren
  3. De PageRank van een pagina wordt verdeeld over alle links op een pagina. Wanneer een pagina ook linkt naar duplicate content varianten, dan zorgt dit ervoor dat de PageRank ‘verwaterd’ en niet alleen bij de originele pagina’s terechtkomt, maar ook bij de duplicate varianten, waardoor geen enkele pagina goed kan ranken.

Daarom probeert Google het publiceren van pagina’s met grotendeels duplicate content te ontmoedigen door duplicate content niet of slechts gedeeltelijk te indexeren of een website met veel duplicate content lager te ranken, niet zozeer vanwege een penalty (dan moet je het wel erg bont maken), maar als een bijeffect.

Wanneer je identieke content op verschillende domeinen zet, is het bijvoorbeeld mogelijk dat Google een paar pagina’s indexeert van het ene domein en een paar pagina’s van het andere domein, waardoor de sitestructuur (lees: PageRank flow) van beide domeinen versnipperd raakt en beide domeinen niet goed meer kunnen ranken.

3. Hoe ontstaat duplicate content?

Duplicate content kan op heel veel manieren ontstaan. Hieronder licht ik een aantal veelvoorkomende oorzaken van duplicate content toe. De lijst van oorzaken is niet volledig, omdat duplicate content op vele manieren kan ontstaan.

3.1 User Generated Duplicate Content

Deze vorm van duplicate content ontstaat doordat copywriters van een website identieke teksten gebruiken op verschillende pagina’s.

Gebruik van (product)teksten aangeleverd door leverancier of fabrikant

Het gebruik maken van teksten die zijn aangeleverd door leveranciers van producten. Deze teksten worden door veel webwinkels letterlijk overgenomen. Dit zorgt voor cross domain duplicate content.

Cross domein duplicate content

Voorbeeld van cross domain duplicate content door het recyclen van productteksten aangeleverd door leverancier of fabrikant.

Vergelijkbare producten

Veel producten lijken op elkaar of zijn in verschillende kleuren of afmetingen verkrijgbaar. Door dezelfde teksten te gebruiken bij varianten van producten ontstaat ook duplicate content, waarbij slechts een aantal variabelen verschillend zijn, zoals de prijs en afmeting.

duplicate content door gebruik bijna identieke teksten bij vergelijkebare producten

Producten in meerdere categorieën

Producten in meerdere categorieën plaatsen, kan ook voor duplicate content zorgen omdat dezelfde content op verschillende URLs bereikt kan worden.

Voorbeeld:
mijnmerkdomein.nl/categorieA/productA
mijnmerkdomein.nl/categorieB/productA

Diefstal van teksten (inbreuk op auteursrechten)

Sommige webmasters hebben geen tijd of zin om teksten te bedenken en besluiten daarom om teksten van de websites van concurrenten te gebruiken op hun eigen website. Zoek-en-vervang de naam van het bedrijf in de teksten en je bent klaar. Dit is niet alleen vanwege duplicate content redenen onverstandig, maar ook vanuit juridisch oogpunt niet handig. Google ziet vaak de als eerste geïndexeerde variant van een pagina als het origineel.

De kans dat een website met gestolen content gaat ranken is dus vrij klein. Daarnaast is het voor de auteur van de originele content vrij eenvoudig te achterhalen wie zijn teksten gebruikt en kan hij naast juridische actie, ook een spamreport bij Google indienen om de concurrent te straffen voor het kopiëren van content. Google kan bijvoorbeeld de gehele site van de concurrent uit de index van Google halen.

3.2 Door het systeem gegenereerde duplicate content

De manier waarop de techniek achter een website is opgebouwd kan ook resulteren in (onbedoelde) duplicate content.

Gebruik van session ID’s in URLs

Een sessie ID is een uniek nummer dat de server van een website koppelt aan een specifieke bezoeker van de website om deze bezoeker te kunnen identificeren gedurende zijn bezoek. Dit is bijvoorbeeld noodzakelijk om de producten in een winkelmandje bij te houden terwijl de bezoeker door de site bladert.

Website bouwers stoppen deze session ID’s vaak in de URL en aangezien iedere session ID uniek is, bestaat de kans dat Google dezelfde pagina gaat indexeren met steeds een andere session ID erin:

voorbeeld duplicate content door sessionid's

Gebruik van filters, sorteringen en taalswitches

Deze variant komt het meeste voor bij webshops. Filters zorgen bij veel systemen ervoor dat er meerdere parameters ontstaan in URL’s. Deze URL’s met parameters kunnen vaak ook geïndexeerd worden door Google, waardoor een eindeloze hoeveelheid duplicate content kan ontstaan. In het voorbeeld hieronder zie je dat (naast de session ID) ook de sortering ‘viewType’ hier voor duplicate varianten van de productpagina zorgen.

voorbeeld duplicate content door filters in webshop

Filter URL 1

Filter URL 2

Tenslotte kunnen ook taalswitches zorgen voor duplicate content. Stel je hebt een website in het Nederlands en Engels, waarbij de default taal Nederlands is:

  • mijnmerkdomein.nl/product (Nederlands)
  • mijnmerkdomein.nl/product&language=en (Engels)
  • mijnmerkdomein.nl/product&language=nl (Nederlands)

In dit voorbeeld zijn /product (default NL) en /product&language=nl identiek aan elkaar, waardoor er duplicate content ontstaat.

Voor meer tips, lees het artikel SEO voor Webshops van mijn collega Daan Weustenraad.

Zelfde content op meerdere domeinen

Het kan gebeuren dat dezelfde content op meerdere domeinen beschikbaar is. Dit kan een bewuste keuze zijn, omdat je bijvoorbeeld hoopt dat je beter gaat ranken op de keywords in domeinnamen, of per ongeluk, bijvoorbeeld wanneer een webbouwer de testversie van een website op een subdomein van de webbouwer heeft laten indexeren.

Er zijn uitzonderingen voor het gebruik van duplicate content op meerdere domeinen. Een voorbeeld hiervan is het plaatsen van dezelfde content op een .nl en .be domein. Dit ziet Google vaak niet als duplicate content. Om er zeker van te zijn dat Google dit niet als duplicate gaat beschouwen, kun je twee dingen doen:

  1. Maak gebruik van hreflang om aan te geven voor welk land/taal het domein is ingesteld.
  2. Verifieer de .be en .nl versie van de website in Google Webmaster Tools en wijs het juiste geografische gebied toe aan beide domeinen. Zie de afbeeldingen hieronder:

Webmaster Tools instellingen

Geografische Doelregio instellen

4. Hoe kan ik duplicate content issues analyseren voor mijn site(s)?

Om te achterhalen of er duplicate content problemen zijn voor jouw website, onderneem de volgende acties:

4.1 Analyseer data ‘HTML verbeteringen’ in Google Webmaster Tools

Ga in Google Webmaster Tools naar Uiterlijk van Search » HTML-verbeteringen.
Hier zie je meldingen staan van pagina’s met ‘Dubbele Title Tags’. Pagina’s met duplicate content zullen namelijk ook vaak dezelfde paginatitel hebben. Door de lijst met ‘Dubbele Title Tags’ te bekijken, kun je vaak al een hoop duplicate content problemen achterhalen en aan de URL’s kun je vaak al zien hoe deze duplicate content ontstaat.

Webmaster Tools HTML-Verbeteringen

Werk aan de winkel!

4.2 Neem een stuk tekst van de homepage en haal deze tussen quotes ("") door Google

Bekijk de zoekresultaten

a) Zijn er andere (sub)domeinen die dezelfde tekst hebben?

Wanneer er twee of meer zoekresultaten zijn op meerdere (sub)domeinen, dan kan er sprake zijn van duplicate content. Bekijk de zoekresultaten en vergelijk de teksten. Zijn de teksten identiek of slechts gedeeltelijk hetzelfde? Wanneer de teksten grotendeels gelijk zijn, kijk of je de oorzaak kunt verklaren. Heeft een concurrent de teksten van jouw homepage overgenomen?

b) Zijn de domeinen met duplicate content van jou?

Sommige webmasters zetten hun gehele website met dezelfde content op verschillende domeinen, waardoor duplicate content ontstaat.

4.3 Neem een stuk tekst van een categoriepagina of productpagina

Voorbeeld van een producttekst van een computer:
"Deze all-in-one computer is eenvoudig in gebruik, past overal en staat mooi op uw bureau of aan de muur."

a) Zijn er andere pagina’s binnen het domein met dezelfde content?

Wanneer je meerdere zoekresultaten ziet afkomstig van jouw domein, kijk in hoeverre deze pagina’s inhoudelijk overeenkomen. Zijn de pagina’s identiek? Noteer de URL’s van deze pagina’s.

b) Zijn er andere pagina’s bij andere domeinen met dezelfde content?

Zie je zoekresultaten van andere domeinen die jouw teksten bevatten? Bekijk een aantal teksten. Komt deze cross-domain duplicate content door het gebruik van standaard productteksten? Hebben concurrenten originele content van jouw website overgenomen? Of staan deze teksten op domeinen die jij beheert?

4.4 Neem een stuk tekst van een categoriepagina of productpagina en gebruik de ‘site:’ operator

Om nader onderzoek te doen naar duplicate content binnen je eigen domein, kun je gebruikmaken van de ‘site:’ search operator.

Voorbeeld:

site:.mijnmerkdomein.nl "Deze all-in-one computer is eenvoudig in gebruik, past overal en staat mooi op uw bureau of aan de muur."

De reden dat er hier voor site:.mijnmerkdomein.nl is gekozen en niet voor site:www.mijnmerkdomein.nl, is om te kunnen achterhalen of er duplicate content op subdomeinen staat, zoals bijvoorbeeld: winkel.mijnmerkdomein.nl

4.5 Voorbeelden van site: search operator

Voor zeer grote sites kun je ook meerdere search operators (zoekoperators) gebruiken om onderzoek te kunnen doen binnen bepaalde secties van een site:

  • site:www.mijnmerkdomein.nl/categorie/subcategorie1 "Deze all-in-one computer is eenvoudig in gebruik, past overal en staat mooi op uw bureau of aan de muur."
    Deze zoekopdracht laat alle duplicate pagina’s zien binnen subcategorie1
  • site:www.mijnmerkdomein.nl intitle:computer
    Deze zoekopdracht laat alle pagina’s zien met in de paginatitel het woord ‘Computer’
  • site:www.mijnmerkdomein.nl inurl:sessionid
    Hiermee vraag je alle pagina’s op die in de URL een parameter ‘sessionid’ hebben

Bekijk een volledig overzicht van Google Search Operators

4.6 Duplicate Content Tools

Tenslotte zijn er nog een aantal duplicate content checkers die je kunt gebruiken om duplicaten te achterhalen:

5. Oplossingen: duplicate content opruimen

Er zijn meerdere mogelijkheden om duplicate content op te ruimen. Welke methode je kiest hangt af van waar de duplicate zich voordoet (binnen één domein of meerdere domeinen) en hoe het is ontstaan. Hieronder worden oplossingen besproken en vervolgens worden er een aantal voorbeelden gegeven:

5.1 301 redirects (domeinen / pagina’s)

Een 301 redirect (permanente redirect) zorgt ervoor dat een bezoeker van een oude URL wordt doorverwezen naar een nieuwe URL. Een zoekmachinebot volgt deze instructie ook en zal in het vervolg alleen de nieuwe versie van een URL indexeren. Daarnaast zal Google de PageRank van de oude URL overdragen aan de nieuwe URL. Wat je doet met een 301-redirect is twee identieke pagina’s (of twee identieke domeinen) samenvoegen tot één versie, waardoor de duplicate content wordt opgeheven. Voorbeelden:

Pagina:
mijnmerkdomein.nl/index.php 301-redirect naar mijnmerkdomein.nl/
Om er bijvoorbeeld voor te zorgen dat er geen dubbele versies van de homepage ontstaan.

Subdomein:
mijnmerkdomein.nl 301-redirect naar www.mijnmerkdomein.nl
Dit voorkomt dat Google zowel de www als non-www versie van de website gaat indexeren.

Domein:
www.mijnmerkdomein.nl 301-redirect naar www.mijndomein.com/nl/
Om cross domain duplicate content te voorkomen.

Hoe je een 301 redirect moet implementeren hangt af van de gebruikte programmeertalen en serverconfiguratie. Lees het artikel van mijn collega Daan Weustenraad over het implementeren van 301 redirects.

5.2 Parameters uitsluiten (Webmaster Tools)

In Webmaster Tools in het menu: Crawlen » URL parameters kun je Googlebot instructies geven welk type pagina’s niet geïndexeerd moeten worden. Je kunt hier parameters instellen van pagina’s die je niet in de zoekresultaten wilt laten verschijnen.

Voorbeelden:

Stel de volgende (fictieve) URL’s veroorzaken duplicate content problemen:

  • www.mijnmerkdomein.nl/software?refID=sponsor
  • www.mijnmerkdomein.nl/software?utm_source=bron?utm_medium=twitter
  • www.mijnmerkdomein.nl/software?&PHPSESSION=dHBDZFB34DS

Dan kun je de volgende parameters toevoegen om duplicate content tegen te gaan:

refID

utm_source

PHPSESSION

  1. Selecteer bij iedere parameter die duplicate content veroorzaakt de optie: ‘Nee, heeft geen invloed op pagina-inhoud’.
  2. Kijk goed of je niet toevallig pagina’s uitsluit die wel geïndexeerd hadden moeten worden.
  3. Controleer in de loop van een aantal weken of Google de duplicates met deze parameters uit de zoekresultaten filtert. Voorbeeld zoekopdrachten:

    site:.mijnmerkdomein.nl inurl:refID
    site:.mijnmerkdomein.nl inurl:lang
    site:.mijnmerkdomein.nl inurl:utm_source
    site:.mijnmerkdomein.nl inurl:PHPSESSION

5.3 Canonical tags

De canonical tag is speciaal in het leven geroepen om duplicate content problemen aan te pakken. Met de canonical tag kun je aangeven wat de originele variant is van een pagina.

Zo kun aan het <HEAD></HEAD> gedeelte van de pagina www.mijnmerkdomein.nl/index.php&lang=nl de volgende canonical tag toevoegen:

<link rel="canonical" href="http://www.mijnmerkdomein.nl/index.php" />

Wat je hiermee doet is aan Google vertellen dat de pagina www.mijnmerkdomein.nl/index.php&lang=nl een duplicate is van het orgineel www.mijnmerkdomein.nl/index.php en dat Google alleen de originele variant moet indexeren.

Dit kun je ook voor de andere duplicate varianten doen:
www.mijnmerkdomein.nl/software?refID=sponsor,
www.mijnmerkdomein.nl/software?utm_source=bron?utm_medium=twitter en www.mijnmerkdomein.nl/software?&PHPSESSION=dHBDZFB34DS
kunnen de volgende canonical tag meekrijgen:

<link rel="canonical" href="http://www.mijnmerkdomein.nl/software" />

  • Vaak worden deze tags automatisch toegevoegd aan een website. Controleer daarom altijd of de canonical tags naar de juiste originele variant verwijzen door de broncode op te vragen van een aantal duplicates met een canonical tag erin. Fouten in de canonical tags zorgen er immers voor dat het duplicate content probleem erger wordt omdat Google verkeerde instructies krijgt voor het indexeren van pagina’s.
  • Er bestaan ook cross-domain canonical tags. Deze tags vertellen Google dat de originele variant van een pagina bestaat op een ander domein. Voorbeeld:
    www.mijnmerkdomein.nl/index.php

    <link rel="canonical" href="http://www.mijndomein.com/nl/" />

Advies over gebruik van canonicals

Canonicals kun je beschouwen als een soort soft 301-redirect, hoewel het minder goed en minder snel werkt als een 301-redirect. In tegenstelling tot een 301-redirect is een canonical tag géén directive, wat wil zeggen dat Google ervoor kan kiezen om de canonical te accepteren of te verwerpen. Een canonical tag geeft wel PageRank door, vergelijkbaar met een 301-redirect.

Cross domain canonical tags worden alleen aangeraden wanneer de website op een server staat die geen server-side redirects ondersteund. In alle andere gevallen wordt het gebruik van een 301-redirect aangeraden. Let op: een cross-domain canonical tag moet je voor iedere afzonderlijke pagina instellen!

Lees meer informatie over cross-domein URL selectie

5.4 Pagina’s verwijderen met Webmaster Tools en Robots.txt

Via Webmaster Tools » Google-index » URL’s verwijderen, kun je 404-pagina’s uit de zoekresultaten verwijderen. Stel dat er een duplicate content probleem is omdat dezelfde productpagina te vinden is in twee verschillende categorieën:

www.mijnmerkdomein.nl/categorieA/productA.html
www.mijnmerkdomein.nl/categorieB/productA.html

Je kunt dit duplicate probleem oplossen door www.mijnmerkdomein.nl/categorieB/productA.html offline te halen (404-pagina) en vervolgens via de ‘URL verwijderen’ module in Webmaster Tools deze pagina verwijderen. In dat geval blijft alleen de pagina www.mijnmerkdomein.nl/categorieA/productA.html over.

Om te voorkomen dat Google allerlei andere kopieën van productpagina’s in categorieB gaat indexeren, kun je deze directory uitsluiten met de robots.txt:

User-agent: *
Disallow: /categorieB/

Googlebot zal met deze instructie geen enkele pagina in de directory /categorieB/ indexeren. Voordat je een hele directory uitsluit met de robots.txt moet je eerst nagaan of er geen pagina’s tussenzitten in de directory /categorieB/ die wel geïndexeerd moeten worden.

5.5 Meta Robots tag

Met de meta robots tag kun je instructies geven aan Google wat de Googlebot met een specifiek pagina moet doen. Deze tag plaats je in het <HEAD></HEAD> gedeelte van de pagina. Er zijn 4 varianten van deze tag:

  1. <meta name="robots" content="index, follow">
    Dit is de default meta robots tag. Deze variant wordt niet gebruikt omdat deze instructie zegt:
    ‘Indexeer deze pagina en volg de links op de pagina’
    Aangezien Google dit standaard doet, is het toevoegen van deze meta-tag in principe overbodig.
  2. <meta name="robots" content="noindex, nofollow">
    Met deze tag geef je Googlebot de intstructie om de pagina niet te indexeren en ook om de links niet te volgen op deze pagina. Wanneer je deze tag toevoegt aan de duplicate versie van een pagina, dan wordt deze variant niet geïndexeerd en kun je duplicate content voorkomen.
  3. <meta name="robots" content="index, nofollow">
    Hiermee geef je de instructie aan Googlebot om de tekst op de pagina wel te indexeren, maar de links op de pagina niet te volgen. Er wordt als het ware een ‘nofollow’ toegevoegd aan alle links op die pagina, waardoor er ook geen PageRank wordt overgedragen aan die links. Deze met a robots tag wordt zelden gebruikt.
  4. <meta name="robots" content="noindex, follow">
    Hiermee instrueer je Googlebot om de pagina niet te indexeren en in de zoekresultaten op te nemen, maar wel om de links op de pagina te volgen (en daarmee PageRank door te geven). Soms komt het voor dat je een categoriepagina hebt op je website met alleen links naar diverse producten. Deze pagina’s zijn niet zo aantrekkelijk voor bezoekers. Wanneer je niet wilt dat bezoekers binnenkomen op deze pagina, maar wel wilt dat de links op de pagina gevolgd worden (en PageRank doorgeven) dan kun je deze meta robots tag gebruiken.

5.6 Inbreuk op auteursrechten melden

Soms komt het voor dat duplicate content niet veroorzaakt wordt door een technische fout, maar doordat concurrenten hele lappen tekst, foto's of andere content van jouw website hebben gekopieerd en op hun eigen domein hebben gezet.

De meest directe methode om dit aan te pakken is de webmaster van dat domein te bellen of te mailen met het verzoek om de content direct te verwijderen, eventueel met een factuur erbij voor het gebruik van jouw content.

Een andere methode is om een copyright infringement report in te vullen via Webmaster Tools. Het resultaat hiervan kan zijn dat de website van de concurrent gedeeltelijk of in zijn geheel gedeïndexeerd wordt, afhankelijk van hoe ernstig / rechtmatig Google de situatie beoordeelt.

Je kunt direct naar dit formulier gaan of daar komen door de volgende stappen te volgen:

  1. Ga naar: https://support.google.com/legal/troubleshooter/1114905?rd=2
  2. Selecteer: Web Search
  3. Selecteer: I have a legal issue that is not mentioned above
  4. Selecteer: I have found content that may violate my copyright
  5. Selecteer: Yes, I am the copyright owner or am authorized to act on the copyright owner's behalf
  6. Selecteer: Other  (of images als het om onrechtmatig gebruik van jouw afbeeldingen gaat)
  7. Klik op: Use this form

5.7 Herschijven van teksten

De meest eenvoudige manier om cross-domain duplicate content tegen te gaan is door het herschrijven van standaard productteksten. Zodra je standaard teksten in eigen woorden gaat herschrijven is de content niet meer duplicate. Nu is het vrijwel niet mogelijk om alle productteksten te herschrijven naar originele content als je 10.000 artikelen hebt en al helemaal niet als ieder seizoen een groot deel van het assortiment wordt aangepast. Hieronder een aantal strategieën om content meer origineel te maken:

  • Zorg dat paginatitels en meta-descriptions origineel zijn. Veel webshops hanteren dezelfde paginatitel(structuut): [Product] | Websopmerknaam, omdat dit de default optie is bij webwinkelsoftware. Probeer hier een meer originele titel van te maken, met bijvoorbeeld de categorienaam in de paginatitel of prijzen of woorden als 'kopen' en 'bestellen' erin. Hierdoor valt jouw zoekresultaat net iets meer op en is deze origineler.
  • Maak gebruik van standaard (intro)zinnen en variabelen. Vul de standaard producttekst aan met een aantal extra introzinnen, waarin je ook de naam van het product verwerkt: 'Bestel [productnaamX] voor 12 uur en u heeft het morgen in huis!'. Je hebt per productpagina vaak een aantal variabelen waarmee je kunt werken, zoals: productnaam, prijs, afmeting, kleur, eigenschappen etc. 
  • Maak gebruik van reviews en/of opmerkingen. Opmerkingen bij en reviews van een product kunnen de productpagina's een stuk origineler (en nuttiger voor de bezoeker) maken. Nodig bezoekers uit om een review te schrijven door bijvoorbeeld een week na levering van het product om een review te vragen via een e-mail.
  • Herschrijf teksten van topproducten. Een andere strategie is om bijvoorbeeld via Google Analytics te kijken welke producten het meest vaak verkocht worden (of de grootste winstmarge hebben) en vervolgens via Webmaster Tools naar de gemiddelde rankings kijken voor zoekwoorden die gerelateerd zijn aan deze producten. Zie je dat er nog winst te halen is in rankings, dan kun je aan die productpagina's extra aandacht besteden om de standaard teksten om te schrijven naar unieke productbeschrijvingen. Als je toch aandacht besteed aan de teksten, dan kun je gelijk aandacht besteden aan longtail zoekopdrachten.

6. Wat zijn de SEO best practices om duplicate content te voorkomen?

  1. Zorg voor een goede techniek achter de website, waarbij het systeem al rekening houdt met het (voorkomen van) duplicate content. Denk hierbij aan een systeem dat:
    - Geen sessionid’s in URL’s genereert
    - Zorgt dat pagina’s met filterparameters op noindex,nofollow komen te staan
    - De mogelijkheid biedt aan webmasters/redacteurs om handmatig robots meta tags en canonicals toe te voegen aan een willekeurige pagina.

    Bij Insyde proberen we met behulp van standaardoplossingen en functionaliteiten in ons CMS  ervoor te zorgen dat de meeste duplicate content issues automatisch voorkomen kunnen worden en editors de tools te geven om dit vanuit het CMS op te lossen.
  2. Denk goed na over de sitestructuur. Wil je producten in meerdere categorieën plaatsen, dan kun je óf een canonical gebruiken om een origineel aan te wijzen of de productpagina in de root te zetten, zodat alle categorieën naar dezelfde URL verwijzen, bijvoorbeeld mijnmerkdomein.nl/productA.
  3. Controleer regelmatig op duplicate content in de zoekresultaten volgens de aangegeven methode.
  4. Controleer regelmatig de HTML-verbeteringen in Webmaster Tools

7. Hulp bij duplicate content oplossen

Zoals in het begin van het artikel is aangegeven, kan duplicate content op vele en soms rare manieren ontstaan. Bijna iedere grote website heeft last van duplicate content en het is van belang hier waakzaam op te blijven, omdat grote websites hun verkopen vaak halen uit de longtail zoekopdrachten. Hoe meer duplicate content des te makkelijker een site wegzakt op deze longtail zoekopdrachten en des te groter de impact op de omzet van de website.

Heb je vragen over duplicate content naar aanleiding van dit artikel, dan kun je hieronder een opmerking plaatsen. Mocht je behoefte hebben aan meer inzicht in het oplossen van duplicate content voor jouw site(s), dan kun je altijd contact opnemen met Insyde voor een SEO adviestraject, een training technische SEO of het laten ontwikkelen van een website met de juiste tools om duplicate content tegen te gaan en goed vindbaar te worden.

Geschreven door Bert van Heerde

SEO specialist

Blijf up-to-date en ontvang updates in je mailbox

Lees ook deze interessante blogs

Totaalpakket: grondig renoveren website, inclusief teksten en beelden

Het besluit is genomen: je wilt een nieuwe website voor je bedrijf. Dit besluit is meteen de startpunt van een reeks volgende beslissingen. Wat te doen met de content – foto’s en teksten – op de huidige site? Passen deze nog bij de nieuwe weg die je in wilt slaan? Of doen deze juist afbreuk aan de nieuwe website en de communicatieboodschap die je wilt uitdragen? En wat als nieuwe teksten nodig zijn: zelf schrijven of iemand anders? En zo ja, wie dan? Oftewel: keuzes,...

SEO mythes

SEO mythes: wat is waarheid en wat is fictie?

SEO is een vakgebied waarin veel verhalen rondgaan over wat wel en niet werkt. SEO is dan ook een vakgebied met een continu veranderend landschap. De technologie achter websites wordt continue verbeterd, zoekmachines worden steeds slimmer en zoekmachinegebruikers worden steeds beter bediend. In dit artikel zullen we een aantal SEO-misverstanden behandelen.

Long tail SEO

Long Tail SEO: proces van de lange adem

Long Tail, een SEO-strategie die vaak wordt vergeten of niet wordt toegepast. Een gemiste kans! Long Tail is perfect ter aanvulling van je huidige Short Tail SEO-strategie. In dit artikel leg ik uit wat Long Tail zoekwoorden zijn, wat het je kan opleveren en beschrijf ik het proces van een Long Tail SEO-strategie.