Zoekmachineoptimalisatie tips voor PDF bestanden

Veel websites maken gebruik van PDF bestanden voor bijvoorbeeld routebeschrijvingen, artikelen, ebooks en folders. Zoekmachines kunnen in de meeste gevallen de inhoud van PDF documenten lezen en indexeren. Het is dus mogelijk om met PDF's te ranken in zoekmachines. In dit artikel wordt stap voor stap uitgelegd hoe je een PDF bestand kunt bewerken en optimaliseren.

Een PDF bestand bewerken

Voor de optimalisatie van PDF documenten moet je allereerst beschikken over een programma waarmee de PDF's bewerkt kunnen worden. De meest bekende software die je kunt gebruiken is Adobe Acrobat 5.0 of hoger. Nadeel van dit pakket is dat er een investering gedaan moet worden, terwijl er ook gratis programma's zijn die je kunt gebruiken. Hieronder volgt een opsomming van gratis te gebruiken software:

  • BeCyPDFMetaEdit
    Met dit programma kun je eenvoudig de metadata van PDF documenten bewerken.
  • PDF995
    Zeer uitgebreid programma voor het maken en bewerken van PDF bestanden. Gebruik Omniformat voor converteren van bestanden (.DOC naar .PDF en .PDF naar .DOC) .
  • PDF Creator
    Met PDF Creator kun je pdf bestanden aanmaken vanuit diverse Windows programma's.
  • PDFHammer en PDF Online
    Zowel PDFHammer als PDFOnline zijn websites waar je online PDF bestanden kunt bewerken, samenvoegen en/of converteren.
  • PDF Escape
    Handige online tool waarmee je PDF bestanden kunt bewerken en bijvoorbeeld links aan PDF bestanden kunt toevoegen.

Optimaliseren van PDF Metadata

De metadata van PDF documenten wordt door zoekmachines (mede) gebruikt voor het bepalen van de rankings. Het invullen van deze metadata velden is daarom van groot belang. Hieronder volgt een voorbeeld voor Adobe Acrobat (7.0).

Ga in het menu bovenaan in Acrobat naar (zie figuur):
file > Document Properties (Ctrl+D)
(NL versie: bestand > documenteigenschappen)

afbeelding 1: PDF metadata in het menu van Adobe

PDF bestanden bewereken met Adobe Acrobat

In het menu documenteigenschappen kan een aantal velden ingevoerd worden:

afbeelding 2: PDF metadata bewerken in Adobe

Metadata PDF bewerken

File:
Gebruik een duidelijke filenaam voor het PDF bestand, bijvoorbeeld de titel van het artikel. Gebruik hyphens (-) in plaats van spaties, omdat zoekmachines '%20' van de spaties maken en daardoor wordt de url in de zoekresultaten moeilijk leesbaar. Voorbeelden:

Niet goed:

  • shr0097a.pdf (onbegrijpelijk voor gebruiker)
  • adhd symptomen onderzocht.pdf (spatiegebruik)

Goed:

  • adhd-symptomen-onderzocht.pdf
  • adhd-symptomen-onderzocht-2009-de-vries-et-al.pdf

Title:

Dit veld vormt de titel van het document en wordt door zoekmachines overgenomen en geïndexeerd als de paginatitel van 'normale' webpagina's. Wanneer dit onderdeel niet ingevuld wordt, nemen de zoekmachines meestal een titel in het PDF document als paginatitel of er wordt [Onbekend] ingevuld.

De Title is het meest belangrijke element van optimalisatie van een PDF.

Author:

Vul hier de auteur van het artikel in. Google groepeert alle artikelen van dezelfde auteur. Gebruik dus altijd dezelfde notatie voor een auteur (bijvoorbeeld: B. van Heerde).

Subject:

Dit veld is bestemd voor een korte samenvatting van het document en wordt door zoekmachines overgenomen en geïndexeerd als een meta-description tag van een gewone webpagina. Wanneer de description niet wordt ingevuld, geven de zoekmachines meestal een willekeurig stukje tekst (snippet) uit het document weer. Gebruik ook de zoekwoorden die je in de Title hebt gezet in deze omschrijving. Probeer het artikel samen te vatten in één zin. 

Keywords:

Dit veld is bedoeld om de inhoud of boodschap van een PDF document in enkele kernwoorden samen te vatten. Dit veld is vergelijkbaar met de meta-keyword tag. Vuistregel is dat dit veld 5 – 10 keywords of keyphrases bevat, gescheiden door komma’s (zie figuur 3). Over het algemeen geldt: hoe minder keywords des te beter. De keywords zijn momenteel niet erg in trek bij zoekmachines en zullen weinig tot niets bijdragen aan hogere posities in zoekmachines. Vanuit het oogpunt van consistentie, informatiestructurering en -archivering is het wel aan te raden om dit veld te gebruiken. Er zijn immers genoeg andere (wetenschappelijke) zoekmachines en artikelensites die wel gebruik (kunnen) maken van dit veld.

afbeelding 3: Voorbeeld van een PDF document zonder titel, description en keywords ingevuld
PDF zonder metadata ingevuld

afbeelding 4: Voorbeeld van PDF document met titel, description en keywords ingevuldGeoptimaliseerde PDF


PDF bestanden presenteren

Om een PDF document te kunnen lezen, moeten mensen gebruik maken van een softwarepakket. Niet iedereen heeft een PDF-reader geïnstalleerd. Daarnaast zijn PDF bestanden vaak groot en duurt het een tijdje voordat het document gedownload is. De beste manier om een PDF artikel te presenteren, is door de titel, auteur(s), jaar van publicatie en de samenvatting van het artikel op een aparte webpagina te zetten met daaronder een link naar de PDF-versie. Hierdoor weet de bezoeker beter waar het document over gaat en kan hij ervoor kiezen om het bestand te downloaden of niet.

Voor zoekmachines is het ook beter, omdat het PDF bestand een unieke parent pagina heeft. Hiermee bedoel ik dat de PDF gelinked wordt vanaf één unieke webpagina op jouw website (zie afbeelding 5). Hierdoor is het voor een bezoeker en een zoekmachine makkelijker te achterhalen waar op de website het bestand zich bevindt. Bovendien hebben webmasters van andere websites de keuze of ze naar de parent pagina linken of naar het PDF document zelf. Wanneer er naar de parent pagina wordt gelinked vanaf andere websites, zal de PageRank van deze parent page toenemen. De PageRank van deze parent pagina kun je weer gebruiken om parent pagina's van gerelateerde PDF artikelen te promoten. Dit kun je doen door op de parent pagina links aan te maken naar de parent pagina's van andere (gerelateerde) PDF artikelen.

afbeelding 5: parent pagina én PDF in de top 10

Parent page en PDF artikel in de zoekresultaten

Links in PDF Documenten

Voordat je een .DOC bestand converteert naar een .PDF bestand is het van belang om alle hyperlinks na te lopen en te kijken of ze goed werken. Het is altijd mogelijk om links later toe te voegen met de linktool in Adobe (zie plaatje hieronder), hoewel dit vrij omslachtig is.

afbeelding 6: Link Tool in Adobe

Link Tool van Adobe

Hieronder nog een aantal tips voor het toevoegen van teksten en links:

  1. Voeg ook contactgegevens toe aan het PDF document (indien wenselijk) zodat mensen die de PDF uitprinten of via de mail toegestuurd krijgen, eenvoudig contact kunnen opnemen.
  2. Voeg altijd een link toe in het PDF document naar de parent pagina van het PDF document. De kans is groot dat Google twee resultaten toont in de zoekresultaten: de parent pagina én het pdf document (zie afbeelding 5). Twee pagina's in de top 10 is altijd beter dan één pagina in de top 10, omdat de kans groter is dat iemand op één van deze twee zoekresultaten klikt. 

Beveiliging, Plaatjes en Indexeren

Zet geen beveiliging op het document met passwords. Indien er een password op een PDF staat, kunnen zoekmachines het bestand niet lezen. Om te checken of een PDF bestand goed geïndexeerd is, kun je het beste een unieke zin kopiëren uit het PDF artikel en deze zin tussen aanhalingstekens plaatsen invoeren in Google. Gebruik eventueel filetype:pdf achter de zoekopdracht:

"hier de unieke zin" filetype:pdf (bekijk een voorbeeld).

Wanneer het document niet geïndexeerd is, check de volgende zaken:

  1. Is er een link naar het PDF document aanwezig? Google kan documenten niet vinden wanneer ze niet gelinked worden vanaf een andere (geïndexeerde) pagina.
  2. Is de directory waar het PDF document zich bevindt niet uitgesloten door de robots.txt?
  3. Wanneer de teksten van een artikel in een afbeelding zijn gezet dan kunnen zoekmachines de tekst niet lezen. Google maakt, voor zover bekend, geen gebruik van OCR. Gebruik daarom altijd gewone tekst in plaats van afbeeldingen met tekst.
  4. Het kan zijn dat de pdf te diep in de website ligt, waardoor Google moeite heeft om het document te vinden. Zet daarom de PDF bestanden ook in je sitemap.xml bestand.
  5. Kijk wat de beveiligingstatus van het document is. Is deze beveiligd (zie afbeelding hieronder)? Zoekmachines kunnen beveiligde PDF's niet indexeren.

afbeelding 7: Beveiling van een PDF controleren in Adobe

Beveiling van een PDF controleren in Adobe

Tot zover mijn SEO tips voor PDF documenten. Heb jij nog tips of vragen over PDF bestanden? Laat het hieronder weten. In het volgende weblog artikel zal ik ingaan op de ranking factoren van Google Scholar en de optimalisatie van wetenschappelijke artikelen voor deze zoekmachine.

Geschreven door Bert van Heerde

SEO specialist

Blijf up-to-date en ontvang updates in je mailbox

Lees ook deze interessante blogs

Totaalpakket: grondig renoveren website, inclusief teksten en beelden

Het besluit is genomen: je wilt een nieuwe website voor je bedrijf. Dit besluit is meteen de startpunt van een reeks volgende beslissingen. Wat te doen met de content – foto’s en teksten – op de huidige site? Passen deze nog bij de nieuwe weg die je in wilt slaan? Of doen deze juist afbreuk aan de nieuwe website en de communicatieboodschap die je wilt uitdragen? En wat als nieuwe teksten nodig zijn: zelf schrijven of iemand anders? En zo ja, wie dan? Oftewel: keuzes,...

SEO mythes

SEO mythes: wat is waarheid en wat is fictie?

SEO is een vakgebied waarin veel verhalen rondgaan over wat wel en niet werkt. SEO is dan ook een vakgebied met een continu veranderend landschap. De technologie achter websites wordt continue verbeterd, zoekmachines worden steeds slimmer en zoekmachinegebruikers worden steeds beter bediend. In dit artikel zullen we een aantal SEO-misverstanden behandelen.

Long tail SEO

Long Tail SEO: proces van de lange adem

Long Tail, een SEO-strategie die vaak wordt vergeten of niet wordt toegepast. Een gemiste kans! Long Tail is perfect ter aanvulling van je huidige Short Tail SEO-strategie. In dit artikel leg ik uit wat Long Tail zoekwoorden zijn, wat het je kan opleveren en beschrijf ik het proces van een Long Tail SEO-strategie.