Dat recruitment booming is, hoef ik degene die dit artikel leest niet te vertellen. Het is een markt die potentieel reikt tot in de miljarden. Dat iedereen daar iets van mee wil pikken, dat moge daarom duidelijk zijn. Met dat in je achterhoofd, begrijp je wellicht beter waarom zoveel ‘bots’ jouw werkenbij-site scrapen om daarna jouw vacatures op hun eigen en andere websites te plaatsen. Is het netjes? Nee. Is het zo vervelend dat je er hoofdpijn van krijgt? Ja, en niet alleen jij.
Scrapers
Om duidelijk te maken wat scrapers zijn, heb ik in recruitment kringen vaak genoeg aan het noemen van één domeinnaam: werkzoeken.nl. Scrapen of crawlen is een proces waarbij een bot enorm veel pagina’s bezoekt op zoek naar content die de bot kan gebruiken. Het bekendste voorbeeld van crawlen is Google. Google crawled jouw website om te zorgen dat ze het kunnen tonen in hun zoekmachine.
In het geval van Google is scrapen niet zo erg. Google weet precies aan wie ze jouw website moeten laten zien en sturen traffic dat een match vertoond direct door naar jouw eigen website. Het is zelfs zo ‘niet erg’ dat er een heel vakgebied uit ontstaan is, Search Engine Optimisation (SEO).
Wat betekent scrapen voor de kandidaat?
De bots van de bekende recruitment scrapers zijn niet op zoek naar zomaar content, zij zijn op zoek naar vacatures. Zij gaan jouw website af op zoek naar datapunten die zij kunnen gebruiken. Nadat ze dit gescraped hebben formatteren ze de gevonden informatie zodat het weer een nette vacature is. Tot zover an sich geen probleem, dit is ook wat Google for Jobs doet.
Het verschil tussen Google for Jobs en bijvoorbeeld werkzoeken.nl of Joblift (of één van de velen) is dan ook niet de manier hoe ze aan de vacatures komen, maar waarvoor ze de vacatures gebruiken.

Bovenstaande typte iemand recentelijk in een Facebook groep. De scrapers gijzelen jouw kandidaten. Als de kandidaat niet een e-mailadres (losgeld) invult zal diegene niet verder kunnen naar jouw vacature. En het aftroggelen van e-mailadressen is niet het enige kwalijke voor de kandidaat reis.
Updates worden niet direct weerspiegeld
Met andere woorden, foutieve informatie zweeft nog dagen (soms weken) rond op het internet. Dit zorgt ervoor dat een foutje in de job description nooit écht verdwijnt van het internet.

Soms voegen scrapers ook informatie toe om een vacature nog interessanter te maken. Zo weet ik met zekerheid te melden dat bovenstaande 50k bonusregeling niet te vinden is op de website van de werkgever. Hoe vervelend is het als jij of jouw collega’s dat aan een sollicitant moet vertellen?
Waarom ze dit doen? Des te interessanter de vacature, des te meer kliks; zie het als clickbait.
Als jij een vacature sluit, staat deze nog geruime tijd open op scrapende websites
Net als dat een aanpassing in de vacaturetekst een update is, is ook het sluiten van een job een update. En als je deze update niet doorvoert, dan zien kandidaten een rol ergens online die in jouw ATS niet meer live is – geen fijne ervaring.
Al met al verlies jij dus de grip over de weergave van jouw vacatures. En niet alleen over de weergave, ook over de performance van jouw job posts.
Wat betekent scrapen voor jouw recruitment data?
Versplinterde data = minimaal inzicht

Scrapers zorgen er weliswaar voor dat de overall cijfers qua bereik enorm stijgen, maar dat bereik resulteert niet in meer verkeer of conversies op jouw platform.
In bovenstaande animatie is jouw data groen. Idealiter wil je die funnel zo volledig mogelijk in handen hebben, want alles wat binnen jouw media en op jouw website plaatsvindt kun je meten. Daardoor weet je ook wat wel en niet werkt en kun je dus verbeteren.
Doordat jouw inzicht in de funnel in tweeën ‘breekt’ (in de praktijk natuurlijk in 100en kleine stukjes, want het zijn veel scrapers die jouw content gebruiken) is wat jij terug kunt vinden in jouw data maar een subset van de volledige data.
Performance
Je weet niet wat er gebeurt en een groot gedeelte van het verkeer komt niet rechtstreeks of nooit op jouw website – dat betekent uiteraard een deuk in jouw performance. Want iedereen die in de funnel van een scraper komt, komt niet in jouw funnel en is daarmee een gemiste kans op een goede kandidaat.
Botverkeer
Nog een nadeel van scrapers is dat ze jouw pagina niet eens per maand scrapen – dat doen ze het liefst iedere dag. Want hoe meer van jouw rollen zij op hun websites hebben staan, des te meer verkeer zij daarop kunnen krijgen.
Doordat scrapers continu jouw website bezoeken om te kijken of jij nog rollen hebt om te scrapen, stijgt het verkeer op jouw website. Dit verkeer heeft geen enkele intentie om te solliciteren, dus zal het niet lang op jouw website blijven (gemiddeld minder dan 0,2 seconden). Het lage time on site, de hoge bounce rate en de lage conversion rates zorgen ervoor dat al jouw cijfers scheef getrokken worden.
Bots weren uit Google Analytics
Het scrapen van je website tegengaan is vrijwel onmogelijk, het uit je Google Analytics weren is een optie. Het is weliswaar een pleister op een gapende wond, maar het zorgt er wel voor dat er niet zo verdomd veel bezoeken vanaf (direct) / (none) op jouw website komen. Het doel van dit Google Tag Manager recipe is het weren van headless browser verkeer, daarmee weer je dus al het verkeer dat niet vanuit een daadwerkelijke browser komt. Een goede optie voor als het standaard vinkje in Google Analytics niet meer werkt.

(Het standaard vinkje vind je onder ‘View Settings’)
Wat is de oplossing?
Ik ga deze oplossing noemen, maar je mag deze oplossing ook direct weer vergeten. Om in het thema ‘gijzelen van kandidaten’ te blijven en een Amerikaans president te quoten:
We will not negotiate with terrorists.
Een oplossing is om een betaalde samenwerking aan te gaan met bijvoorbeeld Joblift, Talent.com, Werkzoeken.nl, Technicus.nl etc etc. Dat kan. En als je je daar goed bij voelt moet je dat zeker doen.
Een betaalde samenwerking betekent vaak dat je een XML feed kan aanleveren die zij voortaan zullen gebruiken om jouw vacatures op hun website te plaatsen. Dankzij deze XML feed heb jij meer grip en kun jij ook jouw updates meesturen.
Blokkeer third-party posters
Een andere optie is om de scrapende platformen zelf te negeren en te kijken naar waar zij hun traffic vandaan halen. Grote kans dat het overzicht na het zoeken op jouw ‘brand’ er ook uitziet zoals onderstaande screenshot.
De scrapers hebben zelf niet extreem veel organisch verkeer of andere bronnen dan jij en je concullega’s op de arbeidsmarkt hebben – zij halen veel van hun verkeer ook bij de grote job boards vandaan.

Linkedin / Indeed
LinkedIn biedt de optie aan om ’third party posting’ (het posten door andere partijen dan jijzelf) te laten blokkeren. Dit zorgt ervoor dat enkel de job postings die jij aanmaakt getoond worden aan kandidaten. Indeed is hier ook steeds strenger op en wil koste wat kost ‘duplicate’ content voorkomen om het voor de kandidaat overzichtelijk te houden.
De beste manier om controle te houden op je postings op Indeed of LinkedIn is door met hen in gesprek te gaan en te kijken of je op basis van een XML feed kunt werken. Als zij weten welke posting van jou is, is het voor hen ook makkelijker uitsluiten wat niet van jou is. En ja, dan zul je af en toe ook gesprekken moeten voeren over gesponsorde jobs – maar als dat het ergste is..
Google for Jobs
Het mooie van Google is dat kwaliteit altijd wint, zo ook bij Google for Jobs. Met jouw website, domeinwaarde en unieke content kun je vrijwel altijd bovenaan komen in Google for Jobs. Je kunt simpelweg de hoogste kwaliteit voor de kandidaat bieden omdat je de hoogste kwaliteit aan informatie bezit. Het enige dat je moet doen is alle informatie op jouw werkenbij-site zo volledig mogelijk en gestructureerd aanleveren – structured data.
Commentaar
Ik heb geprobeerd om met bijvoorbeeld werkzoeken.nl in contact te komen en mijn informatie dichterbij de bron te zoeken. Maar daar waar LinkedIn en Indeed me van veel informatie konden voorzien, ben ik bij werkzoeken.nl niet verder gekomen dan een callcenter.

Wel zag ik dat de eigenaar een reactie achterliet onder de Vacature Index van een collega agency op zoek naar transparantie – dus wellicht hoor ik iets naar aanleiding van deze post. Mocht dat zo zijn, horen jullie dat ook uiteraard.