Waarom Google zijn gebruikersdata niet wil delen en wat dat betekent voor je SEO

Home
/
bloggen

Ik zie veel ondernemers die SEO nog steeds bekijken als een spel van techniek, links en een beetje content. In de nieuwste documenten in de DOJ vs. Google zaak wordt iets anders pijnlijk duidelijk: het voordeel van Google zit niet alleen in het web indexeren, maar vooral in wat ze leren van gedrag van echte mensen. En precies dát willen ze niet weggeven.

Wat er speelt in de DOJ vs. Google zaak

In de antitrustzaak is Google opgedragen om bepaalde informatie met concurrenten te delen, zodat de markt minder scheef groeit. Google is daartegen in beroep gegaan. De kern van hun bezwaar is logisch vanuit hun perspectief: als je concurrenten toegang geeft tot de systemen en datasets die jaren hebben gekost om op te bouwen, geef je niet alleen transparantie, je geeft een snelkoppeling naar je voorsprong.

Wat ik interessant vind aan de verklaring van Liz Reid (Search) is hoe concreet Google beschrijft welke onderdelen ze als bedrijfsgeheim zien, en waarom. Dat geeft ons als marketeers een zeldzaam kijkje in hoe er intern naar kwaliteit, spam, versheid en gebruikerssignalen wordt gekeken.

Kwaliteit en versheid zijn geen ‘algemene kennis’

Dat Google eigen kwaliteitssignalen heeft, is geen verrassing. Het opvallende is dat ‘versheid’ (freshness) in de documenten expliciet wordt neergezet als onderdeel van de geheime saus. Met andere woorden: het is niet alleen de inhoud, maar ook hoe actueel en relevant die inhoud aanvoelt in de context van een zoekopdracht.

Voor bedrijven in e commerce en contentgedreven sectoren is dat een goede reality check. Je hoeft niet elke pagina wekelijks te herschrijven, maar je moet wel bewaken welke onderdelen verouderen: prijzen, assortiment, wetgeving, specificaties, levertijden, voorraad, cases, voorbeelden en screenshots. Versheid gaat vaak meer over onderhoud dan over ‘nieuw’.

Elke geïndexeerde pagina krijgt interne aantekeningen

Volgens de stukken worden pagina’s in de index voorzien van ‘page understanding annotations’. Zie het als interne labels die Google helpen begrijpen wat een pagina is, hoe die zich verhoudt tot andere pagina’s en of er signalen zijn voor duplicatie of spam.

Dit sluit aan op wat we al langer in de praktijk merken: je kunt technisch alles goed doen en tóch geen zichtbaarheid krijgen als de totale indruk niet klopt, of als er patronen zijn die lijken op manipulatie. Die aantekeningen zijn geen simpel vinkje, het is een stapel signalen die samen richting geven aan hoe een pagina wordt behandeld.

Waarom spam scores zo gevoelig liggen

In dezelfde lijn noemt Google dat deze annotaties ook spamsignalen bevatten. Als zulke scores of signalen extern bekend worden, kunnen spammers ze gebruiken om het systeem terug te redeneren. Dat maakt het voor Google lastiger om spam te bestrijden.

Voor jou als ondernemer zit hier een les in die ik vaak herhaal: bouw je groei niet op trucjes. Alles wat je vandaag kunt misbruiken, wordt morgen een risico. Je wilt een aanpak die overeind blijft als Google de spelregels aanscherpt.

De index bouwen is meer dan pagina’s opslaan

Een ander detail dat me opviel: Google organiseert de index op basis van hoe vaak ze verwachten dat content opgevraagd wordt en hoe ‘vers’ die moet blijven. Dat zegt iets over schaal, kosten en prioriteit. Niet alles krijgt dezelfde behandeling.

Als je ooit hebt gedacht: waarom ziet Google deze pagina niet, of waarom duurt het zo lang, dan is dit een deel van het antwoord. Crawl budget en indexatie zijn niet alleen technische thema’s, ze zijn ook een allocatievraagstuk aan Google kant.

Slechts een deel van het web komt in de index en dat is bewust

Google stelt dat maar een fractie van alle pagina’s uiteindelijk in de index belandt. In het beroep geven ze een helder argument tegen het delen van een lijst met geïndexeerde URL’s: concurrenten zouden dan minder hoeven te crawlen en analyseren, en kunnen zich richten op precies dat deel dat Google al geselecteerd heeft.

Met andere woorden: de selectie zelf is waarde. En die selectie is het resultaat van veel tijd, geld en infrastructuur. Voor jou betekent dit vooral dat “we hebben een pagina gepubliceerd” nooit automatisch gelijkstaat aan “Google gaat hem gebruiken”. Je moet verdienen dat je meegenomen wordt.

Gebruikersgedrag is de motor: Glue en RankEmbed BERT

Het meest leerzame deel gaat over gebruikersdata. Google beschrijft ‘Glue’ als een enorme tabel met zoekactiviteit. Daarin staat onder meer de zoekopdracht, taal, locatie, apparaat en wat iemand op de resultatenpagina te zien kreeg. Vervolgens wordt vastgelegd hoe iemand reageerde, zoals klikken, hoveren, terugkeren naar de resultaten en tijdspatronen.

Die data voedt modellen zoals RankEmbed BERT. Uit eerder getuigenis van Pandu Nayak blijkt dat zo’n model wordt gebruikt om resultaten opnieuw te rangschikken nadat traditionele systemen een eerste selectie hebben gemaakt. Het model leert dus van echte keuzes van echte mensen.

Daarnaast draait Google continu live experimenten om te kijken wat gebruikers verkiezen, en gebruikt het feedback van quality raters om modellen bij te sturen. De rode draad is simpel: tevredenheid wint. Niet in een slogan, maar als trainingsdata.

Hoe groot is de rol van Chrome data?

Een vraag die bij mij meteen opkomt, en die ook in de discussie terugkomt: in hoeverre kijkt Google voorbij de zoekresultatenpagina? Dus niet alleen wat iemand aanklikt, maar wat iemand daarna op je site doet.

De samenvatting van de uitspraak hint dat ‘Chrome popularity data’ een rol kan spelen, maar er wordt weinig detail gedeeld. Of het nu zwaar meeweegt of beperkt wordt gebruikt, de richting is duidelijk: gedrag na de klik is belangrijker dan ooit. Een pagina die verkeer pakt maar teleurstelt, is geen duurzame strategie.

Waarom Google zegt dat je met deze data een LLM kunt trainen

Google stelt in de stukken dat als iemand toegang zou krijgen tot de Glue en RankEmbed gebruikersdata, die partij daar een taalmodel (LLM) mee zou kunnen trainen. Dat klinkt als juridisch argument, maar het is ook een erkenning van wat die data vertegenwoordigt: een enorme verzameling feedback over wat mensen zoeken, wat ze verwachten en wat uiteindelijk werkt.

Voor ondernemers is dit een nuchtere reminder: AI in search gaat niet alleen over betere taal, het gaat over betere feedbackloops. En Google heeft er daar heel veel van.

Wat je hier als Nederlandse ondernemer mee doet

Je hoeft hier niet bang van te worden, maar je moet wel slimmer prioriteren. Als gebruikersdata het verschil maakt, dan wint de partij die de bezoeker het best helpt.

Begin praktisch. Kijk per belangrijke pagina of iemand snel vindt wat hij zoekt, of hij doorklikt naar een volgende stap, en of je content echt aansluit bij de intentie achter de zoekvraag. Zorg dat productpagina’s, categorieën en servicepagina’s actueel blijven, en dat je niet leunt op eenmalige SEO projecten.

En minstens zo belangrijk: bouw aan je eigen data. Denk aan e mail, herhaalaankopen, retourredenen, onsite zoekgedrag, supportvragen en reviews. Daarmee zie je sneller waar mensen afhaken en wat ze missen. Dat is niet alleen goed voor conversie, het maakt je minder afhankelijk van wat Google wel of niet toont.

Verder lezen als je de bron wilt zien

De context over de remedies en het beroep staat hier: https://www.searchenginejournal.com/googles-antitrust-ruling-what-the-remedies-mean-for-search-seo-and-ai-assistants/555086/

De verklaring van Liz Reid is hier te vinden: https://www.courtlistener.com/docket/18552824/1471/2/united-states-of-america-v-google-llc/

De samenvatting van de uitspraak (waar ook Chrome data wordt genoemd) staat hier: https://storage.courtlistener.com/recap/gov.uscourts.dcd.223205/gov.uscourts.dcd.223205.1436.0_4.pdf

En als achtergrond over freshness: https://www.searchenginejournal.com/google-algorithm-history/freshness-algorithm/

Neem contact op

Eerlijkheid staat voorop in mijn werk. Daarom zeg ik direct: ik ben niet de juiste partner voor jou als. Ik help je om jouw merk te transformeren van een fluistering naar een brul die niemand kan negeren.

Ik ben niet gebouwd om mee te doen, ik ben ontworpen om te domineren.

Contact Us