ZOEKSYSTEMEN VERZAMELEN GEBRUIKERSGEGEVENS
Het scala aan trucs om gegevens over gebruikers van zoeksystemen te verzamelen is de afgelopen jaren enorm uitgebreid. Alleen Google en Lycos respecteren de privacy van gebruikers nog enigszins, zo blijkt uit onderzoek van de Duitser Marc Roessler.
Zoeksystemen zijn verreweg de populairste diensten van internet. Ze zijn ideaal om gebruikersgegevens te verzamelen. Wie via een zoekmachine het web afstruint, verraadt via de opgegeven trefwoorden vrij nauwkeurig zijn interesses.
Voor marketingmensen vormen de trefwoorden al jaren een goudmijntje. Door ze te combineren, ontstaan er volledige gebruikersprofielen. Normaliter blijven deze profielen anoniem, maar zodra iemand zijn e-mailadres heeft prijsgegeven, kan zijn profiel aan een werkelijke identiteit worden gekoppeld.
Webmasters van zoeksystemen gaan steeds verder in het samenstellen van dergelijke profielen. Marc Roessler deed onderzoek naar de privacy bij twaalf populaire zoeksystemen, waaronder Google, Altavista, Hotbot en Yahoo. Dat sommige zoeksystemen trefwoorden van gebruikers doorgeven aan adverteerders was op zich al langer bekend, maar wel nieuw is dat de omvang van dit verschijnsel enorm is toegenomen. Inmiddels verzamelen bijna alle populaire zoeksystemen de trefwoorden waarop gebruikers zoeken en worden de daarbij gebruikte technieken steeds geraffineerder.
Trucs
De belangrijkste truc is redirecting: wie op een van de treffers in de lijst van zoekresultaten klikt, komt niet rechtstreeks op de gewenste site, maar wordt er via een andere server heen gesluisd. Hiermee komt deze server niet alleen te weten op welke trefwoorden de gebruiker zocht, maar ook op welke zoekresultaten hij heeft geklikt. Daarnaast geven Excite en Webcrawler ook de precieze tijd door, tot op de seconde nauwkeurig. Roessler vermoedt dat deze informatie wordt gebruikt om de verbindingssnelheid van de gebruiker te schatten, nodig om investeringen in servers en verbindingen te kunnen bepalen.
Er zijn nog veel meer technieken om gegevens te lekken naar andere servers. Bij sommige zoeksystemen bevat de pagina met zoekresultaten een onzichtbaar stukje Javascript of een miniem plaatje van slechts 1 pixel groot dat zich op een andere server bevindt. Zodra het script of het plaatje wordt opgehaald van die server, worden meteen trefwoorden en andere gegevens doorgespeeld.
Ook laten zoeksystemen vaak reclameboodschappen zien via popup-vensters. Achter de schermen komen de boodschappen van een andere server. Ook hier worden in het contact met die server weer de nodige gegevens gelekt.
Al wat langer bekend is het gebruik van cookies, stukjes informatie die op de harde schijf van de gebruiker worden opgeslagen. Bijna alle onderzochte zoeksystemen slaan in deze cookies identificatienummers op. Aan de hand van de nummers kunnen complete profielen worden opgesteld met alle trefwoorden waarop men in de loop der jaren heeft gezocht.
Zelfs wie cookies heeft afgezet in de browserinstellingen, is er nog niet helemaal van verlost. Met behulp van HTML embedded cookies kunnen zoekdiensten identificatienummers van de ene naar de andere pagina doorgeven, zodat ze de trefwoorden van opeenvolgende zoekacties bij elkaar kunnen vegen. Het verschil met conventionele cookies is dat de 'HTML embedded cookies' niet op de harde schijf van de gebruiker zijn opgeslagen, en na afloop van de zoeksessie weer verdwijnen.
Lycos en Google
Alleen Lycos en Google konden enige genade vinden in de ogen van de onderzoeker. Lycos kent geen cookies; alleen links naar reclamebanners bevatten een 'redirect'.
Lycos wordt op enige afstand gevolgd door Google, dat wel cookies met identificatienummers gebruikt, maar geen informatie doorspeelt aan andere partijen. Eigenaardig is wel dat de zoekresultaten van Google soms wel een 'redirect' bevatten, maar soms ook weer niet. Dit gebeurt zonder een duidelijk herkenbaar patroon. Roessler vermoedt dat dit voor statistische doeleinden gebeurt.