De Vliegende Karper: De Google Paradox

Permalink, 1 April 2009

'Googlen' is een werkwoord geworden in onze taal, synoniem voor zoeken op het Web. Het probleem is dat we er zo kritiekloos mee omgaan, alsof Google alle antwoorden heeft. Ons vertrouwen in Google berust echter op een misvatting volgens Siva Vaidhyanathan, professor in de Bibliotheekwetenschappen:

"....We do not properly understand the nature of the nature of the transaction between us and Google. ...into our relationship with Google we do not grasp that we are not really Google's costumers. Google calls us users, but in fact we are Google's products. Our attention is what Google sells to its customers, which are the advertisers." (BBC interview)

We zijn dus geen klanten van Google, maar Google gebruikt onze argeloze aandacht en nieuwsgierigheid om zijn adverteerders te bedienen.

Volgens prominente linguisten zoals Arbib en Lakoff verklaren spiegelneuronen de biologische ontwikkeling van het menselijk taalvermogen (Arbib, 2005; Gallese, Lakoff, 2007). Ze maken het in alle geval mogelijk dat we elkaar begrijpen zelfs in dubbelzinnige situaties die weinig aanknopingspunten bieden. Omdat spiegelneuronen het mogelijk maken ons in de schoenen van iemand anders te plaatsen kunnen we ook zijn intenties begrijpen. Ook als we zoeken met Google maken we op een of andere manier onze intenties duidelijk. Google krijgt onze aandacht gratis. De vraag is schenkt Google ook aandacht aan ons, of loert het gewoon van achter een doorkijkspiegel naar ons terwijl het ons wat brokjes informatie toegooit die al of niet relevant zijn voor onze vraag.

Google verzamelt en bewaart in alle geval persoonlijke gegevens over ons. In Google's privacyoverzicht kan je zien welke gegevens het verzamelt over zijn gebruikers. Als je aangemeld bent bij Google kan je ook je zoekgeschiedenis bekijken. Google gebruikt die gegevens over onze intenties om ons advertenties voor te schotelen aangepast aan de context. Google maakt ook een profiel op basis van ons zoekgedrag, maar dit profiel krijgen we niet te zien, alhoewel Google zich het recht voorbehoudt dit profiel met derde partijen te delen:

We kunnen persoonlijke gegevens gebruiken om de door u gevraagde services te verbeteren, zoals services die aangepaste inhoud en advertenties weergeven.

We kunnen persoonlijke gegevens ook gebruiken voor controle, onderzoek en analyse om zo de Google-technologieën en -services te leveren en te verbeteren.

We kunnen gecombineerde, niet-persoonlijk traceerbare gegevens mogelijk doorgeven aan derden buiten Google.

Wanneer we de hulp van derden inroepen om uw persoonlijke gegevens te verwerken, vereisen we dat zij zich houden aan ons privacybeleid en de vereiste maatregelen treffen met betrekking tot vertrouwelijkheid en beveiliging.

We kunnen gegevens in speciale gevallen ook aan derden ter beschikking stellen, bijvoorbeeld als dat in overeenstemming is met juridische procedures, fraude of schade voorkomt, of de veiligheid van ons netwerk en onze services garandeert.

Google verwerkt persoonlijke gegevens op onze servers in de Verenigde Staten en in andere landen. In bepaalde gevallen verwerken we persoonlijke gegevens op een server die zich niet in uw eigen land bevindt. (http://www.google.be/intl/nl/privacy_highlights.html)

De verbijsterende paradox is dat Google beweert die gegevens te gebruiken om zijn diensten te verbeteren maar daarin achterblijft tegenover andere zoekmachines omdat zoeken niet de business is van Google maar wel adverteren. Onlangs implementeerde Google een verbetering van zijn zoekresultaten. Volgens 'The Official Google Blog' voegde het op 24 maart 2009 "a new technology that can better understand associations and concepts related to your search" toe aan pagina met de zoekresultaten. Nu was het wel hoog tijd dat Google deze verbetering invoerder, de voornaamste concurrenten hadden dit al jaren eerder gedaan.

Ask geeft 'Related Searches' sedert mei 2005[1]. 'Ask' stelt daarnaast ook een lijst van veel gestelde vragen en antwoorden voor die verband houden met het onderwerp. Van bij zijn lancering in juli 2008 toont Cuil verwante categorieën en subcategoriën in de rechterkolom. 'Ask' en 'Cuil' waren niet alleen eerder in het aanbieden van verwante concepten, ze bieden ook meer dan Google. Yahoo's versie van verwante concepten is met die van Google te vergelijken met dat verschil dat het reeds voorhandig is sedert 9 mei 2006[2]. Wikia Search biedt niet enkel verwante begrippen aan maar laat de gebruikers ook toe om interactief suggesties toe te voegen volgens de vertrouwde Wiki procedure en dit sedert juni 2008[3]. Het lijkt er dus meer op dat Google de hete adem van zijn concurrenten in zijn nek begon te voelen in plaats van vernieuwend te zijn zoals het de zaken voorstelt. In feite blijft Google achterop hinken als het vernieuwing en verbetering betreft.

Is Google dan zo dom of denkt het dat wij dol zijn? Ik vrees dat dit laatste het geval is. Google heeft de beste brains verzameld in Mountain View en het financiert top research aan verschillende universiteiten maar het gebruik van die kennis komt meer en meer in botsing met zijn 'busines model'. Als gebruikers van Google direct die relevante zoekresultaten zouden voorgeschoteld krijgen die ze willen, dan wordt het window om pay-per-click advertenties te tonen wel heel klein. Deze advertenties zijn het hoofdinkomen van Google sedert Microsoft en Yahoo hun eigen zoekrobotten gebruiken. Door semantiek toe te voegen aan zijn zoekresultaten verlaat Google ook gedeeltelijk zijn mythisch zoekalgoritme PageRanking, ontwikkeld door de oprichters van Google Larry Page en Sergey Brin. Kort samengevat werkt het als volgt: de zoekmachine kijkt hoe vaak de ene website door de andere wordt genoemd en onthoudt dat heel precies. Hoe vaker naar een website wordt verwezen, hoe hoger het resultaat in Google. Niet alleen zijn deze verwijzingen gemakkelijk manipuleerbaar[4], het algoritme kent ook geen enkele betekenis toe aan de informatie die het voorschotelt en dat zou volgens Henk van Ess wel eens de Achilleshiel van Google kunnen zijn:

"Durfinvesteerders geloven in hun zoektocht naar de opvolger van Google. Zij staken de afgelopen drie jaar meer dan 250 miljoen euro in tientallen startups die zoekmachines ontwikkelen. Hun zoekrobots moeten beter begrijpen wat gebruikers zoeken op het web. „Alle initiatieven richten zich op de achilleshiel van Google", zegt de Nederlandse internetdeskundige Henk van Ess. „Google kent geen betekenis toe aan zoekresultaten. Het weet niet wat het voorschotelt.""[5]

Vroeg of laat zal Google uit de markt geprezen worden als de zoekmachine zich niet weet aan te passen aan de vereisten van de menselijke intelligentie. We gaan hier in op een van de belangrijkste aspecten van ons zoekgedrag, namelijk dat het intentioneel is. Momenteel wordt dit nog zwaar uitgebuit door Google, zonder dat het daar veel voor in de plaats aanbiedt.

Alhoewel dat niet zo lijkt, toch zijn de antwoorden die Google en andere zoekrobotten ons voorschotelen vrij willekeurig. Dat het niet onwijs is als je op zoek ben naar goede informatie om eerst in de Wikipedia te zoeken eventueel met Powerset en pas dan met verschillende zoekrobotten te zoeken. Zoekrobotten geven onderling uiteenlopende resutaten weer. Dit wordt grafisch weergegeven op de site Thumbshots. Het programma zoekt hetzelfde met Google, Yahoo en Live en toont grafisch - met blauwe en grijze bolletjes - welke zoekresultaten overlappen. Bij uiteenlopende zoektermen is dat ten hoogste 20 procent. Dit is verbazend weinig en doet ons sterk twijfelen aan de betrouwbaarheid van zoekrobotten in het algemeen.

[1] Zie Ask Jeeves Serves Up New Features

[2] Zie Livesearch on AlltheWeb

[3] Zie Wikia Adds Features to its Open Source Search and Search Wikia Launches Open Source, Distributed Crawler

[4] Er draait in feite een hele industrie op de Search Engine Optimizers. De simpelste manier is drukbezochte webspace huren en daar dan links plaatsen. Niet verwonderlijk maar wel verwerpelijk en heel hypocriet wordt die industrie op verschillende manieren gevoed vanuit Google, onder andere door trefwoorden ten veilen.

[5] Zie http://www.voelspriet.nl/googlekillers.htm

Dit is de vertaling van het eerste deel van een artikel oorspronkelijk gepubliceerd in het Engels:
Google’s one-way mirror: a business model for privacy invasion [CIS 2]

Google Vertaal

dinsdag 31 maart 2009

De Google Paradox

Geen opmerkingen:

Blogarchief

Open Democracy Features

Mediakritiek - Blog

Mediakritiek - Blog - Reacties

De nieuwe reporter

The Wings of the Carp

cedille

Willem's Weblog

MO.be

open Democracy News Analysis -

Wobbing Europe - News

Gentblogt

Sanne Brand

About This Blog