Datacenters
en zoekresultaten
Alle gegevens die je ziet wanneer je een resultatpagina
van een zoekopdracht bekijkt zijn opgeslagen op
opslagservers.
Er
wordt gezegd dat Google inmiddels meer dan 100.000
opslagservers in gebruik heeft. Die kunnen natuurlijk
niet allemaal
op dezelfde locatie staan en zijn daarom gegroepeerd
in zogenaamde 'datacenters'.
Voor zover bekend heeft Google wereldwijd tientallen
datacenters in gebruik. In elk datacenter staan
weer honderden opslagservers, die via een programma
(GoogleBot)
het internet afstruinen op zoek naar nieuwe of gewijzigde
websites. Al deze verzamelde gegevens komen dus bij
aparte datacenters binnen en deze worden vervolgens
onderling gesynchroniseerd.
Bibliotheek Misschien
kan je het beste hier een beeld van vormen door zo'n
datacenter als
een
soort
bibliotheek
te
zien.
Een bibliotheek staat vol met boeken
en teksten (de verzamelde gegevens). Niet elke bibliotheek
heeft hetzelfde aanbod aan boeken. Als voorbeeld: soms
duurt het even voordat een amerikaans boek in de nederlandse
bibliotheek
is
terug
te vinden. Hierdoor loopt een nederlandse bibliotheek
tijdelijk 'achter' op zijn amerikaanse collega, maar
op termijn wordt het boek ook hier in de schappen gezet.
Ga je wat opzoeken op het internet, dan zal je bij google.com
bijvoorbeeld binnen de amerikaanse bibliotheek zoeken
en zal je bij google.nl resultaten uit de nederlandse
bibliotheek
terugvinden. Vaak word je op de achtergrond al automatisch
doorverwezen naar de dichtsbijzijnde bibliotheek in jouw
land of naar de bibliotheek waar het op dat moment wat
minder druk is.
Als je dit in het achterhoofd houdt kan je ook verklaren
waarom je bij de amerikaanse datacenters de zoekresultaten
vaak in een andere volgorde terugvindt dan bij de nederlandse
of dat je daar zelfs heel afwijkende resultaten aantreft.
Niet alle datacenters worden tegelijkertijd bijgewerkt
en daarnaast
kunnen datacenters
onderling verschillen in manieren van het filteren van de
inhoud van webpagina's en de hantering van indexalgoritmen.
Alhoewel de bovenstaande tekst alleen over Google gaat,
ligt het voor de hand dat andere zoekinstituten zoals
MSN-search, Yahoo etc. op dezelfde manier opereren.
Deze pagina wordt nog verder aangevuld...
|