Google datacenters

Google datacenters

[harddisk] Datacenters en zoekresultaten

Alle gegevens die je ziet wanneer je een resultatpagina van een zoekopdracht bekijkt zijn opgeslagen op opslagservers.
Er wordt gezegd dat Google inmiddels meer dan 100.000 opslagservers in gebruik heeft. Die kunnen natuurlijk niet allemaal op dezelfde locatie staan en zijn daarom gegroepeerd in zogenaamde 'datacenters'.
Voor zover bekend heeft Google wereldwijd tientallen datacenters in gebruik. In elk datacenter staan weer honderden opslagservers, die via een programma (GoogleBot) het internet afstruinen op zoek naar nieuwe of gewijzigde websites. Al deze verzamelde gegevens komen dus bij aparte datacenters binnen en deze worden vervolgens onderling gesynchroniseerd.

 

Bibliotheek

Misschien kan je het beste hier een beeld van vormen door zo'n datacenter als een soort bibliotheek te zien.
Een bibliotheek staat vol met boeken en teksten (de verzamelde gegevens). Niet elke bibliotheek heeft hetzelfde aanbod aan boeken. Als voorbeeld: soms duurt het even voordat een amerikaans boek in de nederlandse bibliotheek is terug te vinden. Hierdoor loopt een nederlandse bibliotheek tijdelijk 'achter' op zijn amerikaanse collega, maar op termijn wordt het boek ook hier in de schappen gezet.

Ga je wat opzoeken op het internet, dan zal je bij google.com bijvoorbeeld binnen de amerikaanse bibliotheek zoeken en zal je bij google.nl resultaten uit de nederlandse bibliotheek terugvinden. Vaak word je op de achtergrond al automatisch doorverwezen naar de dichtsbijzijnde bibliotheek in jouw land of naar de bibliotheek waar het op dat moment wat minder druk is.

Als je dit in het achterhoofd houdt kan je ook verklaren waarom je bij de amerikaanse datacenters de zoekresultaten vaak in een andere volgorde terugvindt dan bij de nederlandse of dat je daar zelfs heel afwijkende resultaten aantreft. Niet alle datacenters worden tegelijkertijd bijgewerkt en daarnaast kunnen datacenters onderling verschillen in manieren van het filteren van de inhoud van webpagina's en de hantering van indexalgoritmen.

 

Alhoewel de bovenstaande tekst alleen over Google gaat, ligt het voor de hand dat andere zoekinstituten zoals MSN-search, Yahoo etc. op dezelfde manier opereren.

 

Deze pagina wordt nog verder aangevuld...


Creative Commons License
Op dit werk is een Creative Commons Licentie van toepassing.

Zoek binnen de Challenge websites

Volg ons op:

Word lid!
Facebookpagina Challenge

| FAQ | Contact | Sitemap | Privacy (!) | Pagina afdrukken

Interkerkelijk Jongerenkoor Challenge arrow Problemen of suggesties? We horen dit graag van je!

Challenge is een Christelijk koor / gospelkoor uit Dordrecht
Deze pagina is bijgewerkt op woensdag 30 november 2011 om 12:44:09 uur

Page generated in 0,009050 seconds,  x

CheckStat