hur Google söker 30 biljoner webbsidor, 100 miljarder gånger i månaden

large_3951143570hur kör du 100 miljarder webbsökningar i månaden?

Google gav en inblick i hur webbsökning fungerar idag och avslöjade några fascinerande siffror i processen.

sökningen börjar naturligtvis med genomsökning och indexering, och Google säger att webben nu har 30 biljoner unika enskilda sidor. Det upp en häpnadsväckande 30 gånger på fem år: Google rapporterade 2008 att webben hade bara en biljon sidor.

Google säger att det lagrar information om de 30 biljoner sidorna i Google-indexet, som nu ligger på 100 miljoner Gigabyte. Det är ungefär tusen terabyte, och du skulle behöva över tre miljoner 32GB USB-minnen för att lagra alla dessa data.

Screen Shot 2013-03-01 vid 12.39.51 PM när du söker, Google försöker räkna ut inte bara vad du skriver i rutan, men vad du menar. Så algoritmer för stavning, automatisk komplettering, synonymer och frågeförståelse hoppar till handling. När Google tror att det vet vad du vill, drar det resultat från de 30 biljoner sidorna och 100 miljoner gigabyte, men det ger dig inte bara vad den hittar.

för det första använder en rankningsprocedur över 200 noggrant bevakade hemliga faktorer som tittar på resultatens färskhet, webbplatsens kvalitet, domänens ålder, innehållets säkerhet och lämplighet och användarkontext som plats, tidigare sökningar, Google+ historik och anslutningar och mycket mer.

sedan, på drygt en åttondel av en sekund, levererar Google sedan resultaten till din dator, surfplatta eller telefon.

för att testa hur bra sökningarna faktiskt fungerar använder Google också verkliga människor: sökutvärderare. Fyrtio tusen gånger om året kontrollerar Googles söktestare resultat, ser vad som fungerar och ger förslag på hur man kan förbättra.

och vad sägs om webbspam?

webbspam är värdelösa sidor som är utformade för att ranka bra på Google, dra din uppmärksamhet och klick och sedan tjäna pengar på dina ögonbollar eller klick till någon annanstans. Google sa att det meddelar webbplatser att det anser dem spam, eller att de har hackats, med en hastighet av 40,000-60,000 per månad.

Fotokredit: St Jacobfan via photopin cc

VentureBeat

Venturebeats uppdrag är att vara ett digitalt torg för tekniska beslutsfattare för att få kunskap om transformativ teknik och transaktioner.Vår webbplats ger viktig information om datateknik och strategier för att vägleda dig när du leder dina organisationer. Vi inbjuder dig att bli medlem i vårt samhälle, för att komma åt:

  • aktuell information om ämnen av intresse för dig
  • våra nyhetsbrev
  • gated thought-leader-innehåll och rabatterad tillgång till våra prisade evenemang, till exempel Transform 2021: Läs mer
  • nätverksfunktioner och mer

bli medlem

Lämna ett svar

Din e-postadress kommer inte publiceras.