hvordan Google søger 30 billioner hjemmesider, 100 milliarder gange om måneden

large_3951143570 Hvordan kører du 100 milliarder internetsøgninger om måneden?

Google gav et indblik i, hvordan internetsøgning fungerer i dag og afslørede nogle fascinerende tal i processen.

søgning Starter selvfølgelig med gennemsøgning og indeksering, og Google siger, at internettet nu har 30 billioner unikke individuelle sider. Det er forbløffende 30 gange på fem år: Google rapporterede i 2008, at internettet kun havde en billion sider.

Google siger, at det gemmer oplysninger om de 30 billioner sider i Google-indekset, som nu er på 100 millioner gigabyte. Det er omkring tusind terabyte, og du har brug for over tre millioner 32 GB USB-drev til at gemme alle disse data.

Screen Shot 2013-03-01 på 12.39.51 PM når du søger, Google forsøger at finde ud af ikke bare, hvad du skriver ind i boksen, men hvad du mener. Så algoritmer til stavning, autofuldførelse, synonymer og forespørgselsforståelse springer i aktion. Når Google mener, at det ved, hvad du vil, trækker det Resultater fra de 30 billioner sider og 100 millioner gigabyte, men det giver dig ikke bare det, den finder.

for det første bruger en rangeringsprocedure over 200 nøje beskyttede hemmelige faktorer, der ser på friskheden af resultaterne, kvaliteten af hjemmesiden, domænets alder, sikkerhed og hensigtsmæssighed af indholdet og brugerkontekst som placering, tidligere søgninger, Google+ historie og forbindelser og meget mere.

på lidt over en ottendedel af et sekund leverer Google derefter resultaterne til din computer, tablet eller telefon.

for at teste, hvor godt dets søgninger faktisk udfører, bruger Google også virkelige mennesker: søgevaluatorer. Fyrre tusind gange om året tjekker Googles søgetestere resultater, ser, hvad der fungerer, og giver forslag til, hvordan man forbedrer sig.

hvad med spam?

internetspam er ubrugelige sider, der er udformet til at rangere godt på Google, henlede opmærksomheden og klik og derefter tjene penge på dine øjenkugler eller klik til et andet sted. Google sagde, at det meddeler sider, at det betragter dem som spam, eller at de er blevet hacket, med en hastighed på 40,000-60,000 pr.

Fotokredit: St. Kristian via photopin cc

VentureBeat

Venturebeats mission er at være et digitalt Bytorv for tekniske beslutningstagere for at få viden om transformativ teknologi og transaktion.Vores hjemmeside leverer vigtige oplysninger om datateknologier og strategier til at guide dig, når du leder dine organisationer. Vi inviterer dig til at blive medlem af vores samfund, for at få adgang:

  • opdateret information om emnerne af interesse for dig
  • vores nyhedsbreve
  • gated thought-leader indhold og nedsat adgang til vores værdsatte begivenheder, såsom Transform 2021: Lær mere
  • netværksfunktioner og mere

Bliv medlem

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.