hoe doorzoekt Google 30 biljoen webpagina’ s, 100 miljard keer per maand

large_3951143570hoe voert u 100 miljard zoekopdrachten per maand uit?

Google gaf een kijkje in hoe het zoeken op het web vandaag de dag werkt, en onthulde enkele fascinerende cijfers in het proces.

zoeken begint natuurlijk met crawlen en indexeren, en Google zegt dat het web nu 30 biljoen unieke individuele pagina ‘ s heeft. Dat is een verbazingwekkende 30 keer gestegen in vijf jaar: Google meldde in 2008 dat het web slechts een biljoen pagina ‘ s had.

Google zegt dat het informatie over die 30 biljoen pagina ‘ s opslaat in de Google Index, die nu 100 miljoen Gigabyte bedraagt. Dat is ongeveer duizend terabytes, en je hebt meer dan drie miljoen 32GB USB-sticks nodig om al die gegevens op te slaan.

schermafbeelding 2013-03-01 om 12.39.51 PMwanneer u zoekt, probeert Google niet alleen te achterhalen wat u in het vak typt, maar wat u bedoelt. Dus algoritmen voor spelling, automatische aanvulling, synoniemen, en query begrip springen in actie. Als Google denkt dat het weet wat je wilt, haalt het de resultaten van die 30 biljoen pagina ‘ s en 100 miljoen Gigabyte, maar het geeft je niet alleen wat het vindt.

Ten eerste maakt een rangschikkingsprocedure gebruik van meer dan 200 zorgvuldig bewaakte geheime factoren die kijken naar de versheid van de resultaten, kwaliteit van de website, leeftijd van het domein, veiligheid en geschiktheid van de inhoud, en gebruikerscontext zoals locatie, eerdere zoekopdrachten, Google+ geschiedenis en verbindingen, en nog veel meer.

vervolgens levert Google in iets meer dan een achtste van een seconde de resultaten op uw computer, tablet of telefoon.

om te testen hoe goed zijn zoekopdrachten daadwerkelijk presteren, gebruikt Google ook real-live humans: search evaluators. Veertigduizend keer per jaar controleren de zoekmachines van Google de resultaten, zien wat er werkt en geven ze suggesties over hoe ze kunnen verbeteren.

en hoe zit het met webspam?

Web spam is nutteloze pagina ‘ s die zijn gemaakt om goed te scoren op Google, uw aandacht te trekken en klikken, en vervolgens geld te verdienen met uw oogballen of klikken naar ergens anders. Google zei dat het waarschuwt sites die zij beschouwt hen spam, of dat ze zijn gehackt, met een snelheid van 40.000-60.000 per maand.

Fotokrediet: Stéfan via photopin cc

VentureBeat

de missie van VentureBeat is om een digitaal stadsplein te zijn voor technische besluitvormers om kennis te verwerven over transformatieve technologie en transacties.Onze site levert essentiële informatie over datatechnologieën en-strategieën om u te begeleiden terwijl u uw organisaties leidt. Wij nodigen u uit om lid te worden van onze gemeenschap, om toegang te krijgen:

  • up-to-date informatie over onderwerpen die voor u interessant zijn
  • onze nieuwsbrieven
  • gated thought-leader content en korting op toegang tot onze gewaardeerde evenementen, zoals Transform 2021: meer informatie
  • netwerkfuncties, en meer

lid worden

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.