Miten Google etsii 30 biljoonaa web-sivua, 100 miljardia kertaa kuukaudessa

large_3951143570miten teet 100 miljardia web-hakua kuukaudessa?

Google antoi sisäpiirin kurkistuksen siihen, miten verkkohaku toimii nykyään, paljastaen joitakin kiehtovia numeroita prosessissa.

haku alkaa tietysti ryömimällä ja indeksoimalla, ja Googlen mukaan verkossa on nyt 30 biljoonaa uniikkia yksittäistä sivua. Että jopa hämmästyttävä 30 kertaa viidessä vuodessa: Google raportoi vuonna 2008, että web oli vain biljoona sivua.

Google kertoo tallentavansa tietoja noista 30 biljoonasivuista Googlen indeksiin, joka on nyt 100 miljoonaa gigatavua. Se on noin tuhat teratavua, ja tarvitset yli kolme miljoonaa 32 Gt USB-muistitikkua tallentaaksesi kaiken tiedon.

ruutukuva 2013-03-01 klo 12.39.51 hakua tehdessä Google yrittää selvittää paitsi mitä ruutuun kirjoittaa, myös mitä tarkoittaa. Joten algoritmit oikeinkirjoitus, automaattinen täydennys, synonyymit, ja kyselyn ymmärrystä hypätä toimintaan. Kun Google luulee tietävänsä, mitä haluaa, se vetää tuloksia noista 30 biljoonasta sivusta ja 100 miljoonasta gigatavusta, mutta se ei vain anna löytämäänsä.

ensinnäkin ranking-menettelyssä käytetään yli 200 tarkoin varjeltua salaista tekijää, jotka tarkastelevat tulosten tuoreutta, sivuston laatua, verkkotunnuksen ikää, turvallisuutta ja sisällön asianmukaisuutta sekä käyttäjäyhteyttä, kuten sijaintia, ennakkohakuja, Google+ – historiaa ja yhteyksiä ja paljon muuta.

tämän jälkeen Google toimittaa tulokset hieman yli kahdeksasosasekunnin kuluttua tietokoneellesi, tabletillesi tai puhelimeesi.

testatakseen, kuinka hyvin sen haut todellisuudessa suoriutuvat, Google käyttää myös oikeita ihmisiä: hakuarvioijia. 40 000 kertaa vuodessa Googlen hakutestaajat tarkistavat tulokset, näkevät, mikä toimii, ja antavat ehdotuksia siitä, miten parantaa.

ja miten on nettiroskan laita?

web spam on hyödytön sivuja, jotka on muotoiltu sijoitus hyvin Google, kiinnittää huomiota ja napsautuksia, ja sitten rahastaa silmämunat tai napsauttaa pois jonnekin muualle. Google kertoi ilmoittavansa sivustoille, että se pitää niitä roskapostina tai että niitä on hakkeroitu 40 000-60 000 kuukaudessa.

photo credit: Stéfan via photopin cc

VentureBeat

VentureBeatin tehtävänä on toimia digitaalisena kaupunkiaukiona teknisille päättäjille, jotka hankkivat tietoa transformatiivisesta teknologiasta ja transaktiosta.Sivustomme tarjoaa olennaista tietoa tietotekniikoista ja strategioista, jotka ohjaavat sinua johtaessasi organisaatioitasi. Kutsumme sinut jäseneksi yhteisömme, pääsy:

  • ajantasaista tietoa sinua kiinnostavista aiheista
  • uutiskirjeemme
  • aidattu ajatusjohtajasisältö ja alennettu pääsy arvostettuihin tapahtumiimme, kuten Transform 2021: Learn More
  • networking features, and more

liity jäseneksi

Vastaa

Sähköpostiosoitettasi ei julkaista.