cum Google caută 30 de trilioane de pagini web, de 100 de miliarde de ori pe lună

large_3951143570cum executați 100 de miliarde de căutări pe web pe lună?

Google a oferit o privire interioară asupra modului în care funcționează astăzi căutarea pe web, dezvăluind câteva numere fascinante în acest proces.

căutarea începe, desigur, cu crawlere și indexare, iar Google spune că web-ul are acum 30 de trilioane de pagini individuale unice. Asta uimitor de 30 de ori în cinci ani: Google a raportat în 2008 că web-ul avea doar un trilion de pagini.

Google spune că stochează informații despre acele 30 de trilioane de pagini în indexul Google, care este acum la 100 de milioane de Gigabyte. Asta înseamnă aproximativ o mie de terabytes și ai nevoie de peste trei milioane de unități USB de 32 GB pentru a stoca toate aceste date.

Screen Shot 2013-03-01 la 12.39.51 PM când căutați, Google încearcă să dau seama nu doar ceea ce tastați în caseta, dar ceea ce vrei sa spui. Deci, algoritmi de ortografie, completare automată, sinonime, și interogare înțelegere salt în acțiune. Când Google crede că știe ce vrei, trage rezultate din acele 30 de trilioane de pagini și 100 de milioane de gigabyte, dar nu îți oferă doar ceea ce găsește.

în primul rând, o procedură de clasare utilizează peste 200 de factori secreți bine păziți care privesc prospețimea rezultatelor, calitatea site-ului web, vârsta domeniului, siguranța și adecvarea conținutului și contextul utilizatorului, cum ar fi locația, căutările anterioare, istoricul și conexiunile Google+ și multe altele.

apoi, în puțin peste o optime de secundă, Google livrează rezultatele pe computer, tabletă sau telefon.

pentru a testa cât de bine funcționează căutările sale, Google folosește și oameni reali: evaluatori de căutare. De patruzeci de mii de ori pe an, testerii de căutare Google verifică rezultatele, văd ce funcționează și oferă sugestii despre cum să se îmbunătățească.

și ce zici de spam-ul web?

spam-ul Web este pagini inutile care sunt create pentru a se clasifica bine pe Google, pentru a vă atrage atenția și a face clic, apoi pentru a genera bani din globurile oculare sau pentru a face clic în altă parte. Google a declarat că notifică site-urile că le consideră spam sau că au fost hacked, la o rată de 40.000-60.000 pe lună.

Credit foto: St.Inktiffan via photopin cc

VentureBeat

Misiunea VentureBeat este de a fi o piață digitală a orașului pentru factorii de decizie tehnici să dobândească cunoștințe despre tehnologia transformatoare și să tranzacționeze.Site-ul nostru oferă informații esențiale despre tehnologiile și strategiile de date pentru a vă ghida în timp ce vă conduceți organizațiile. Vă invităm să deveniți membru al comunității noastre, să accesați:

  • informații actualizate despre subiectele care vă interesează
  • buletinele noastre informative
  • conținut de lider de gândire închis și acces redus la evenimentele noastre apreciate, cum ar fi Transform 2021: Aflați mai multe
  • funcții de rețea și multe altele

Deveniți membru

Lasă un răspuns

Adresa ta de email nu va fi publicată.