jak Google przeszukuje 30 bilionów stron internetowych, 100 miliardów razy miesięcznie

large_3951143570jak uruchomić 100 miliardów wyszukiwań miesięcznie?

Google dał wgląd w to, jak działa dzisiaj wyszukiwanie w Internecie, ujawniając kilka fascynujących liczb w tym procesie.

Wyszukiwanie zaczyna się oczywiście od indeksowania i indeksowania, a Google mówi, że sieć ma teraz 30 bilionów unikalnych indywidualnych stron. To się zdumiewające 30 razy w ciągu pięciu lat: Google poinformował w 2008 roku, że sieć miała tylko jeden bilion stron.

Google twierdzi, że przechowuje informacje o tych 30 bilionach stron w indeksie Google, który ma teraz 100 milionów gigabajtów. To około tysiąca terabajtów, a do przechowywania tych danych potrzeba ponad trzech milionów 32GB pendrive ’ ów USB.

zrzut ekranu 2013-03-01 w 12.39.51 pm podczas wyszukiwania, Google próbuje dowiedzieć się nie tylko co piszesz w polu, ale co masz na myśli. Tak więc algorytmy pisowni, autouzupełniania, synonimów i rozumienia zapytań wkraczają do akcji. Kiedy Google myśli, że wie, czego chcesz, wyciąga wyniki z tych 30 bilionów stron i 100 milionów gigabajtów, ale nie daje tylko tego, co znajduje.

po pierwsze, procedura rankingowa wykorzystuje ponad 200 ściśle strzeżonych tajnych czynników, które patrzą na świeżość wyników, jakość witryny, wiek domeny, Bezpieczeństwo i stosowność treści oraz kontekst użytkownika, taki jak lokalizacja, wcześniejsze wyszukiwania, Historia Google+ i połączenia i wiele więcej.

następnie, w nieco ponad ósmej sekundy, Google dostarcza wyniki do komputera, tabletu lub telefonu.

aby sprawdzić, jak dobrze działają jego wyszukiwania, Google używa również prawdziwych ludzi: search evaluators. Czterdzieści tysięcy razy w roku testerzy wyszukiwania Google sprawdzają wyniki, sprawdzają, co działa i dostarczają sugestie, jak poprawić.

a co ze spamem w sieci?

spam internetowy to bezużyteczne strony, które są stworzone, aby dobrze pozycjonować w Google, przyciągać uwagę i klikać, a następnie zarabiać na gałkach ocznych lub kliknięciach w inne miejsce. Google powiedział, że powiadamia witryny, że uważa je za spam, lub że zostały zhakowane, w tempie 40,000-60,000 miesięcznie.

Photo credit: Stéfan via photopin cc

VentureBeat

misją VentureBeat jest być cyfrowym rynkiem dla decydentów technicznych, aby zdobyć wiedzę na temat technologii transformacyjnych i transakcji.Nasza strona dostarcza niezbędnych informacji na temat technologii danych i strategii, które pomogą Ci w prowadzeniu organizacji. Zapraszamy do zostania członkiem naszej społeczności, aby uzyskać dostęp:

  • aktualne informacje na interesujące Cię tematy
  • nasze biuletyny
  • ogrodzona zawartość lidera myśli i zniżkowy dostęp do naszych cennych wydarzeń, takich jak transformacja 2021: dowiedz się więcej
  • funkcje sieciowe i więcej

Zostań członkiem

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.