Wie Google 30 Billionen Webseiten, 100 Milliarden Mal im Monat durchsucht

large_3951143570Wie führen Sie 100 Milliarden Websuchen pro Monat durch?

Google gab einen Einblick in die Funktionsweise der heutigen Websuche und enthüllte dabei einige faszinierende Zahlen.

Die Suche beginnt natürlich mit dem Crawlen und Indizieren, und Google sagt, dass das Web jetzt 30 Billionen eindeutige Einzelseiten hat. Das sind erstaunliche 30-Zeiten in fünf Jahren: Google berichtete 2008, dass das Web nur eine Billion Seiten hatte.

Google sagt, dass es Informationen über diese 30 Billionen Seiten im Google-Index speichert, der jetzt bei 100 Millionen Gigabyte liegt. Das sind ungefähr tausend Terabyte, und Sie benötigen über drei Millionen 32-GB-USB-Sticks, um all diese Daten zu speichern.

Screenshot 01.03.2013 um 12.39.51 UhrBei der Suche versucht Google nicht nur herauszufinden, was Sie in das Feld eingeben, sondern auch, was Sie meinen. Algorithmen für Rechtschreibung, Autovervollständigung, Synonyme und Abfrageverständnis treten also in Aktion. Wenn Google denkt, dass es weiß, was Sie wollen, zieht es Ergebnisse aus diesen 30 Billionen Seiten und 100 Millionen Gigabyte, aber es gibt Ihnen nicht nur, was es findet.

Erstens verwendet ein Ranking-Verfahren über 200 streng gehütete geheime Faktoren, die die Frische der Ergebnisse, die Qualität der Website, das Alter der Domain, die Sicherheit und Angemessenheit des Inhalts und den Benutzerkontext wie Standort, vorherige Suchanfragen, Google+ Verlauf und Verbindungen und vieles mehr.

In etwas mehr als einer achtel Sekunde liefert Google die Ergebnisse dann an Ihren Computer, Ihr Tablet oder Ihr Telefon.

Um zu testen, wie gut seine Suchanfragen tatsächlich funktionieren, verwendet Google auch echte Menschen: Suchauswerter. Vierzigtausend Mal im Jahr überprüfen die Suchtester von Google die Ergebnisse, sehen, was funktioniert, und geben Vorschläge zur Verbesserung.

Und was ist mit Web-Spam?

Web-Spam sind nutzlose Seiten, die so gestaltet sind, dass sie bei Google einen guten Rang einnehmen, Ihre Aufmerksamkeit und Klicks auf sich ziehen und dann Ihre Augäpfel oder Klicks an einen anderen Ort monetarisieren. Google teilte mit, dass Websites mit einer Rate von 40.000 bis 60.000 pro Monat benachrichtigt werden, dass sie als Spam eingestuft oder gehackt wurden.

Bildnachweis: Stéfan über photopin cc

VentureBeat

Die Mission von VentureBeat ist es, ein digitaler Stadtplatz für technische Entscheidungsträger zu sein, um Wissen über transformative Technologien und Transaktionen zu erlangen.Unsere Website enthält wichtige Informationen zu Datentechnologien und -strategien, die Sie bei der Führung Ihres Unternehmens unterstützen. Wir laden Sie ein, Mitglied unserer Community zu werden, um Zugang:

  • aktuelle Informationen zu den für Sie interessanten Themen
  • unsere Newsletter
  • gated Thought-Leader-Inhalte und ermäßigter Zugang zu unseren wertvollen Veranstaltungen wie der Transform 2021: Erfahren Sie mehr
  • Netzwerkfunktionen und mehr

Mitglied werden

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.