月に1000億のウェブ検索を実行するにはどうすればよいですか?
Googleは、ウェブ検索が今日どのように機能するかを内部で覗いており、その過程でいくつかの魅力的な数字を明らかにしています。
検索はもちろん、クロールとインデックス付けで始まり、Googleはウェブには30兆個のユニークな個々のページがあると言います。 Googleは2008年に、ウェブには1兆ページしかないと報告しました。
Googleは、これらの30兆ページに関する情報をGoogle Indexに保存していると述べています。 これは約1000テラバイトで、そのすべてのデータを保存するには300万台以上の32GB USBサムドライブが必要です。
検索すると、Googleはボックスに入力しているものだけでなく、何を意味するのかを把握しようとします。 だから、スペル、自動補完、同義語、およびクエリの理解のためのアルゴリズムは、アクションにジャンプします。 Googleはあなたが望むものを知っていると思うとき、それはそれらの30兆ページと100万ギガバイトから結果を引き出しますが、それはちょうどそれが見つ
まず、ランキング手順では、結果の新鮮さ、ウェブサイトの品質、ドメインの年齢、コンテンツの安全性と適切性、場所、以前の検索、Google+の履歴と接続などのユー
その後、Googleはあなたのコンピュータ、タブレット、または携帯電話に結果を配信します。
検索が実際に実行されているかどうかをテストするために、Googleは実際の人間を使用しています:検索エバリュエーター。 年に4万回、Googleの検索テスターは結果をチェックし、何が機能しているのかを確認し、改善する方法について提案します。
そして、ウェブスパムはどうですか?
ウェブスパムは、Googleでうまくランク付けされ、あなたの注意とクリックを引き出し、あなたの眼球を収益化したり、どこか他の場所にクリックしたりするように細工された役に立たないページです。 Googleは、それが彼らにスパムを考慮していることをサイトに通知すると述べました,または彼らがハッキングされていること,の割合で40,000-60,000月額.
写真クレジット:stéfan via photopin cc
VentureBeat
VentureBeatの使命は、変革技術と取引に関する知識を得るための技術的意思決定者のためのデジタルタウン広場であることです。私たちのサイトは、あなたがあなたの組織をリードするようにあなたを導くためにデータ技術と戦略に不可欠な情報を提供します。 私たちは、アクセスするために、私たちのコミュニティのメンバーになることを勧めます:
- 興味のあるテーマに関する最新情報
- ニュースレター
- ゲート思考リーダーのコンテンツと、Transform2021などの貴重なイベントへの割引アクセス:詳細
- ネットワーキング機能、その他
メンバーになる