como o Google Pesquisa 30 trilhões de páginas da web, 100 bilhões de vezes por mês

large_3951143570como você executa 100 bilhões de pesquisas na web por mês?O Google deu uma olhada interna em como a pesquisa na web funciona hoje, revelando alguns números fascinantes no processo.A pesquisa começa, é claro, com rastreamento e indexação, e o Google diz que a web agora tem 30 trilhões de páginas individuais exclusivas. Isso é surpreendente 30 vezes em cinco anos: o Google informou em 2008 que a web tinha apenas um trilhão de páginas.O Google diz que armazena informações sobre esses 30 trilhões de páginas no índice do Google, que agora está em 100 milhões de gigabytes. Isso é cerca de mil terabytes, e você precisaria de mais de três milhões de pen drives USB de 32 GB para armazenar todos esses dados.

captura de Tela 2013-03-01 às 12.39.51 PMQuando você pesquisa, o Google tenta descobrir não apenas o que você está digitando na caixa, mas o que você quer dizer. Portanto, algoritmos para ortografia, preenchimento automático, sinônimos e compreensão de consulta entram em ação. Quando o Google acha que sabe o que você quer, ele obtém resultados desses 30 trilhões de páginas e 100 milhões de gigabytes, mas não apenas lhe dá o que encontra.Primeiro, um procedimento de classificação usa mais de 200 fatores secretos bem guardados que analisam o frescor dos resultados, a qualidade do site, a idade do domínio, a segurança e a adequação do conteúdo e o contexto do usuário, como localização, pesquisas anteriores, histórico e Conexões do Google+ e muito mais.

então, em pouco mais de um oitavo de segundo, o Google entrega os resultados para o seu computador, tablet ou telefone.

para testar o desempenho de suas pesquisas, o Google também usa humanos reais: avaliadores de pesquisa. Quarenta mil vezes por ano, os testadores de pesquisa do Google verificam os resultados, veem o que está funcionando e fornecem sugestões sobre como melhorar.

e quanto ao spam na web?

web spam é páginas inúteis que são criados para classificar bem no Google, chamar a sua atenção e cliques, e, em seguida, monetizar seus olhos ou cliques fora para outro lugar. O Google disse que notifica sites que os considera spam, ou que foram hackeados, a uma taxa de 40.000-60.000 por mês.

crédito da foto: Stéfan via photopin cc

VentureBeat

a missão da VentureBeat é ser uma praça da cidade digital para os tomadores de decisão técnicos adquirirem conhecimento sobre tecnologia transformadora e transações.Nosso site fornece informações essenciais sobre tecnologias e estratégias de dados para guiá-lo enquanto você lidera suas organizações. Convidamos você a se tornar um membro da nossa comunidade, para acessar:

  • up-to-date informações sobre os assuntos de interesse para você
  • as nossas newsletters
  • fechado pensamento líder de conteúdo e de acesso com desconto ao nosso premiado eventos, tais como Transformar 2021: Saiba Mais
  • recursos de rede, e muito mais

Tornar-se um membro

Deixe uma resposta

O seu endereço de email não será publicado.