Cómo busca Google 30 billones de páginas web, 100 billones de veces al mes

large_3951143570 ¿Cómo ejecuta 100 billones de búsquedas web al mes?

Google dio un vistazo a cómo funciona la búsqueda en la web hoy en día, revelando algunos números fascinantes en el proceso.

La búsqueda comienza, por supuesto, con el rastreo y la indexación, y Google dice que la web ahora tiene 30 billones de páginas individuales únicas. Eso es asombroso 30 veces en cinco años: Google informó en 2008 que la web tenía solo un billón de páginas.

Google dice que almacena información sobre esas 30 billones de páginas en el Índice de Google, que ahora está en 100 millones de gigabytes. Eso es alrededor de mil terabytes, y se necesitarían más de tres millones de unidades USB de memoria USB de 32 GB para almacenar todos esos datos.

Captura de pantalla 2013-03-01 a las 12.39.51 PMCuando buscas, Google intenta averiguar no solo lo que estás escribiendo en el cuadro, sino lo que quieres decir. Así, los algoritmos de ortografía, autocompletado, sinónimos y comprensión de consultas entran en acción. Cuando Google piensa que sabe lo que quieres, obtiene resultados de esas 30 billones de páginas y 100 millones de gigabytes, pero no solo te da lo que encuentra.

En primer lugar, un procedimiento de clasificación utiliza más de 200 factores secretos cuidadosamente guardados que analizan la frescura de los resultados, la calidad del sitio web, la antigüedad del dominio, la seguridad y adecuación del contenido y el contexto del usuario, como la ubicación, las búsquedas anteriores, el historial y las conexiones de Google+, y mucho más.

Luego, en poco más de un octavo de segundo, Google entrega los resultados a su computadora, tableta o teléfono.

Para probar el rendimiento real de sus búsquedas, Google también utiliza humanos en vivo: evaluadores de búsqueda. Cuarenta mil veces al año, los evaluadores de búsqueda de Google comprueban los resultados, ven lo que funciona y ofrecen sugerencias sobre cómo mejorar.

¿Y qué pasa con el spam web?

El spam web es páginas inútiles que están diseñadas para posicionarse bien en Google, llamar su atención y clics, y luego monetizar sus ojos o clics a otro lugar. Google dijo que notifica a los sitios que los considera spam, o que han sido hackeados, a una tasa de 40,000 a 60,000 por mes.

crédito de la foto: Stéfan via photopin cc

VentureBeat

La misión de VentureBeat es ser una plaza digital para que los tomadores de decisiones técnicas adquieran conocimientos sobre tecnología transformadora y transacciones.Nuestro sitio ofrece información esencial sobre tecnologías y estrategias de datos para guiarlo a medida que dirige sus organizaciones. Le invitamos a convertirse en miembro de nuestra comunidad, para acceder:

  • información actualizada sobre los temas de su interés
  • nuestros boletines de noticias
  • contenido cerrado de líderes de opinión y acceso con descuento a nuestros preciados eventos, como Transform 2021: Más información
  • funciones de red y más

Conviértase en miembro

Deja una respuesta

Tu dirección de correo electrónico no será publicada.