어떻게 한 달에 1,000 억 웹 검색을 실행합니까?
구글은 오늘날 웹 검색이 어떻게 작동하는지 들여다보고 그 과정에서 몇 가지 매혹적인 숫자를 드러냈다.
검색은 물론 크롤링과 색인을 사용하여 시작되며,구글은 웹이 현재 30 조 개의 고유 한 개별 페이지를 가지고 있다고 말한다. 2008 년 구글은 웹이 1 조 페이지에 불과하다고 보도했다.
구글은 구글 인덱스에 그 30 조 페이지에 대한 정보를 저장 말한다,이는 현재 1 억 기가 바이트에 있습니다. 즉,천 테라 바이트에 대해,그리고 당신은 모든 데이터를 저장하는 세 백만 32 기가 바이트 이상의 엄지 드라이브가 필요합니다.
검색 할 때,구글은 당신이 상자에 입력하는 것이 아니라 당신이 무엇을 의미하는지 파악하려고합니다. 따라서 맞춤법,자동 완성,동의어 및 쿼리 이해를위한 알고리즘이 실행됩니다. 구글은 당신이 원하는 것을 알고 있다고 생각할 때,그 30 조 페이지와 1 억 기가 바이트에서 결과를 가져옵니다,하지만 그것은 단지 그것이 발견 무엇을 제공하지 않습니다.
첫째,순위 절차는 결과의 신선도,웹 사이트의 품질,도메인의 나이,안전 및 콘텐츠의 적합성,위치,이전 검색,구글+역사와 연결,그리고 훨씬 더 같은 사용자 컨텍스트를 보면 200 개 이상의 밀접하게 감시 비밀 요소를 사용합니다.
그런 다음,단지 초의 8 분의 1 에,구글은 컴퓨터,태블릿,또는 전화로 결과를 제공합니다.
검색이 실제로 얼마나 잘 수행되는지 테스트하기 위해 구글은 실제 인간인 검색 평가자를 사용합니다. 1 년에 4 만 번,구글의 검색 테스터는 결과를 확인하고,무엇이 효과가 있는지보고,개선 방법에 대한 제안을 제공합니다.
웹 스팸은 어떻습니까?
웹 스팸은 구글에서 잘 순위를 당신의 관심과 클릭을 끌기 위해 만들어진 쓸모없는 페이지입니다,다음 눈알 수익을 창출하거나 다른 곳으로 떨어져 클릭. 구글은 한 달에 40,000-60,000 의 속도로,그들에게 스팸을 고려하거나 해킹 된 것을 사이트를 통지했다.벤처비트의 사명은 기술적 의사결정자들이 혁신적 기술과 거래에 대한 지식을 습득할 수 있는 디지털 타운스퀘어가 되는 것이다.저희 사이트는 귀하가 조직을 이끌 때 귀하를 안내 할 수있는 데이터 기술 및 전략에 대한 필수 정보를 제공합니다. 우리는 당신이 액세스 할 수,우리 사회의 일원이되기 위해 초대합니다:
- 관심있는 주제에 대한 최신 정보
- 뉴스 레터
- 변환 2021:자세히 알아보기
- 네트워킹 기능 및 기타
회원 가입