새로운 GWT에서 “발견 – 현재 색인화되지 않은”원인 사이트 맵 링크를

새로운 GWT는 사이트 맵 링크를 새로운 카테고리로 나눈 것입니다. 나를 혼동하는 두 가지 : 1. 발견됨-현재 색인화되지 않음 2. 크롤링 됨-현재 색인화되지 않음

이에 대한 가능한 이유는 무엇이며 사이트 전체에 영향이 있습니까? 이것이 Google의 표시입니까, 이것을 제거하는 것이 좋습니다?

여기에 이미지 설명을 입력하십시오



답변

프로세스의 일부일뿐입니다. 실제로 오류가 발생할 때까지 수행 할 작업이 없습니다 .

범주를 이해하려면 인덱싱 작동 방식을 이해해야합니다. 이는 거의 지속적으로 수행됩니다.

  • Googlebot은 콘텐츠를 Google 서버에 다운로드하는 페이지를 가져옵니다. 이 경우 페이지가 크롤링 됩니다.
  • 나중에 다운로드 한 페이지의 내용을 색인에 넣습니다. 이것은 페이지가 색인 됨을 의미합니다 .
  • 페이지를 크롤링하는 동안 페이지를 찾아 대기열에 넣습니다. 그 링크가 발견되었습니다 .

그래서:

  • 검색되지 않음 은 Googlebot이 결국 크롤링 할 수있는 대기열에 링크가 추가되었음을 의미합니다 . 웹은 사실상 무한하며 우선 순위가 있기 때문에 실제로는 도달 할 수 없습니다.
  • 크롤링되지 않은 크롤링 은 페이지가 Google 서버에 다운로드되었지만 해당 컨텐츠가 색인에 삽입되지 않았 음을 의미합니다.

답변

Google이 귀하의 페이지를 검색하고 크롤링 할 수 있지만 반드시 색인을 생성한다는 의미는 아닙니다.

Google이 페이지를 색인하지 않는 데는 여러 가지 이유가 있습니다. 아마도 중복 된 콘텐츠를 찾았습니다. 아마도 특정 검색어에 충분한 가치를 제공한다고 생각하지 않을 것입니다. Google에서 페이지에서 마음에 들지 않는 것을 발견했을 수 있습니다.

이유가 무엇이든 Google은 귀하의 사이트에서 검색하여 크롤링 한 일부 페이지를 색인으로 만들기로 결정하지 않았습니다. 일부 페이지의 색인이 생성되지 않는 것이 일반적입니다. 내 사이트의 일부 페이지는 색인이 생성 된 많은 페이지보다 콘텐츠가 많고 내부 링크가 상당히 많음에도 불구하고 색인이 생성되지 않습니다. Google의 색인 시스템은 기계 학습 알고리즘입니다. 따라서 때로는 다양한 알 수없는 이유로 일부 페이지를 색인화하지 않기로 결정할 수 있습니다.


답변

Googlebot에는 다른 매개 변수에 따라 자체 대기열이 있습니다. 이것은 심지어 URL이 대기열에 있다는 메시지입니다.

Aj Cohn 은이 메시지의 의미에 대해 재미있는 의견을 가지고 있습니다 .

발견됨 – 현재 색인이 생성되지 않은 것으로 사이트 맵에 표시되지만 다른 콘텐츠가 어떻게 보이는지에 따라 크롤링을 방해하지 않는 것으로 보입니다. 본질적으로 “Yugly!”또는 크롤링 효율성이 낮을 수 있습니다.

솔직히, 나는이 상태에있는 많은 샘플 URL이 마지막 크롤링 날짜를 가지고 있기 때문에 Discovered의 정의가 정확한지 확실하지 않습니다. 제공된 정의와 모순되는 것 같습니다.


답변

Google이 URL을 발견했지만 크롤링에 시간을 보내는 것이 중요하다고 생각하지 않았습니다. 이 페이지에 자연 검색 트래픽을 수신하려면 자신의 웹 사이트 내에서 더 많은 페이지로 연결하는 것이 좋습니다. 외부 웹 사이트에서 백 링크를 얻을 수 있으려면이 콘텐츠를 다른 사람에게 홍보하십시오. 귀하의 콘텐츠에 대한 외부 링크는 페이지가 가치 있고 신뢰할 수있는 것으로 간주되어 Google이 색인을 생성 할 가능성을 높입니다.