7 cách sửa lỗi Discovered ‐ Currently Not Indexed trong Google Search Console

Lượt xem
Home

Xuất hiện trạng thái Discovered ‐ Currently Not Indexed trong Google Search Console đồng nghĩa với việc Google biết về một page cụ thể nhưng không thực hiện thu thập dữ liệu hoặc lập chỉ mục cho page đó. Để khắc phục tình trạng này, bạn có thể tham khảo ngay 7 cách khắc phục được Vietnix chia sẻ qua bài viết dưới đây!

Trạng thái “Discovered – Currently Not Indexed” là gì?

Trạng thái “Discovered – Currently Not Indexed” đề cập đến 2 yếu tố:

    • Thứ nhất, Google đã phát hiện ra page của bạn.

    • Thứ hai, Google hiện chưa thực hiện quá trình thu thập dữ liệu và lập chỉ mục (index) cho page của bạn.

Khái niệm này được trang trợ giúp Google Search Console giải thích: “Thông thường, Google muốn thu thập dữ liệu URL nhưng điều này có thể khiến website bị quá tải, do đó, Google đã lên lịch thu thập thông tin ở lần sau. Đây chính là lý do vì sao ngày thu thập dữ liệu gần đây nhất lại trống trên báo cáo.”

Thế nhưng, điều này không có nghĩa là nội dung của người dùng sẽ không bao giờ được thu thập thông tin và lập chỉ mục. Theo tài liệu của Google, Google có khả năng sẽ quay lại thu thập dữ liệu trên của website mà không cần bạn phải thực hiện bất kỳ hành động nào. 

Google sẽ quay lại sau để thu thập dữ liệu
Google sẽ quay lại sau để thu thập dữ liệu

Tuy nhiên, việc trì hoãn quá trình thu thập dữ liệu của Google chỉ là một trong số các lý do khiến website chưa được index. Dưới đây là 7 nguyên nhân cụ thể dẫn tới tình trạng URL “Discovered – Currently Not Indexed” và cách giải quyết chúng.

1. Cải thiện chất lượng nội dung

Google không thể thu thập dữ liệu và lập chỉ mục tất cả nội dung có trên website. Mỗi page cần phải đáp ứng những tiêu chuẩn nhất định về chất lượng mới có thể được Google xem xét lập chỉ mục. Google có thể bỏ qua việc thu thập dữ liệu đối với các trang chất lượng thấp để tập trung thu thập ở những trang có chất lượng cao hơn. Do đó, nếu website không được thu thập và lập chỉ mục, lúc này bạn cần cải thiện lại chất lượng nội dung.

Đánh giá về chất lượng nội dung của website
Đánh giá về chất lượng nội dung của website

Điều này không chỉ áp dụng ở những page được báo cáo là “Discovered – Currently Not Indexed”, mà có thể liên quan đến chất lượng của toàn website.

Mặc dù, bạn không thể biết chính xác phương thức đánh giá chất lượng website của Google. Tuy nhiên, vẫn có một số yếu tố để bạn bắt đầu giải quyết: 

Sau khi hiểu rõ về cách thức đánh giá nội dung website chất lượng của Google, bạn có thể áp dụng để xác định nội dung cho website của mình. 

Cùng tham khảo thêm một số bài viết về content website có thể bạn quan tâm:

Đảm bảo nội dung website luôn độc nhất

Bởi vì tài nguyên có hạn nên Google chỉ tập trung vào thu thập những dữ liệu (và lập chỉ mục) URL có giá trị nhất, còn với các URL bị phát hiện trùng lặp, bot Google có thể tự động bỏ qua chúng. Điều này đòi hỏi bạn cần xây dựng nội dung hấp dẫn và độc nhất để tối ưu khả năng website sẽ được thu thập dữ liệu và lập chỉ mục website trên công cụ tìm kiếm Google

Bạn cần kiểm tra kỹ website để xem URL nào trùng lặp không, đặc biệt là tham số, chữ in hoa, chữ thường và một số yếu tố cơ bản khác. Nếu có nhiều URL trùng lặp, bạn có thể cân nhắc sử dụng thẻ canonical để thông báo Google lập chỉ mục phiên bản chính thức cho website của mình. 

Kiểm tra xem có trùng lập không
Kiểm tra xem có trùng lập không

Lưu ý: Google có thể bỏ qua những thẻ canonical không được tạo đúng cách. Nếu thẻ canonical của bạn bị Google bỏ qua, bạn có thể nhận biết thông qua trạng thái Discovered ‐ Currently Not Indexed trong Google Search Console. 

Kiểm tra danh sách URL bị ảnh hưởng và đảm bảo mỗi page đều chứa nội dung độc nhất sẽ giúp website gia tăng khả năng được Google thu thập dữ liệu và lập chỉ mục, cũng như giúp nâng cao chất lượng website và tạo sự hài lòng cho người dùng. 

Nếu bạn đang tìm kiếm giải pháp lưu trữ để tối ưu cho SEO và nâng cao trải nghiệm người dùng thì không thể bỏ qua các giải pháp hosting từ Vietnix. WordPress Hosting Vietnix được thiết kế chuyên biệt và tối ưu cho nền tảng WordPress sẽ giúp website của bạn hoạt động nhanh chóng, ổn định và an toàn.

Các tính năng nổi bật của WordPress Hosting Vietnix bao gồm:

  • Tăng tốc độ tải trang dưới 1 giây, giúp website tải nhanh chóng, mượt mà, tối ưu pagespeed.
  • Cài đặt WordPress 1 click, bạn có thể nhanh chóng khởi tạo website WordPress của mình mà không cần phải cài đặt thủ công.
  • Khu vực thử nghiệm website không giới hạn giúp bạn thoải mái test các tính năng và plugin mới mà không ảnh hưởng đến website chính.
  • Backup tự động 4 lần mỗi ngày bảo vệ dữ liệu website an toàn.

Ngoài ra, WordPress Hosting Vietnix còn được hỗ trợ bởi đội ngũ kỹ thuật chuyên nghiệp, sẵn sàng hỗ trợ khách hàng 24/7. Với các tính năng vượt trội, WordPress Hosting Vietnix là lựa chọn lưu trữ lý tưởng giúp bạn xây dựng và phát triển website thành công.

Vietnix: Dịch vụ hosting - VPS tốc độ cao
Vietnix: Dịch vụ hosting – VPS tốc độ cao

Internal links hỗ trợ lan truyền PageRank và tầm quan trọng của trang trong quá trình xếp hạng. Nếu trang thiếu internal link, Google có thể coi trang đó không quan trọng và không thu thập dữ liệu.

Điều này dẫn đến trạng thái “Discovered – Currently Not Indexed”. Xây dựng cấu trúc internal link đúng cách giúp Googlebot tìm thấy nội dung và cải thiện cơ hội được index.

Xây dựng cấu trúc internal link
Xây dựng cấu trúc internal link

Một số phương pháp internal link hay nhất có thể tham khảo, bao gồm: 

  • Quyết định nội dung cốt lõi của website và liên kết các page khác đến website. 
  • Áp dụng Contextual Links (Liên kết theo ngữ cảnh) trong nội dung.
  • Liên kết pages dựa trên hệ thống phân cấp, chẳng hạn như liên kết các page cốt lõi với các page bổ sung và ngược lại. 
  • Không spam liên kết trên website. 
  • Không tối ưu anchor text quá mức. 
  • Thêm các liên kết dẫn đến các sản phẩm hoặc bài viết liên quan.
  • Thêm internal links vào các orphan page.

Cùng tham khảo qua bài viết cách tìm và sửa lỗi orphan pages đơn giản, hiệu quả nhất để tìm hiểu rõ hơn

Tầm quan trọng của việc tối ưu ngân sách thu thập dữ liệu

Ngân sách thu thập dữ liệu là số lượng page mà Googlebot có thể thu thập trên một website. Yếu tố quyết định ngân sách bao gồm giới hạn tốc độ và nhu cầu thu thập dữ liệu của Googlebot. Các website lớn thường gặp vấn đề về ngân sách, dẫn đến một số trang không được thu thập dữ liệu và lập chỉ mục. Tình trạng “Discovered – Currently Not Indexed” thường liên quan đến vấn đề ngân sách thu thập dữ liệu.

Có nhiều yếu tố dẫn đến vấn đề về ngân sách thu thập dữ liệu, bao gồm:

    • Internal link kém.

    • Cho phép Google thu thập dữ liệu nội dung kém chất lượng.

    • Không có hoặc có sơ đồ trang (sitemap) không đầy đủ.

    • Xảy ra lỗi trong quá trình chuyển hướng.

    • Servers quá tải.

    • Websites nặng về tài nguyên.

3. Ngăn Google thu thập dữ liệu và lập chỉ mục pages kém chất lượng

Cho phép Google truy cập toàn bộ website mà không thiết lập hạn chế có thể gây ra hai hậu quả tiêu cực đáng chú ý. Đầu tiên, nguy cơ là ngân sách thu thập dữ liệu sẽ bị tiêu hao trước khi đạt được những trang quan trọng nhất cho người dùng, chỉ vì Googlebot tiếp cận các trang kém chất lượng.

Ngăn Google thu thập dữ liệu
Ngăn Google thu thập dữ liệu

Thứ hai, việc Google thu thập và lập chỉ mục các trang chất lượng thấp có thể dẫn đến một đánh giá tổng thể xấu về chất lượng của toàn bộ website, ảnh hưởng tiêu cực đến thứ hạng tìm kiếm. Để tránh những vấn đề này, khuyến nghị rằng nên ngăn Google thu thập dữ liệu và lập chỉ mục các trang chất lượng thấp, tập trung vào việc tối ưu hóa ngân sách thu thập dữ liệu để đạt được kết quả tốt nhất.

4. Tạo sitemap được tối ưu hóa

Một sitemap được tối ưu hóa có thể hướng dẫn Googlebot trong quá trình thu thập dữ liệu website và lập chỉ mục. Về cơ bản, đây là một bản đồ giúp Google hiểu nội dung của bạn. 

XML Sitemap
XML Sitemap

Tuy nhiên, nếu không tối ưu hóa sitemap đúng cách sẽ gây ảnh hưởng không tốt đến ngân sách thu thập dữ liệu. Kết quả là, Google bỏ lỡ nội dung quan trọng trên website.

Sitemap phải chứa:

  • Các URL phản hồi với 200 status codes (OK).
  • Các URL không có thẻ meta robots để ngăn chặn việc lập chỉ mục.
  • Các phiên bản chuẩn của page.

5. Khắc phục chuyển hướng 

Để tránh chuỗi và vòng lặp chuyển hướng không cần thiết, hạn chế liên kết đến các trang chuyển hướng. Thay vào đó, cập nhật các liên kết để trỏ đến các trang có trạng thái 200. Điều này giúp giảm yêu cầu không cần thiết tới server và tiết kiệm ngân sách thu thập dữ liệu. Đồng thời, tránh trường hợp các trang rơi vào trạng thái “Discovered – Currently Not Indexed” trong Google Search Console.

6. Khắc phục tình trạng server quá tải

Khi hoạt động quá tải, server có thể không xử lý kịp thời các yêu cầu gửi từ Googlebot, dẫn đến thời gian phản hồi diễn ra chậm hơn so với dự kiến. Trong trường hợp này, Googlebot sẽ thu hẹp phạm vi thu thập dữ liệu của mình. Kết quả là một số nội dung trên website của bạn sẽ không được thu thập.

Google không thể crawl dữ liệu
Google không thể crawl dữ liệu

Khi đó, Google sẽ thử quay lại và cố gắng lập chỉ mục các page đó trong tương lai, tuy nhiên, quá trình lập chỉ mục có thể bị trì hoãn. Trong thời gian chờ đợi Google lập chỉ mục, bạn hãy kiểm tra lại báo cáo thống kê thu thập dữ liệu của mình trên Google Search Console bằng cách: 

  • Bước 1: Mở báo cáo và chọn tên miền của bạn.
  • Bước 2: Nhập vào mục Average response time (ms) để biết thời gian tải trung bình của server.

Qua số liệu hiển thị, bạn có thể thấy được mối tương quan giữa tổng số yêu cầu thu thập dữ liệu và thời gian phản hồi trung bình.

Thời gian phản hồi trung bình
Thời gian phản hồi trung bình

7. Sửa các website ngốn nhiều tài nguyên

Các website sử dụng nhiều tài nguyên cũng là một nguyên nhân gây ra lỗi thu thập dữ liệu. Nếu một page yêu cầu lập chỉ mục và hiển thị nhiều tài nguyên bổ sung như nhiều CSS stylesheets hoặc file JavaScript, điều này sẽ ảnh hưởng tiêu cực đến ngân sách thu thập dữ liệu.

Do đó, bạn nên tối ưu các file JavaScript và CSS cho website. Việc tối ưu hóa các file này sẽ giảm thiểu các tác động tiêu cực của code. 

Cùng tham khảo thêm một số bài viết về cách sửa lỗi trên Google Search Console có thể bạn quan tâm:

Khi nào cần tối ưu hóa các trang “Discovered – Currently Not Indexed”?

Ở một số trường hợp, bạn không cần cập nhật các URL có trạng thái “Discovered – Currently Not Indexed”, chẳng hạn như:

  • Có ít URL bị ảnh hưởng và dữ liệu của các URL này sẽ được thu thập và lập chỉ mục theo thời gian.
  • Báo cáo chứa các URL không nên được thu thập thông tin hoặc lập chỉ mục. Chẳng hạn, các URL có thẻ canonical hoặc thẻ ‘noindex’ hoặc URL bị chặn bởi file robots.txt.

Điều quan trọng là bạn phải kiểm tra URL của mình có nên được thu thập thông tin ngay từ đầu hay không. Việc một số page được báo cáo là “Discovered ‐ Currently Not Indexed” là điều bình thường. Tuy nhiên, nếu:

  • Gia tăng số lượng URL. 
  • Các URL quan trọng hiển thị trạng thái “Discovered ‐ Currently Not Indexed”.

Khi đó, bạn cần kiểm tra và tối ưu hóa các URL bị ảnh hưởng vì điều này có thể làm giảm đáng kể thứ hạng và traffic trên website. 

Cùng tham khảo thêm một số bài viết liên quan bạn có thể quan tâm:

Công cụ kiểm tra URL 

Sau khi quyết định cập nhật nội dung và URL, bạn có thể thông qua công cụ kiểm tra URL của Google để yêu cầu lập chỉ mục các page cụ thể. Thao tác thực hiện như sau:

  • Bước 1: Mở công cụ kiểm tra URL trên GSC. 
  • Bước 2: Dán URL muốn lập chỉ mục vào thanh tìm kiếm ở đầu page. 
Thêm URL muốn index
Thêm URL muốn index
  • Bước 3: Nhập vào nút “request indexing”
Gửi yêu cầu index
Gửi yêu cầu index

Sử dụng công cụ kiểm tra URL để yêu cầu lập chỉ mục không đảm bảo một page cụ thể sẽ được thu thập dữ liệu và lập chỉ mục. Thay vào đó, việc làm này giống như gửi một tín hiệu cho Google biết bạn muốn ưu tiên page được thu thập dữ liệu và lập chỉ mục. 

Vietnix hoạt động với phương châm “Lấy thành công của khách hàng làm mục tiêu phục vụ”. Với 11 năm kinh nghiệm trong lĩnh vực lưu trữ số và điện toán đám mây tại Việt Nam, Vietnix đã giúp đỡ 50.000 khách hàng cá nhân, doanh nghiệp triển khai kinh doanh trực tuyến một cách thuận lợi. Số liệu thống kê cho thấy hơn 100.000 dịch vụ đã được kích hoạt và có tới 97% khách hàng đã giới thiệu dịch vụ của Vietnix sau khi sử dụng, chứng tỏ chất lượng và sự đáng tin cậy của Vietnix trong ngành lưu trữ số và điện toán đám mây tại Việt Nam.

Vietnix đồng hành cùng 50.000 khách hàng
Dịch vụ Hosting – VPS hàng đầu Việt Nam

Đội ngũ Vietnix cam kết cung cấp giải pháp lưu trữ số và điện toán đám mây tối ưu, giúp khách hàng đạt được mục tiêu kinh doanh của mình một cách hiệu quả và tiết kiệm chi phí. Vietnix luôn nỗ lực để đáp ứng nhu cầu và yêu cầu ngày càng cao về lưu trữ số và điện toán đám mây của khách hàng, và sẵn sàng hỗ trợ khách hàng trong mọi vấn đề liên quan đến lĩnh vực này. Hãy an tâm lựa chọn Vietnix để trải nghiệm môi trường lưu trữ số tốt nhất và phát triển thương hiệu trực tuyến của bạn.

Mọi vấn đề thắc mắc cần tư vấn, quý khách vui lòng liên hệ:

  • Địa chỉ: 265 Hồng Lạc, Phường 10, Quận Tân Bình, Thành Phố Hồ Chí Minh.
  • Hotline: 1800 1093.
  • Email: sales@vietnix.com.vn.

Kết luận

Vietnix hy vọng bài viết có thể giúp bạn nắm rõ về 7 cách khắc phục tình trạng lỗi Discovered – Currently Not Indexed trong Google Search Console. Có thể bạn muốn đọc thêm các bài viết của Vietnix về cách khắc phục trang WordPress bị hủy index trên Google Search Console hoặc cách thêm web WordPress vào Google Search Console. Vietnix chúc bạn thành công!

Chia sẻ lên

Theo dõi trên

Logo Google new

Đánh giá

5/5 - (64 bình chọn)

Hoàng Vui

Kết nối với mình qua

Icon Quote
Icon Quote
Đăng ký nhận tin
Để không bỏ sót bất kỳ tin tức hoặc chương trình khuyến mãi từ Vietnix

Bình luận