Xuất hiện trạng thái Discovered ‐ Currently Not Indexed trong Google Search Console đồng nghĩa với việc Google biết về một page cụ thể nhưng không thực hiện thu thập dữ liệu hoặc lập chỉ mục cho page đó. Để khắc phục tình trạng này, bạn có thể tham khảo ngay 7 cách khắc phục được Vietnix chia sẻ qua bài viết dưới đây!
Trạng thái “Discovered – Currently Not Indexed” là gì?
Trạng thái “Discovered – Currently Not Indexed” đề cập đến 2 yếu tố:
Khái niệm này được trang trợ giúp Google Search Console giải thích: “Thông thường, Google muốn thu thập dữ liệu URL nhưng điều này có thể khiến website bị quá tải, do đó, Google đã lên lịch thu thập thông tin ở lần sau. Đây chính là lý do vì sao ngày thu thập dữ liệu gần đây nhất lại trống trên báo cáo.”
Thế nhưng, điều này không có nghĩa là nội dung của người dùng sẽ không bao giờ được thu thập thông tin và lập chỉ mục. Theo tài liệu của Google, Google có khả năng sẽ quay lại thu thập dữ liệu trên của website mà không cần bạn phải thực hiện bất kỳ hành động nào.
Tuy nhiên, việc trì hoãn quá trình thu thập dữ liệu của Google chỉ là một trong số các lý do khiến website chưa được index. Dưới đây là 7 nguyên nhân cụ thể dẫn tới tình trạng URL “Discovered – Currently Not Indexed” và cách giải quyết chúng.
7 giải pháp cho tình trạng URL “Discovered – Currently Not Indexed”
- Cải thiện chất lượng nội dung
- Tối ưu internal links
- Ngăn Google thu thập dữ liệu và lập chỉ mục pages kém chất lượng
- Tạo sitemap được tối ưu hóa
- Khắc phục chuyển hướng
- Khắc phục tình trạng server quá tải
- Sửa các website ngốn nhiều tài nguyên
1. Cải thiện chất lượng nội dung
Google không thể thu thập dữ liệu và lập chỉ mục tất cả nội dung có trên website. Mỗi page cần phải đáp ứng những tiêu chuẩn nhất định về chất lượng mới có thể được Google xem xét lập chỉ mục. Google có thể bỏ qua việc thu thập dữ liệu đối với các trang chất lượng thấp để tập trung thu thập ở những trang có chất lượng cao hơn. Do đó, nếu website không được thu thập và lập chỉ mục, lúc này bạn cần cải thiện lại chất lượng nội dung.
Điều này không chỉ áp dụng ở những page được báo cáo là “Discovered – Currently Not Indexed”, mà có thể liên quan đến chất lượng của toàn website.
Mặc dù, bạn không thể biết chính xác phương thức đánh giá chất lượng website của Google. Tuy nhiên, vẫn có một số yếu tố để bạn bắt đầu giải quyết:
- Xem qua Hướng dẫn đánh giá chất lượng về nội dung website.
- Đảm bảo mỗi page bị ảnh hưởng đều chứa nội dung độc nhất.
Sau khi hiểu rõ về cách thức đánh giá nội dung website chất lượng của Google, bạn có thể áp dụng để xác định nội dung cho website của mình.
Cùng tham khảo thêm một số bài viết về content website có thể bạn quan tâm:
📌 Content website là gì? Hướng dẫn tối ưu SEO content thu hút
📌 SEO content là gì? 7 bước xây dựng kế hoạch SEO Content
Đảm bảo nội dung website luôn độc nhất
Bởi vì tài nguyên có hạn nên Google chỉ tập trung vào thu thập những dữ liệu (và lập chỉ mục) URL có giá trị nhất, còn với các URL bị phát hiện trùng lặp, bot Google có thể tự động bỏ qua chúng. Điều này đòi hỏi bạn cần xây dựng nội dung hấp dẫn và độc nhất để tối ưu khả năng website sẽ được thu thập dữ liệu và lập chỉ mục website trên công cụ tìm kiếm Google.
Bạn cần kiểm tra kỹ website để xem URL nào trùng lặp không, đặc biệt là tham số, chữ in hoa, chữ thường và một số yếu tố cơ bản khác. Nếu có nhiều URL trùng lặp, bạn có thể cân nhắc sử dụng thẻ canonical để thông báo Google lập chỉ mục phiên bản chính thức cho website của mình.
Lưu ý: Google có thể bỏ qua những thẻ canonical không được tạo đúng cách. Nếu thẻ canonical của bạn bị Google bỏ qua, bạn có thể nhận biết thông qua trạng thái Discovered ‐ Currently Not Indexed trong Google Search Console.
Kiểm tra danh sách URL bị ảnh hưởng và đảm bảo mỗi page đều chứa nội dung độc nhất sẽ giúp website gia tăng khả năng được Google thu thập dữ liệu và lập chỉ mục, cũng như giúp nâng cao chất lượng website và tạo sự hài lòng cho người dùng.
Nếu bạn đang tìm kiếm giải pháp lưu trữ để tối ưu cho SEO và nâng cao trải nghiệm người dùng thì không thể bỏ qua các giải pháp hosting từ Vietnix. WordPress Hosting Vietnix được thiết kế chuyên biệt và tối ưu cho nền tảng WordPress sẽ giúp website của bạn hoạt động nhanh chóng, ổn định và an toàn.
Các tính năng nổi bật của WordPress Hosting Vietnix bao gồm:
- Tăng tốc độ tải trang dưới 1 giây, giúp website tải nhanh chóng, mượt mà, tối ưu pagespeed.
- Cài đặt WordPress 1 click, bạn có thể nhanh chóng khởi tạo website WordPress của mình mà không cần phải cài đặt thủ công.
- Khu vực thử nghiệm website không giới hạn giúp bạn thoải mái test các tính năng và plugin mới mà không ảnh hưởng đến website chính.
- Backup tự động 4 lần mỗi ngày bảo vệ dữ liệu website an toàn.
Ngoài ra, WordPress Hosting Vietnix còn được hỗ trợ bởi đội ngũ kỹ thuật chuyên nghiệp, sẵn sàng hỗ trợ khách hàng 24/7. Với các tính năng vượt trội, WordPress Hosting Vietnix là lựa chọn lưu trữ lý tưởng giúp bạn xây dựng và phát triển website thành công.
2. Tối ưu internal link
Internal links hỗ trợ lan truyền PageRank và tầm quan trọng của trang trong quá trình xếp hạng. Nếu trang thiếu internal link, Google có thể coi trang đó không quan trọng và không thu thập dữ liệu.
Điều này dẫn đến trạng thái “Discovered – Currently Not Indexed”. Xây dựng cấu trúc internal link đúng cách giúp Googlebot tìm thấy nội dung và cải thiện cơ hội được index.
Một số phương pháp internal link hay nhất có thể tham khảo, bao gồm:
- Quyết định nội dung cốt lõi của website và liên kết các page khác đến website.
- Áp dụng Contextual Links (Liên kết theo ngữ cảnh) trong nội dung.
- Liên kết pages dựa trên hệ thống phân cấp, chẳng hạn như liên kết các page cốt lõi với các page bổ sung và ngược lại.
- Không spam liên kết trên website.
- Không tối ưu anchor text quá mức.
- Thêm các liên kết dẫn đến các sản phẩm hoặc bài viết liên quan.
- Thêm internal links vào các orphan page.
Cùng tham khảo qua bài viết cách tìm và sửa lỗi orphan pages đơn giản, hiệu quả nhất để tìm hiểu rõ hơn
Tầm quan trọng của việc tối ưu ngân sách thu thập dữ liệu
Ngân sách thu thập dữ liệu là số lượng page mà Googlebot có thể thu thập trên một website. Yếu tố quyết định ngân sách bao gồm giới hạn tốc độ và nhu cầu thu thập dữ liệu của Googlebot. Các website lớn thường gặp vấn đề về ngân sách, dẫn đến một số trang không được thu thập dữ liệu và lập chỉ mục. Tình trạng “Discovered – Currently Not Indexed” thường liên quan đến vấn đề ngân sách thu thập dữ liệu.
Có nhiều yếu tố dẫn đến vấn đề về ngân sách thu thập dữ liệu, bao gồm:
3. Ngăn Google thu thập dữ liệu và lập chỉ mục pages kém chất lượng
Cho phép Google truy cập toàn bộ website mà không thiết lập hạn chế có thể gây ra hai hậu quả tiêu cực đáng chú ý. Đầu tiên, nguy cơ là ngân sách thu thập dữ liệu sẽ bị tiêu hao trước khi đạt được những trang quan trọng nhất cho người dùng, chỉ vì Googlebot tiếp cận các trang kém chất lượng.
Thứ hai, việc Google thu thập và lập chỉ mục các trang chất lượng thấp có thể dẫn đến một đánh giá tổng thể xấu về chất lượng của toàn bộ website, ảnh hưởng tiêu cực đến thứ hạng tìm kiếm. Để tránh những vấn đề này, khuyến nghị rằng nên ngăn Google thu thập dữ liệu và lập chỉ mục các trang chất lượng thấp, tập trung vào việc tối ưu hóa ngân sách thu thập dữ liệu để đạt được kết quả tốt nhất.
4. Tạo sitemap được tối ưu hóa
Một sitemap được tối ưu hóa có thể hướng dẫn Googlebot trong quá trình thu thập dữ liệu website và lập chỉ mục. Về cơ bản, đây là một bản đồ giúp Google hiểu nội dung của bạn.
Tuy nhiên, nếu không tối ưu hóa sitemap đúng cách sẽ gây ảnh hưởng không tốt đến ngân sách thu thập dữ liệu. Kết quả là, Google bỏ lỡ nội dung quan trọng trên website.
Sitemap phải chứa:
5. Khắc phục chuyển hướng
Để tránh chuỗi và vòng lặp chuyển hướng không cần thiết, hạn chế liên kết đến các trang chuyển hướng. Thay vào đó, cập nhật các liên kết để trỏ đến các trang có trạng thái 200. Điều này giúp giảm yêu cầu không cần thiết tới server và tiết kiệm ngân sách thu thập dữ liệu. Đồng thời, tránh trường hợp các trang rơi vào trạng thái “Discovered – Currently Not Indexed” trong Google Search Console.
6. Khắc phục tình trạng server quá tải
Khi hoạt động quá tải, server có thể không xử lý kịp thời các yêu cầu gửi từ Googlebot, dẫn đến thời gian phản hồi diễn ra chậm hơn so với dự kiến. Trong trường hợp này, Googlebot sẽ thu hẹp phạm vi thu thập dữ liệu của mình. Kết quả là một số nội dung trên website của bạn sẽ không được thu thập.
Khi đó, Google sẽ thử quay lại và cố gắng lập chỉ mục các page đó trong tương lai, tuy nhiên, quá trình lập chỉ mục có thể bị trì hoãn. Trong thời gian chờ đợi Google lập chỉ mục, bạn hãy kiểm tra lại báo cáo thống kê thu thập dữ liệu của mình trên Google Search Console bằng cách:
Qua số liệu hiển thị, bạn có thể thấy được mối tương quan giữa tổng số yêu cầu thu thập dữ liệu và thời gian phản hồi trung bình.
7. Sửa các website ngốn nhiều tài nguyên
Các website sử dụng nhiều tài nguyên cũng là một nguyên nhân gây ra lỗi thu thập dữ liệu. Nếu một page yêu cầu lập chỉ mục và hiển thị nhiều tài nguyên bổ sung như nhiều CSS stylesheets hoặc file JavaScript, điều này sẽ ảnh hưởng tiêu cực đến ngân sách thu thập dữ liệu.
Do đó, bạn nên tối ưu các file JavaScript và CSS cho website. Việc tối ưu hóa các file này sẽ giảm thiểu các tác động tiêu cực của code.
Cùng tham khảo thêm một số bài viết về cách sửa lỗi trên Google Search Console có thể bạn quan tâm:
📌 Cách sửa alternate page with proper canonical tag
📌 Cách sửa lỗi Server Error 5xx trong Google Search Console
📌 Sửa lỗi excluded by noindex tag trong Google Search Console
Khi nào cần tối ưu hóa các trang “Discovered – Currently Not Indexed”?
Ở một số trường hợp, bạn không cần cập nhật các URL có trạng thái “Discovered – Currently Not Indexed”, chẳng hạn như:
Điều quan trọng là bạn phải kiểm tra URL của mình có nên được thu thập thông tin ngay từ đầu hay không. Việc một số page được báo cáo là “Discovered ‐ Currently Not Indexed” là điều bình thường. Tuy nhiên, nếu:
- Gia tăng số lượng URL.
- Các URL quan trọng hiển thị trạng thái “Discovered ‐ Currently Not Indexed”.
Khi đó, bạn cần kiểm tra và tối ưu hóa các URL bị ảnh hưởng vì điều này có thể làm giảm đáng kể thứ hạng và traffic trên website.
Cùng tham khảo thêm một số bài viết liên quan bạn có thể quan tâm:
📌 7 cách kiểm tra traffic website mình và đối thủ
📌 Organic traffic là gì? Hướng dẫn cách tăng Organic traffic nhanh chóng
Công cụ kiểm tra URL
Sau khi quyết định cập nhật nội dung và URL, bạn có thể thông qua công cụ kiểm tra URL của Google để yêu cầu lập chỉ mục các page cụ thể. Thao tác thực hiện như sau:
- Bước 1: Mở công cụ kiểm tra URL trên GSC.
- Bước 2: Dán URL muốn lập chỉ mục vào thanh tìm kiếm ở đầu page.
- Bước 3: Nhập vào nút “request indexing”.
Sử dụng công cụ kiểm tra URL để yêu cầu lập chỉ mục không đảm bảo một page cụ thể sẽ được thu thập dữ liệu và lập chỉ mục. Thay vào đó, việc làm này giống như gửi một tín hiệu cho Google biết bạn muốn ưu tiên page được thu thập dữ liệu và lập chỉ mục.
Kết luận
Vietnix hy vọng bài viết có thể giúp bạn nắm rõ về 7 cách khắc phục tình trạng lỗi Discovered – Currently Not Indexed trong Google Search Console. Ngoài ra bạn có thể đọc thêm các bài viết của Vietnix về cách thêm web WordPress vào Google Search Console. Vietnix chúc bạn thành công!