NỘI DUNG

Hosting tốc độ cao Vietnix - tốc độ tải trang trung bình dưới 1 giây
VPS siêu tốc Vietnix - trải nghiệm mượt mà, ổn định
04/10/2023
Lượt xem

Cách tìm và sửa lỗi orphan pages đơn giản, hiệu quả nhất

04/10/2023
16 phút đọc
Lượt xem

Đánh giá

5/5 - (163 bình chọn)

Orphan pages là các trang không có bất kỳ internal link nào trỏ đến chúng. Các trang này có thể gây hại vì chúng không mang lại lợi ích về organic traffic và có thể làm lãng phí crawl budget cho việc thu thập dữ liệu, ảnh hưởng đến việc index các trang quan trọng hơn. Do đó, trong bài viết này, Vietnix sẽ hướng dẫn bạn cách tìm và sửa lỗi orphan pages đơn giản, hiệu quả nhất.

Orphan pages ảnh hưởng đến SEO như thế nào?

Orphan pages là những trang trên website mà không có internal link trỏ đến. Điều này gây khó khăn cho cả công cụ tìm kiếm và người dùng khi tìm kiếm thông tin trên website. Khi người dùng tìm thấy những trang này qua các cách khác, họ có thể không hiểu được cách chúng liên quan đến phần còn lại của website. Điều này càng trở nên quan trọng hơn đối với công cụ tìm kiếm, vì chúng sẽ khó khăn trong việc đánh giá và xếp hạng website của bạn.

Ảnh hưởng của orphan pages đến SEO
Ảnh hưởng của orphan pages đến SEO

Ảnh hưởng của orphan pages đến công cụ tìm kiếm

Orphan pages ảnh hưởng xấu đến công cụ tìm kiếm bởi nhiều cách. Trước hết, chúng khó được tìm thấy bởi công cụ tìm kiếm khi thu thập nội dung trên website của bạn vì thiếu internal link. Công cụ tìm kiếm thường tìm các trang mới thông qua internal link, external link hoặc file XML sitemap. 

Orphan pages có thể được thêm vào sitemap hoặc liên kết từ bên ngoài, nhưng điều này không phải lúc nào cũng là tốt.

Google có thể index một URL từ sitemap mà không cần liên kết, nhưng chúng sẽ khó khăn trong việc đánh giá giá trị của trang đó do internal link. Có nhiều yếu tố ảnh hưởng đến việc index orphan pages trong sitemap, ví dụ như kích thước của trang web. Nếu website lớn, Google thường index ít trang và orphan pages có ít cơ hội được index.

Kết quả là orphan pages thường không được Google index và không xếp hạng trên kết quả tìm kiếm, không mang lại organic traffic cho website của bạn.

Nếu orphan pages được index vì những lý do khác, vấn đề không chỉ dừng ở đó. Do thiếu internal link, PageRank sẽ không thể chuyển đến orphan pages. Hơn nữa, các công cụ tìm kiếm sẽ không có thông tin về bối cảnh, ngữ nghĩa hoặc cấu trúc của trang. Điều này khiến cho việc xác định trang này phù hợp với các truy vấn trở nên khó khăn, vì chúng không biết trang đó thuộc về đâu trong cấu trúc tổng thể của website.

Nếu bạn có orphan pages chất lượng thấp và công cụ tìm kiếm không bị hạn chế trong việc thu thập dữ liệu từ chúng qua file robots.txt hoặc không bị chặn index qua thẻ noindex, có thể gây lãng phí crawl budget khi công cụ tìm kiếm thu thập thông tin. Điều này có thể gây bất lợi nếu bạn có một website lớn có nguy cơ gặp vấn đề về ngân sách thu thập dữ liệu.

Trong một số ít trường hợp, orphan pages chất lượng thấp cũng có thể dẫn đến tình trạng index bloat. Điều này xảy ra khi công cụ tìm kiếm index một cách không kiểm soát, bao gồm cả thin content hoặc duplicate content.

Hơn nữa, nếu công cụ tìm kiếm xác định rằng trang không đủ giá trị để index, nhưng bạn làm cho chúng có thể index, điều đó có thể ngăn cản chúng index các trang khác trên website. Điều này xảy ra do những trang chất lượng thấp này có thể ảnh hưởng tiêu cực đến nhận thức tổng quan về chất lượng của website.

Bạn cần nhớ rằng nếu một trang có ít nhất một internal link, chúng sẽ không còn là orphan pages nữa. Tuy nhiên, nếu một trang chỉ có một liên kết và đó là liên kết quan trọng cho website, hãy xem xét việc tạo thêm nhiều liên kết khác để tăng cường vị trí của trang đó trong cấu trúc website. Điều này cũng giúp bạn tránh tình trạng orphan pages nếu liên kết duy nhất bị xóa.

Ảnh hưởng của orphan pages đến người dùng

Nếu orphan pages chứa nội dung chất lượng cao có thể thu hút nhiều traffic đến website và dẫn đến việc chuyển đổi. Tuy nhiên, người dùng sẽ gặp khó khăn khi tìm kiếm chúng nếu chúng không nằm trong cấu trúc của website. Điều này có nghĩa là bạn có thể lãng phí thời gian và tài nguyên khi tạo nội dung cho các trang này.

Nếu orphan pages không được liên kết một cách có chủ đích nhưng người dùng vẫn có thể tìm thấy thì hoàn toàn khác biệt. Khách truy cập đến các trang này có thể bắt gặp nội dung đã cũ hoặc không liên quan, gây ảnh hưởng đến trải nghiệm của họ.

Nguyên nhân dẫn đến orphan pages

Các nguyên nhân phổ biến dẫn đến việc có các orphan pages bao gồm:

  • Di chuyển trang web. Ví dụ như khi một số trang cũ không được đưa vào điều hướng mới và không được redirect đến trang mới.
  • Cấu trúc website chưa được tối ưu hóa, khiến một số trang không có liên kết vì thiếu chiến lược cấu trúc website. Có thể còn tồn tại các cơ chế trên website không tự động đưa các trang mới vào thanh điều hướng.
  • Hệ thống quản lý nội dung (CMS) tạo ra các URL bổ sung mà bạn không hề biết.
  • Các trang trở nên lỗi thời hoặc không còn phù hợp, dẫn đến việc loại bỏ liên kết trỏ đến chúng, nhưng các trang vẫn được xuất bản. Thường gặp ở các sản phẩm hết hàng.
  • Không thêm liên kết vào một số trang một cách có chủ đích. Ví dụ như trang landing page quảng cáo.
Nguyên nhân dẫn đến orphan pages
Nguyên nhân dẫn đến orphan pages

Nhiều trường hợp xảy ra do thiếu quy trình rõ ràng, thống nhất cho việc thực hiện các thay đổi trên website, chuyển đổi từ môi trường staging sang production, thực hiện các thay đổi quan trọng trên website,…

Có nhiều nguyên nhân dẫn đến việc xuất hiện orphan pages. Do đó, việc xử lý các orphan pages không chỉ đơn giản là thêm liên kết đến những trang này. Không phải trang nào cũng cần phải có liên kết trỏ đến chúng. Việc thêm liên kết đồng nghĩa với việc bạn muốn cho cả công cụ tìm kiếm và người dùng biết về những trang này.

Việc xóa bỏ chúng khỏi trong cấu trúc website là một dấu hiệu cho thấy chúng không có giá trị với bạn. Điều này cộng với việc hạn chế thu thập dữ liệu của chúng trong file robots.txt hoặc sử dụng thẻ noindex sẽ khiến chúng không được Google index.

Bên cạnh đó, bạn có thể tham khảo hướng dẫn tạo Staging WordPress trên cPanel nhanh chóng để hiểu thêm về staging trên WordPress.

Cách tìm orphan pages đơn giản

Để sửa lỗi orphan pages, trước hết bạn cần tìm ra chúng trên website của bạn dựa vào những nguồn dữ liệu sau đây:

  • Sitemap hoặc danh sách URL khác mà bạn có.
  • Liên kết database (như Ahrefs.com) giúp bạn tìm thấy các liên kết từ các trang web khác đến các trang của bạn.
  • Sử dụng các dịch vụ phân tích website như Google Analytics.
  • Phân tích tìm kiếm (Search analytics) như Google Search Console.
  • File log trên server của bạn.
Cách tìm orphan pages
Cách tìm orphan pages

Sau khi xác định orphan pages, bạn có thể sử dụng các công cụ như Ahrefs, SEMrush hoặc Screaming Frog để hiển thị danh sách các trang này. Điều này giúp bạn hiểu rõ hơn về cấu trúc website và tiến hành quá trình sửa chữa

Lấy danh sách các trang có thể thu thập thông tin

Bạn có thể lấy danh sách các trang từ file sitemap XML của mình vì chỉ chứa các URL có thể thu thập thông tin và index. Tốt nhất là sử dụng một trình thu thập dữ liệu. Trình thu thập thông tin bạn sử dụng chỉ nên được đặt để thu thập thông tin từ các trang có thể index và bỏ qua các trang sử dụng thẻ noindex, có lệnh robots.txt.

Bạn nhớ chỉ thu thập thông tin từ các URL chuẩn, bao gồm cả giao thức HTTP hoặc HTTPSsubdomain www hoặc không có www.

Danh sách các trang
Danh sách các trang

Xác định những trang được truy cập

Sau khi có danh sách các trang có thể thu thập thông tin, bạn cần xác định các trang mà người dùng hoặc trình thu thập thông tin truy cập bằng cách:

Lấy dữ liệu từ Google Analytics

Google Analytics có thể giúp bạn xác định các trang mà người dùng hoặc trình thu thập thông tin truy cập bằng cách theo dõi các external link (bao gồm social media) hoặc nhập trực tiếp địa chỉ. Cách thực hiện như sau:

Trong Google Analytics, bạn tìm đến mục Behavior > Chọn Site Content > Chọn All pages.

Chọn all pages để lấy dữ liệu
Chọn all pages để lấy dữ liệu

Xem tất cả các URL đã được truy cập trước đó. Bạn nên chọn ngày càng xa càng tốt. Sau đó, bạn xuất danh sách nhận được.

Xuất danh sách
Xuất danh sách

Lấy dữ liệu từ Google Search Console

Bạn cũng có thể tìm kiếm thông tin hữu ích trong Google Search Console và hiệu quả sẽ tốt hơn nếu bạn kết hợp với dữ liệu từ Google Analytics. Google Search Console có thể cung cấp thông tin về các URL mà công cụ thu thập dữ liệu của Google đã truy cập mà không cần sử dụng liên kết nội bộ trên trang web của bạn. Cách thực hiện như sau:

Trong Google Search Console, bạn chọn Performance > Chọn Pages.

Đảm bảo số lần xuất hiện (Impressions) đã được tính vào trong dữ liệu. Đồng thời, điều chỉnh khoảng thời gian để xem thông tin càng xa càng tốt, điều này sẽ cho bạn thấy tất cả các địa chỉ URL đã được hiển thị trong khoảng thời gian bạn đã chọn.

Ngoài ra, bạn có thể tham khảo các bài viết sau để hiểu thêm về công cụ Google Search Console:

Sử dụng file log trên server

Ngoài Google Analytics và Google Search Console, bạn có thể thu thập dữ liệu chi tiết nhất từ việc phân tích file log trên server. File log chứa thông tin về ai đã truy cập website của bạn (bao gồm trình thu thập thông tin của công cụ tìm kiếm và người dùng) và những trang họ đã truy cập. Để sử dụng, bạn sẽ cần truy cập vào server của mình.

Đối chiếu dữ liệu

Bạn cần tìm các trang có trong tập dữ liệu của Google Analytics và Google Search Console hoặc file log mà thiếu khỏi danh sách các trang đã biết, vì đây chính là orphan pages.

Bạn có thể sử dụng Google Sheets, Excel,… để đối chiếu các tập dữ liệu với nhau. Sau khi xác định được tất cả orphan pages, bạn xuất chúng ra một file hoặc sheet riêng để tiến hành việc tối ưu.

Cách phân tích orphan pages

Khi bạn đã có danh sách orphan pages trên website của mình, bạn cần đánh giá chúng và tự đặt cho mình một số câu hỏi để biết nên làm gì tiếp theo:

  • Trang này có giá trị đối với website của bạn không? Chúng có mục tiêu quan trọng liên quan đến gia tăng traffic hoặc chuyển đổi không?
  • Trang này có đang xếp hạng cho bất kỳ từ khóa nào hay không?
  • Trang này nên nằm ở đâu trong phân loại của website?
  • Trang này có trùng lặp hoặc gần giống với trang khác không? Bạn có thể chuyển nội dung của trang này đến một trang liên quan khác không phải orphan pages không?
  • Trang này đã được tối ưu chưa? Bạn có cần cải thiện không?
  • Trang có nhiều backlink chất lượng không?

Bên cạnh đó, bạn cần xem xét lý do tại sao các trang này lại trở thành orphan pages để có thể tránh được những vấn đề tương tự trong tương lai.

Phân tích orphan pages
Phân tích orphan pages

Cách tối ưu và sửa lỗi orphan pages

Để tối ưu orphan pages, bạn có thể thực hiện theo các cách sau đây:

Tối ưu orphan pages
Tối ưu orphan pages

Liên kết đến trang từ các trang nội bộ khác

Khi orphan pages quan trọng với người dùng và bạn muốn được tìm thấy và truy cập thì bạn nên thêm các internal link đến trang đó từ các trang khác trên website. Điều này sẽ giúp công cụ tìm kiếm và người dùng tìm thấy trang.

Khi xem xét vị trí để thêm liên kết đến trang này, bạn cần lưu ý một số điều sau:

  • Có nên thêm các liên kết từ các bài viết liên quan về chủ đề không?
  • Có cần phải cải thiện kiến trúc website để tạo không gian cho trang này không?
  • Có nên viết lại nội dung nào đó để liên kết phù hợp hơn không?
  • Có nên có một liên kết đến chúng trong thanh điều hướng chính hoặc footer không?
  • Có nên chọn anchor text để cung cấp ngữ cảnh cho các công cụ tìm kiếm và người dùng khi họ truy cập trang đó không?

Redirect trang

Một phương pháp khác là thiết lập redirect URL đến một trang mới, tốt nhất là một trang tương đương có liên quan, đáp ứng được ý định tìm kiếm của người dùng.

Nếu muốn redirect vĩnh viễn, bạn hãy sử dụng redirect 301 để giữ lại càng nhiều PageRank càng tốt và chỉ đúng việc chuyển hướng này cho các công cụ tìm kiếm.

Để hiểu thêm về redirect, bạn có thể tham khảo một số bài viết sau:

Xóa trang

Nếu orphan pages không có giá trị, không cần thiết cho website và không thể redirect chúng, bạn có thể xóa. Cách phổ biến nhất là thay đổi status code thành 404.

Để hiểu thêm về lỗi 404, bạn có thể tham khảo bài viết lỗi 404 Not Found là gì? Nguyên nhân và cách khắc phục.

Giữ nguyên trang

Nếu orphan pages đó đang phục vụ cho việc kinh doanh mà không cần internal link trỏ đến chúng thì bạn hãy giữ nguyên trang. Trường hợp này thường gặp khi bạn có một landing page cho một chiến dịch mà bạn chỉ muốn hiển thị cho người dùng vào các thời điểm cụ thể.

Tìm kiếm orphan pages theo định kỳ

Tùy theo kích thước của website, bạn nên xây dựng một quy trình theo dõi để phát hiện orphan pages mới trước khi chúng ảnh hưởng đến hiệu quả SEO. Chẳng hạn như bạn có thể thiết lập một quá trình thu thập dữ liệu theo định kỳ để tìm orphan pages. Cách tốt nhất để ngăn chặn orphan pages xuất hiện trong tương lai là xác định nguyên nhân gây ra chúng và giải quyết vấn đề từ gốc. 

Tìm kiếm orphan pages theo định kỳ
Tìm kiếm orphan pages theo định kỳ

Mỗi khi bạn xuất bản một trang mới, bạn cần đảm bảo có liên kết trỏ đến chúng, trừ trường hợp bạn muốn trang đó không được liên kết. Bạn cũng có thể triển khai các giải pháp tự động tạo internal link như các trang category và các mục liên quan.

Lời kết

Trên đây là những thông tin hữu ích về cách tìm và sửa lỗi orphan pages hiệu quả. Hy vọng rằng những thông tin này sẽ giúp bạn thực hiện quá trình tối ưu hóa SEO một cách thành công. Nếu bạn còn có bất kỳ câu hỏi hoặc thắc mắc nào, đừng ngần ngại để lại bình luận bên dưới để Vietnix có thể hỗ trợ bạn nhanh chóng.

THEO DÕI VÀ CẬP NHẬT CHỦ ĐỀ BẠN QUAN TÂM

Đăng ký ngay để nhận những thông tin mới nhất từ blog của chúng tôi. Đừng bỏ lỡ cơ hội truy cập kiến thức và tin tức hàng ngày

Chọn chủ đề :

Hoàng Vui

SEO Specialist
tại

Kết nối với mình qua

Kết nối với mình qua

Tăng tốc độ website - Nâng tầm giá trị thương hiệu

Banner group
Tăng tốc tải trang

95 điểm

Nâng cao trải nghiệm người dùng

Tăng 8% tỷ lệ chuyển đổi

Thúc đẩy SEO, Google Ads hiệu quả

Tăng tốc ngay

SẢN PHẨM NỔI BẬT

Black Friday Hosting & VPS

Chương trình bắt đầu sau

Giảm giá 40% hosting VPS

50 coupon mỗi ngày

Gia hạn giá không đổi

NHẬN DEAL NGAY
Pattern

7 NGÀY DÙNG THỬ HOSTING

NẮM BẮT CƠ HỘI, THÀNH CÔNG DẪN LỐI

Cùng trải nghiệm dịch vụ hosting tốc độ cao được hơn 100,000 khách hàng sử dụng

Icon
ĐĂNG KÝ NHẬN TÀI LIỆU THÀNH CÔNG
Cảm ơn bạn đã đăng ký nhận tài liệu mới nhất từ Vietnix!
ĐÓNG

ĐĂNG KÝ DÙNG THỬ HOSTING

Asset

7 NGÀY MIỄN PHÍ

Asset 1

ĐĂNG KÝ DÙNG THỬ HOSTING

Asset

7 NGÀY MIỄN PHÍ

Asset 1
Icon
XÁC NHẬN ĐĂNG KÝ DÙNG THỬ THÀNH CÔNG
Cảm ơn bạn đã đăng ký thông tin thành công. Đội ngũ CSKH sẽ liên hệ trực tiếp để kích hoạt dịch vụ cho bạn nhanh nhất!
ĐÓNG