Nếu nội dung của bạn đang bị đánh cắp, xuất bản và đang lấy đi traffic khỏi thương hiệu của bạn thì bạn cần phải tìm và xóa chúng càng sớm càng tốt. Trong bài viết này, Vietnix sẽ hướng dẫn bạn cách bạn có thể tìm và xóa nội dung bị đánh cắp trong WordPress, bất kể một bài đăng hay toàn bộ trang web của bạn đã được sao chép.
Nội dung trang web bị đánh cắp là như thế nào và tại sao?
Một phương pháp phổ biến để đánh cắp nội dung là blog content scraping. Với hình thức này nội dung được lấy từ trang web của bạn, thông qua nguồn cấp dữ liệu RSS và được xuất bản lại trên một trang web khác.
Đôi khi nội dung sẽ được sao chép và paste trực tiếp vào một trang web khác, bao gồm định dạng, hình ảnh, video, v.v. Hoặc cũng có lúc nội dung sẽ được repost với backlink quay lại trang web nhưng không có sự cho phép của bạn. Mặc dù việc này có thể giúp ích cho SEO nhưng bạn có thể chỉ muốn giữ nội dung gốc được lưu trữ trên trang web của mình.
Việc nội dung của bạn bị đánh cắp là một điều không hay mà rất nhiều chủ sở hữu trang web WordPress gặp phải.
Tổng hợp 5 cách khắc phục nội dung website bị đánh cắp
1. Thiết lập thông báo đánh cắp nội dung tự động
Những khách truy cập thường xuyên sẽ cảnh báo bạn rằng nội dung của bạn đã bị đánh cắp hoặc họ đã nhìn thấy nội dung đó ở nơi nào khác trên web. Tuy nhiên, bạn sẽ không cần phải đợi thông báo từ người dùng mà có thể chủ động theo dõi thông qua Google Alerts.
Google Alerts thường được sử dụng để thông báo tên thương hiệu. Bạn nhập tên trang web của mình và nhận thông báo qua email bất cứ khi nào bạn được đề cập trực tuyến.
Hơn nữa, tính năng này có thể được sử dụng để cảnh báo bạn về nội dung đang được sử dụng mà không có sự cho phép của bạn. Chỉ cần điều hướng tới Google Alerts, nhập tên trang web và URL của bạn hoặc sử dụng một phần bài viết của bạn.
Ví dụ: nếu bạn kết thúc mỗi bài đăng trên blog bằng cùng một call to action thì bạn có thể nhận được thông báo bất cứ khi nào lời kêu gọi này xuất hiện trực tuyến.
Sau đó, bạn cần chọn ‘Sources’. Chọn ‘Blog‘ và ‘Web‘ từ danh sách thả xuống, rồi nhấp vào ‘Create Alert‘. Giờ đây, bạn sẽ nhận được email bất cứ khi nào nội dung của bạn xuất hiện trên web hoặc trang web của bạn được đề cập.
2. Tìm kiếm nội dung bị đánh cắp theo cách thủ công
Copyscape là một công cụ kiểm tra đạo văn cũng có thể được sử dụng để tìm nội dung bị đánh cắp được xuất bản ở nơi khác trên web.
Để sử dụng công cụ này, bạn cần điều hướng đến Copyscape và nhập URL trang web của bạn. Bạn cũng có thể nhập một page hoặc URL bài đăng để xem liệu một trong các bài đăng trên blog hoặc trang web của bạn có bị sao chép và đánh cắp hay không.
Phiên bản miễn phí của công cụ này cung cấp cho bạn 10 kết quả hàng đầu, phù hợp cho các blog WordPress nhỏ. Tuy nhiên, nếu bạn có một trang web lớn hơn hoặc muốn có kết quả từ mỗi lần đề cập đến văn bản đã sao chép của mình thì bạn sẽ cần phải nâng cấp lên phiên premium.
Phiên bản trả phí của công cụ này cho phép bạn kiểm tra tới 10.000 page chỉ bằng một cú nhấp chuột. Nếu bạn xuất bản nhiều nội dung trên trang web WordPress của mình thì tính năng này rất hữu ích.
Một công cụ thủ công khác mà bạn có thể sử dụng là Grammarly – là công cụ kiểm tra ngữ pháp trực tuyến phổ biến . Phiên bản premium của Grammarly có trình kiểm tra đạo văn tích hợp. Bạn có thể sao chép và dán nội dung của mình vào công cụ và sẽ scan để xem có kết quả trùng khớp nào xuất hiện hay không.
3. Liên hệ với Offending Host hoặc Registrar
Khi bạn đã tìm thấy nội dung bị đánh cắp thì tiếp theo, cách đơn giản nhất để gỡ bỏ là gửi khiếu nại DMCA đối với trang web.
Thông thường, nếu đó là một trang web spam hoặc một trang web đang lấy nội dung của bạn khỏi nguồn cấp dữ liệu RSS thì khó tìm thấy thông tin liên hệ. Tuy nhiên, bạn có thể sử dụng công cụ tra cứu IsItWP để tìm ra hosting tên miền và trang web.
Chỉ cần nhập tên miền đã xuất bản của nội dung bị đánh cắp và nhấp vào ‘Analyze Website‘. Công cụ này sẽ hiển thị mọi thông tin có sẵn, bao gồm công ty hosting web và registrar.
Bạn sẽ thấy rằng máy chủ hosting và registrar được hiển thị, ngay cả khi trang web không sử dụng WordPress. Bạn có thể liên hệ trực tiếp với Offending Host và registrar để thử gỡ bỏ trang web.
Vì ăn cắp nội dung là bất hợp pháp nên các công ty hosting không muốn lưu trữ các trang web vi phạm pháp luật. Hầu hết các công ty hosting web có uy tín đều coi trọng các yêu cầu DMCA và sẽ làm việc với bạn để giải quyết tình huống này, bao gồm cả việc xóa các page vi phạm.
4. Gửi thông báo gỡ xuống cho Google
Một cách khác để xóa nội dung bị đánh cắp là liên hệ trực tiếp với Google. Tuy nhiên, bạn cần cẩn thận khi sử dụng phương pháp này vì nó yêu cầu nhiều bằng chứng và nếu bạn báo cáo sai thì tài khoản của bạn có thể gặp rắc rối.
Có một số cách khác nhau để gửi khiếu nại DMCA tới Google nhưng bạn nên sử dụng cách trong Google Search Console. Trước tiên, bạn cần liên kết trang web của mình với Google Search Console. Nếu bạn chưa biết cách thực hiện, hãy xem hướng dẫn về cách thêm trang web WordPress vào Google Search Console.
Sau đó, bạn có thể sử dụng Google Search Console Copyright Removal Tool.
Chỉ cần nhấp vào ‘Create a report‘ và chọn ‘New US DMCA report‘ từ trình đơn thả xuống. Thao tác này sẽ hiển thị một màn hình nơi bạn có thể nhập tất cả thông tin liên quan, bao gồm thông tin liên hệ của bạn, bài đăng nào bị đánh cắp và vị trí của tài liệu bị đánh cắp.
Thông tin bạn cung cấp càng chi tiết thì khả năng trang web vi phạm bị gỡ xuống càng cao. Nếu bạn cần thu thập thêm thông tin cho khiếu nại của mình thì bạn có thể sử dụng một công cụ như Wayback Machine.
Công cụ này chụp nhanh trang web của bạn tại các thời điểm khác nhau. Vì vậy, bạn có thể so sánh ngày bạn xuất bản bài viết với trang web vi phạm đã đánh cắp nội dung của bạn.
5. Sử dụng công cụ All in One Scanner và công cụ gỡ xuống
Bạn cũng có thể sử dụng công cụ Digital Millennium Copyright Act (DMCA) để giúp bạn tìm nội dung trùng lặp trên web. Chỉ cần nhập văn bản hoặc URL của bạn vào, công cụ sẽ quét để tìm các trang web đã đánh cắp nội dung của bạn.
Lưu ý: Kết quả không phải lúc nào cũng là nội dung bị đánh cắp. Đôi khi nó có thể là infographics, backlinks, unlinked brand mentions, v.v.
Khi bạn tìm thấy một trang web đạo văn hoặc đánh cắp nội dung của mình, bạn có thể bắt đầu quá trình gỡ bỏ bằng cách sử dụng chính công cụ trực tuyến này. DMCA cung cấp các công cụ và template gỡ xuống cao cấp với giá 10 USD/tháng hoặc bạn có thể mua dịch vụ gỡ bỏ đầy đủ với giá 199 USD, họ sẽ xóa nội dung bị đánh cắp cho bạn.
Tóm lại, đánh cắp nội dung là một vấn đề thực sự mà hầu hết mọi chủ sở hữu trang web đều phải đối mặt. Trang web của bạn càng lớn thì càng có nhiều người sao chép bạn.
Một số người sẽ thực hiện hành vi đánh cắp nội dung trắng trợn bằng cách sử dụng các công cụ scan nội dung tự động, trong khi những người khác sẽ dựa trên nội dung và cách diễn đạt của bạn để xây dựng nội dung tương tự. Tuy nhiên, đừng để điều đó làm bạn nản lòng mà hãy tiếp tục tập trung vào việc xây dựng web và thực hiện các biện pháp như Vietnix đã nêu để hạn chế bị đánh cắp nội dung.
Lời kết
Vietnix hy vọng bài viết này đã giúp bạn hiểu cách tìm và xóa nội dung bị đánh cắp trong WordPress. Bạn cũng có thể muốn xem hướng dẫn của Vietnix về top công cụ phân tích website hiệu quả nhất để hỗ trợ cho hoạt động kinh doanh của mình, chúc bạn thành công!