Trang web WP được tối ưu hóa cho seo? Hãy cẩn thận với Replytocom trùng lặp

Tất cả mọi người phải nhận thức được những mặt hạn chế của việc đưa nhiều lần tối ưu hóa seo lên website. Bao gồm trùng lặp là công cụ tìm kiếm liên tục lập chỉ mục các trang có cùng nội dung. Một lượng lớn nội dung trùng lặp tất nhiên là vô nghĩa, cho dù đối với công cụ tìm kiếm hay người dùng, nó tương đương với rác trên Internet.
Nói chung, có hai loại bản ghi trùng lặp: bản sao cùng một trang web và bản sao không cùng một trang web. Điều thứ hai là các trang web khác sao chép các trang web của chính họ hoặc các trang web sao chép, điều này có ít tác động đến các trang web của chính họ. Trước đây nhiều lần bao gồm các trang trong cùng một trang web, điều này có thể dẫn đến quan tâm trong các trường hợp nghiêm trọng.

Có rất nhiều nguyên nhân khiến trang web bị đưa vào liên tục, ở đây mình sẽ chủ yếu nói về một tình huống mà mình vừa gặp phải. Sử dụng “? Replytocom” trong phần bình luận blog được xây dựng bởi WP (word press).

wp blog replytocom bao gồm lặp lại
Hình trên là ảnh chụp màn hình khi trang này được Baidu đưa vào liên tục vào thời điểm đó (blog này đã bị đài Baidu k nhổ vào thời điểm chụp ảnh màn hình ), và bạn có thể thấy rằng liên kết có chứa “? Replytoco ..”. Trên thực tế, nó là “? Replytocom”, có nghĩa là con nhện Baidu đã thu thập liên kết trong bình luận của trang này, dẫn đến việc đưa vào nhiều lần. Tuy nhiên, Google đã nhiều lần không đưa vào? Replytocom, không phải là robot của Google không thể thu thập dữ liệu. Chỉ là khả năng phát hiện trang của Google tương đối mạnh và nhận thấy rằng các trang giống nhau sẽ không được đưa vào. Baidu Spider tương đối yếu, nếu không xử lý kịp thời, khi xuất hiện lượng lớn nội dung giống nhau, website có thể bị Baidu hạ cấp.
Giải pháp là viết các quy tắc trong robots.txt để cấm các trình thu thập thông tin được đưa vào. Chỉ cần thêm mã sau vào robots.txt:

Disallow: / *? Replytocom =

Vì blog được xây dựng bởi WP mà tác giả sử dụng, không rõ vấn đề này có còn xảy ra ở các trang web hệ thống khác hay không. Tuy nhiên, việc đưa vào nhiều lần tương đương với việc tạo ra thư rác, điều này luôn có hại cho môi trường Internet và việc tối ưu hóa seo của các trang web wp. Các bạn sinh viên sử dụng wp, để tối ưu seo website, hãy cẩn thận với những bao hàm lặp đi lặp lại do “? Replytocom” gây ra!