Lỗi của Baidu trong việc đánh giá nội dung gốc

Sau khi bài đăng trên blog cập nhật cuối cùng của tác giả được đưa vào Baidu, tác giả đã đăng bài viết lên nhiều trang web, nhưng sau đó tác giả đã phát hiện ra một hiện tượng kỳ lạ.

Vào buổi tối, blog của tác giả đã cập nhật một bài báo có tiêu đề “Chi tiết quan trọng trong quá trình tối ưu hóa SEO trang web”, và Baidu đã đưa bài viết này vào ngày hôm sau. Tìm kiếm tiêu đề này, trang được xếp hạng đầu tiên, điều này rất bình thường. Chiều ngày hôm sau, tác giả đăng bài lên nhiều trang web khác, trong đó có A5. Chưa đầy một giờ, bài viết này của A5 đã được Baidu đưa vào thành công.
Nhưng điều khủng khiếp là Baidu tìm kiếm tiêu đề bài báo, trang gốc đã biến mất, và trang bài viết của A5 chạy lên vị trí đầu tiên. Rõ ràng, Baidu đánh giá các bài báo của A5 là “nguyên bản” và blog của tác giả là “đạo văn”.

Lỗi phán đoán ban đầu của Baidu

Nói chung, công cụ tìm kiếm có thể xác định tính độc đáo của một bài báo bằng các yếu tố như thời gian xuất bản (thời gian thu thập) và trọng lượng trang web. Trọng lượng của A5 rõ ràng là cao hơn nhiều so với Benbo, nhưng tôi không ngờ rằng trọng lượng của trang web lại có thể đóng vai trò lớn như vậy trong việc xác định độ độc đáo của Baidu?
Trước đây cũng đã từng xảy ra tình trạng tương tự, nhưng nhìn chung các trang của các trang web có trọng lượng cao được xếp trước trang gốc của tác giả, ít nhất vẫn có thể tìm kiếm được trang gốc. Nhưng lần này đã mấy ngày trôi qua, lục tìm tên bài báo, mấy trang đầu cũng không có trang gốc.

Đây rõ ràng là sai lầm của Baidu trong việc đánh giá nội dung gốc, ngược lại, nhận định của Google tương đối chính xác. Điều này chứng tỏ ảnh hưởng của trọng lượng trang web đối với SEO và sự tuyệt vời của nó ít nhất cũng được phản ánh qua Baidu.
Mặc dù vậy, tác giả cũng không khỏi than thở: Bạn không phân biệt được thứ tự đưa vào Baidu nên phải lấy cân nặng làm tiêu chuẩn? Tuy các đài cũ công suất lớn đáng tin cậy nhưng đối với các đài mới thì quá bất công phải không các bạn? Hơn nữa, blog của tôi đã được thành lập cách đây 5 tháng, mặc dù cập nhật không quá thường xuyên nhưng ít nhất tôi luôn kiên quyết cập nhật nội dung gốc!
Nhưng nói vậy, không biết bạn bè của bạn có gặp phải trường hợp tương tự không? Những bài báo tương tự nên được “thay thế” bởi những trang web có trọng lượng cao bằng những bài báo gốc, và chúng sẽ bị loại khỏi bảng xếp hạng, phải không?

Trên thực tế, tôi có thể hiểu Baidu, một công cụ tìm kiếm phân tích hàng chục nghìn “nội dung mới” mỗi ngày, và spider chỉ là một chương trình và sẽ luôn xảy ra sai sót. Đồng thời cũng mong rằng Baidu có thể học hỏi thêm từ Google về vấn đề này, để không còn chỗ cho những trang mới làm seo. Người ta có trọng lượng cao, và bản tái bản nào cũng là nguyên bản; địa điểm mới có trọng lượng thấp, và bản gốc được chăm chút sẽ bị biến thành “đạo văn”. Đây là gì?
Câu cuối cùng, Baidu seo cân vương?