Hợp tác để giúp giải quyết các vấn đề nội dung trùng lặp

Một trong những thách thức phổ biến nhất mà các công cụ tìm kiếm gặp phải khi lập chỉ mục một trang web là xác định và hợp nhất các trang trùng lặp.
Hợp tác để giúp giải quyết các vấn đề nội dung trùng lặp
Các bản sao có thể xảy ra khi bất kỳ trang web cụ thể nào có nhiều URL trỏ đến nó. Ví dụ:
URL
Sự miêu tả
http://mysite.com Quản trị viên web có thể xem xét URL có thẩm quyền hoặc chuẩn của họ cho trang chủ của họ.
http://www.mysite.com Tuy nhiên, bạn có thể thêm 'www' vào hầu hết các trang web và vẫn nhận được cùng một trang chủ.
http://mysite.com/default.aspx Bạn cũng có thể thường xuyên thêm tên tệp cụ thể của trang chủ và nhận được cùng một trang
http://mysite.com/default.aspx?promo=ABC Nhiều lần các trang web sử dụng thông số để theo dõi những thứ như khách hàng đến từ đâu (trong trường hợp này là quảng cáo ngoại tuyến) hoặc thông số xác định cách nội dung trên trang được định dạng.
Bốn trường hợp này chỉ là một vài trong số rất nhiều khả năng. Khi bạn xem xét tất cả các kết hợp này, bạn có thể có nhiều hơn 10 URL clone cho mỗi trang trên trang web của bạn. Điều đó có nghĩa là nếu có 1 triệu trang trên trang web của bạn, chúng tôi có thể tìm thấy 10 triệu hoặc nhiều URL được nhân bản trỏ đến chúng. Việc xác định URL chuẩn của bạn trong số tất cả sự lộn xộn trùng lặp là một thách thức lớn đối với các công cụ tìm kiếm vì tất cả chúng ta đều làm việc để giảm chi phí và cải thiện mức độ liên quan.

Để giúp giải quyết vấn đề này, Tìm kiếm trực tiếp đã hợp tác với Google và Yahoo để hỗ trợ thuộc tính thẻ mới sẽ giúp quản trị viên web xác định URL có thẩm quyền duy nhất (hoặc chuẩn ) cho một trang nhất định. Các thẻ liên kết xác định một mối quan hệ giữa một tài liệu và một nguồn lực bên ngoài. Trong trường hợp này, tài nguyên đó là URL chuẩn. Sau đây là ví dụ về thuộc tính thẻ liên kết mới để chuẩn hóa:
< link  rel = "canonical"  href = "http://mysite.com" />
Một vài lưu ý về việc triển khai thuộc tính mới:

Thẻ này sẽ được diễn giải dưới dạng gợi ý bằng Tìm kiếm trực tiếp chứ không phải là lệnh. Chúng tôi sẽ đánh giá điều này trong bối cảnh của tất cả các thông tin khác mà chúng tôi biết về trang web và cố gắng đưa ra quyết định tốt nhất về URL chuẩn . Điều này sẽ giúp chúng tôi xử lý bất kỳ lỗi triển khai tiềm năng nào hoặc lạm dụng thẻ này.

Bạn có thể sử dụng URL tương đối hoặc tuyệt đối trong thuộc tính “href” của thẻ liên kết.

Trang và URL trong thuộc tính “href” phải nằm trên cùng một miền. Ví dụ: nếu trang được tìm thấy trên “http://mysite.com/default.aspx” và thuộc tính ”href” trong thẻ liên kết trỏ đến “http://mysite2.com”, thẻ sẽ không hợp lệ và bỏ qua.

Tuy nhiên, thuộc tính “href” có thể trỏ đến một tên miền phụ khác. Ví dụ: nếu trang được tìm thấy trên “http://mysite.com/default.aspx” và thuộc tính “href” trong thẻ liên kết trỏ đến “http://www.mysite.com”, thẻ sẽ là được coi là hợp lệ.

Live Search hy vọng sẽ triển khai hỗ trợ cho tính năng này trong tương lai gần.

Mặc dù chúng tôi hy vọng lệnh này sẽ giúp chúng tôi giải quyết được nhiều vấn đề nội dung trùng lặp phức tạp hơn, chúng tôi vẫn khuyến nghị các quản trị viên web nên thực hiện theo các phương pháp hay nhất hiện hành để chuẩn hóa URL thông qua chuẩn hóa miền và chuẩn hóa thông số URL . Chúng tôi sẽ cung cấp thêm chi tiết về thẻ liên kết sau khi chúng tôi đã triển khai hỗ trợ đầy đủ trong một trong các bản phát hành sắp tới của chúng tôi. Trong thời gian chờ đợi, chúng tôi mong muốn được nghe phản hồi của bạn về thẻ mới.

- Nathan Buggia, Nhóm quản trị viên web tìm kiếm trực tuyến

Bình luận SEO