“Đó là canon!”
Bạn có thể đã nghe thấy cụm từ này được sử dụng để mô tả một tác phẩm sáng tạo vẫn đúng với một tác phẩm gốc hoặc vũ trụ hư cấu.
Nếu bạn đã quen thuộc với canon, bạn đang trên con đường tìm hiểu về quá trình chuẩn hóa và cách nó ảnh hưởng đến các trang web.
Ở đây, hãy cùng khám phá xem chuẩn hóa là gì, tại sao nó lại quan trọng đối với SEO và cách thêm thẻ vào trang web của riêng bạn.
Các bài viết liên quan:
Canonical là gì?
Canonicalization khai báo một trang web gốc hoặc trang web ưa thích, giúp hợp nhất các trang trùng lặp để thu thập thông tin.
Không cần đặt tên URL chuẩn, trình thu thập thông tin web có thể thu thập thông tin và lập chỉ mục nhiều phiên bản trang web của bạn. Google cho biết rằng nó sẽ thu thập dữ liệu các trang không phải chính tắc ít thường xuyên hơn để giảm tải thu thập thông tin trên trang web của bạn.
Việc thu thập thông tin các trang trùng lặp, chất lượng thấp ít thường xuyên hơn có nghĩa là các trang quan trọng hơn có thể được ưu tiên thu thập thông tin, thay vào đó.
Được rồi, nhưng tại sao chúng ta lại cố tình có nội dung trùng lặp? Chà… có bao giờ đăng nội dung của bạn trên trang web của bạn và cả trên Phương tiện không? Hoặc, có thể sau khi khách đăng bài, bạn cũng đặt một phiên bản của bài đăng blog trên trang web của mình.
Để làm như vậy, bạn nên tham chiếu phiên bản gốc làm URL chuẩn. URL chuẩn có thể tham chiếu đến các miền khác nhau – nghĩa là URL chuẩn có thể nằm trên một trang web khác.
Ngay cả khi bạn không chủ động tạo các trang trùng lặp để quảng cáo trên nhiều kênh, sự trùng lặp vẫn xảy ra tự nhiên do các phần khác nhau của địa chỉ web. Trang web của bạn có sử dụng giao thức an toàn, như HTTPS không? Sau đó, bạn có thể có phiên bản HTTP và HTTPS của trang web của mình.
Tương tự với www so với non-www. Trang web của bạn có sử dụng dấu gạch chéo sau hay không? Nếu trang web của bạn không phải lúc nào cũng chuyển hướng đến phiên bản ưa thích của trang (bảo mật hay không, có www hay không và có dấu gạch chéo hay không), thì có thể xảy ra trùng lặp.
Ngay cả khi bạn đang buộc phiên bản ưa thích thông qua chuyển hướng, các tham số truy vấn được sử dụng để theo dõi lượt truy cập hoặc lọc lượt xem trên một trang cũng có thể trông giống như các URL riêng biệt cho trình thu thập thông tin. Việc khai báo một URL chuẩn cho biết trình thu thập thông tin web bỏ qua các tham số truy vấn hoặc các phiên bản khác của URL.
URL Canonical là gì?
Phần tử <link> tài nguyên bên ngoài xác định mối quan hệ giữa trang hiện tại và các tài nguyên khác. Thuộc tính “rel” được sử dụng trên thẻ <link> để chỉ ra loại mối quan hệ. Một số loại liên kết phổ biến bao gồm “trước” và “tiếp theo” để phân trang, “biểu định kiểu” và tất nhiên, “chuẩn”.
Thẻ <link> sử dụng thuộc tính href để đặt URL đóng vai trò là trang chuẩn cho trang đang hoạt động. Mặc dù đây là các liên kết tài nguyên bên ngoài, nhưng URL chuẩn có thể là “tự giới thiệu”, có nghĩa là nó là phiên bản chính xác của trang hiện tại. Sử dụng tiêu chuẩn tự giới thiệu giúp giảm việc thu thập thông tin không cần thiết của các phiên bản không được ưu tiên trên trang của bạn, miễn là bạn luôn sử dụng URL tuyệt đối làm giá trị href.
Trong Google Search Console, bạn có thể sử dụng công cụ Kiểm tra URL để hiểu những gì Google coi là URL chuẩn, ngay cả khi bạn chưa đặt URL. Ngay cả khi bạn đã khai báo một URL chuẩn, Google đôi khi vẫn chọn một URL khác, được liệt kê là “URL chuẩn do Google chọn”. Do đó, việc chuẩn hóa không đảm bảo rằng Google sẽ chọn phiên bản ưa thích của bạn hoặc các phiên bản khác sẽ không được lập chỉ mục.
Tại sao cần sử dụng Canonical tag
Sử dụng Canonical tag là cần thiết trong các trường hợp có nhiều trang web có nội dung tương tự hoặc trùng lặp, bởi vì các công cụ tìm kiếm sử dụng các thuật toán phức tạp để xác định trang web nào là bản gốc và trang web nào là bản sao. Nếu không có Canonical tag, các công cụ tìm kiếm có thể xếp hạng các bản sao của trang web của bạn thay vì trang web gốc, điều này có thể làm giảm tính đáng tin cậy của trang web và làm giảm lưu lượng truy cập từ người dùng tìm kiếm.
Bên cạnh đó, Canonical tag còn giúp cho các công cụ tìm kiếm hiểu rõ hơn về cấu trúc và tổ chức của trang web của bạn, từ đó giúp tăng cường tính tương thích của trang web với các chuẩn SEO và cải thiện đánh giá của công cụ tìm kiếm về trang web của bạn.
Một số trường hợp cụ thể mà cần sử dụng Canonical tag bao gồm:
- Trang web có nhiều URL khác nhau để truy cập đến cùng một nội dung.
- Trang web sử dụng các thẻ phân trang (paging tags) để phân chia nội dung thành các trang con khác nhau.
- Trang web sử dụng các phiên bản khác nhau của ngôn ngữ hoặc khu vực để hiển thị nội dung cho người dùng trên các địa điểm khác nhau.
Xem thêm Heading tag trong bài viết
Nên sử dụng Canonical tag thế nào
Để sử dụng Canonical tag đúng cách, bạn có thể làm theo các bước sau:
- Xác định trang web gốc (original): Trước tiên, bạn cần xác định trang web gốc của nội dung mà bạn muốn chỉ định. Trang web gốc là trang web chứa nội dung đầy đủ và chính thức của bạn.
- Tìm các trang web sao (duplicate): Tiếp theo, bạn cần xác định các trang web sao (duplicate) có nội dung giống hoặc trùng lặp với trang web gốc của bạn.
- Thêm Canonical tag vào các trang sao: Sau khi xác định được các trang web sao, bạn cần thêm Canonical tag vào phần tiêu đề (header) của các trang sao đó. Trong thẻ head của trang, bạn thêm thẻ link với thuộc tính rel=”canonical” và giá trị của thuộc tính href sẽ là URL của trang gốc của nội dung.
Ví dụ:
<head>
<link rel="canonical" href="https://example.com/trang-goc" />
</head>
- Xác nhận việc thêm Canonical tag: Cuối cùng, bạn cần xác nhận việc thêm Canonical tag bằng cách sử dụng công cụ Google Search Console để kiểm tra các trang web của bạn có Canonical tag được đính kèm đúng cách hay không.
Lưu ý rằng Canonical tag không giải quyết tất cả các vấn đề về nội dung trùng lặp và chỉ định được cho các trường hợp đặc biệt. Vì vậy, bạn cần phải sử dụng Canonical tag cẩn thận và kết hợp với các kỹ thuật SEO khác để tối ưu hóa hiệu quả của trang web của mình trong việc xếp hạng trên công cụ tìm kiếm.
Xem thêm Title tag trong seo
Cơ chế hoạt động của Canonical tag
Canonical tag là một thẻ HTML được thêm vào phần header của một trang web để chỉ định trang web gốc của một nội dung. Cơ chế hoạt động của Canonical tag như sau:
- Các công cụ tìm kiếm nhận diện Canonical tag: Các công cụ tìm kiếm sẽ đọc và nhận diện Canonical tag trên một trang web.
- Các công cụ tìm kiếm đọc giá trị của thuộc tính href: Các công cụ tìm kiếm sẽ đọc giá trị của thuộc tính href trong thẻ link của Canonical tag để xác định trang web gốc mà Canonical tag đang chỉ định.
- Các công cụ tìm kiếm chỉ định trang web gốc: Nếu các trang web có nội dung giống hoặc trùng lặp nhau được chỉ định bởi Canonical tag, các công cụ tìm kiếm sẽ xếp hạng và chỉ định trang web gốc của nội dung đó là trang web quan trọng nhất, có giá trị cao nhất và phù hợp nhất để xếp hạng.
- Các công cụ tìm kiếm loại bỏ các trang web trùng lặp: Các công cụ tìm kiếm sẽ loại bỏ các trang web sao hoặc trùng lặp không được chỉ định là trang web gốc của nội dung. Việc này giúp tránh sự lặp lại của nội dung trên các trang web khác nhau và giúp tăng tính đáng tin cậy và chất lượng của trang web.
Tóm lại, Canonical tag được sử dụng để chỉ định trang web gốc của một nội dung và giúp các công cụ tìm kiếm hiểu rõ hơn về cấu trúc và tổ chức của trang web. Khi các trang web có nội dung giống hoặc trùng lặp được chỉ định bởi Canonical tag, các công cụ tìm kiếm sẽ chỉ định trang web gốc là trang web quan trọng nhất và loại bỏ các trang web sao hoặc trùng lặp.
Cách thêm Canonical tag
Xem thêm SEO URL là gì ?
Thêm Canonical trong tài liệu HTML
Như đã đề cập, bạn có thể sử dụng phần tử <link> để đặt URL chuẩn của mình. Các phần tử liên kết là các thẻ tự đóng. Thuộc tính “rel” và “href” là bắt buộc.
Để thêm liên kết chuẩn vào tài liệu HTML, hãy thêm phần tử <link> trong phần tử <head>. Đảm bảo giá trị thuộc tính “rel” được đặt thành “chuẩn”. Hãy nhớ đặt URL tuyệt đối của địa chỉ web ưa thích của bạn làm giá trị của thuộc tính href.
<head>
<link rel=”canonical” href=”https://seodichvu.com/canonical-url”>
</head>
Thêm Canonical trong WordPress
Các plugin SEO WordPress phổ biến, bao gồm Yoast và RankMath, đơn giản hóa việc thiết lập các URL chuẩn, đặc biệt là cho một số trang. Nếu bạn nâng cao hơn một chút và không muốn thêm một plugin khác, bạn cũng có thể cập nhật URL chuẩn bằng WordPress Hooks.
Sử dụng get_canonical_url.
Một bộ lọc WordPress hook cho phép bạn sửa đổi dữ liệu khi WordPress đang thực thi. Hàm add_filter () chấp nhận ít nhất hai tham số, một thẻ và một hàm gọi lại. Thẻ sẽ là hook, trong trường hợp này là get_canonical_url.
Tham số hàm gọi lại sẽ là tên của một hàm bạn tạo trả về URL chuẩn. Hàm gọi lại có thể sử dụng các câu lệnh điều kiện để khớp với các bài viết cụ thể. Tham khảo ví dụ câu trả lời Stack Exchange này.
Trong ví dụ, hàm gọi lại “wpse_302620_canonical_url” sử dụng câu lệnh if để trả về một trang chuẩn mới khi ID bài đăng, được chuyển dưới dạng đối số trên hàm, khớp với một bài đăng cụ thể. Với suy nghĩ đó, giải pháp này có vẻ giống như một bản sửa lỗi cho một số bài đăng hoặc loại bài đăng nhưng có thể không mở rộng quy mô tốt. Để áp dụng cho một số trang, sử dụng một plugin có lẽ sẽ là lựa chọn tốt nhất.
Xem thêm Tối ưu cấu trúc Website
Sử dụng Plugin Yoast.
Nếu bạn đang sử dụng Yoast, bạn có thể áp dụng các URL chuẩn cho các bài đăng, trang và phân loại. Chọn loại nội dung bạn muốn chỉnh sửa từ menu bên trái, sau đó “chỉnh sửa” từng phần nội dung. Trong hộp meta Yoast SEO, chuyển đổi phần “Nâng cao”. Thêm địa chỉ web ưa thích của bạn vào trường “URL chuẩn” và lưu. Tìm hiểu thêm về cài đặt URL chuẩn của Yoast.
Sử dụng Plugin Rankmath
Trong khi chỉnh sửa trang hoặc bài đăng cụ thể của bạn, hãy chọn tab “Nâng cao” trên Xếp hạng Toán học. Thêm địa chỉ web ưa thích của bạn vào trường “URL chuẩn” và lưu. Tìm hiểu thêm về cách đặt URL chuẩn trong Xếp hạng Toán học.
Xem thêm: Nghiên cứu từ khóa