Trong nhiều năm, các chuyên gia SEO đã cảnh báo về nội dung trùng lặp.
Các cụm từ như “Chỉ cần không làm điều đó”, “Đảm bảo nội dung của mỗi trang là duy nhất”, “Bạn không muốn bị phạt vì nội dung trùng lặp” đã được nghe trên khắp thế giới.
Các bài viết liên quan:
Nội dung trùng lặp là gì?
Theo Moz, “Nội dung trùng lặp là nội dung xuất hiện trên Internet ở nhiều nơi (URL).” Trên thực tế, câu trước là nội dung trùng lặp về mặt kỹ thuật; tuy nhiên, tôi đã công nhận nó một cách thích đáng, vì vậy chúng ta sẽ ổn.
Đây là vấn đề về nội dung trùng lặp: đôi khi điều đó là không thể tránh khỏi. Ví dụ: một trang web sẽ không có nhiều bản sao khác nhau của các trang điều khoản và điều kiện và thậm chí một trang thân thiện với máy in của một trang web về mặt kỹ thuật có thể bị coi là nội dung trùng lặp. Và những gì về các trang web tin tức và các trang web dành riêng để xuất bản nội dung của những người khác? Nội dung đó cũng có thể được gọi là nội dung trùng lặp.
Vậy các trang web phải làm gì về nội dung đó? Hãy cùng xem một video gần đây của Matt Cutts, người đứng đầu webspam tại Google AKA The Google Webmaster:
Đây là những gì nổi bật nhất:
- Nội dung trùng lặp luôn xảy ra trên web, nhưng đó không phải là tất cả spam và Google không nhìn thấy nó theo cách đó
- Nội dung trùng lặp không thực sự được coi là thư rác; nó được coi như một thứ cần được xem xét và xếp hạng một cách thích hợp
- Nếu bạn không làm gì ngoài nội dung spam và thao túng, trùng lặp, Google có quyền phạt trang web của bạn
Đạo đức của câu chuyện: viết nội dung cho người dùng của bạn, không phải công cụ tìm kiếm và tránh nội dung spam, nhồi nhét từ khóa.
Duplicate content trong SEO là nội dung giống hoặc trùng lặp trên nhiều trang web khác nhau hoặc trên cùng một trang web. Vấn đề của duplicate content đó là nó có thể làm giảm chất lượng trang web của bạn và làm giảm thứ hạng của trang web trên các kết quả tìm kiếm.
Các bài viết liên quan:
Đối với các công cụ tìm kiếm, duplicate content có thể làm cho nó khó khăn để xác định trang web nào là nội dung chính thức và trang web nào là bản sao. Nếu nhiều trang web có nội dung giống nhau, các công cụ tìm kiếm sẽ không thể đưa ra quyết định chính xác về trang web nào nên xếp hạng cao nhất trong kết quả tìm kiếm. Điều này có thể dẫn đến một số vấn đề như giảm lưu lượng truy cập, giảm hiệu quả SEO và thậm chí là phạt từ các công cụ tìm kiếm.
Vì vậy, để tránh duplicate content, bạn có thể áp dụng một số phương pháp sau đây:
- Viết nội dung chất lượng và độc đáo.
- Sử dụng tag Canonical để chỉ định trang web nào là trang chính thức.
- Sử dụng robots.txt để chặn các trang web bản sao.
- Tránh sao chép nội dung từ trang web khác.
- Sử dụng biến thể khác nhau của nội dung cho các trang web khác nhau.
- Sử dụng các công cụ để kiểm tra duplicate content, ví dụ như Copyscape hoặc Siteliner.
Tuy nhiên, nếu bạn đã mắc phải lỗi duplicate content, bạn nên sớm giải quyết vấn đề này bằng cách chỉnh sửa nội dung hoặc loại bỏ các trang web bản sao khỏi trang web của mình.
Tác hại của duplication content
Duplicate content có thể gây ra nhiều tác hại đến hiệu quả SEO và chất lượng trang web của bạn. Dưới đây là một số tác hại của duplicate content:
- Giảm chất lượng trang web: Khi nội dung bị sao chép hoặc trùng lặp, nó làm cho trang web của bạn trở nên ít hấp dẫn đối với người dùng và cũng làm giảm độ tin cậy của trang web. Người dùng sẽ không thấy có lợi gì khi đến trang web của bạn nếu nội dung bị sao chép hoặc trùng lặp.
- Giảm lưu lượng truy cập: Duplicate content có thể làm giảm lưu lượng truy cập trang web của bạn vì các công cụ tìm kiếm sẽ không xếp hạng trang web của bạn cao hơn các trang web khác có nội dung chính xác hơn. Khi đó, người dùng sẽ khó tìm thấy trang web của bạn trong kết quả tìm kiếm.
- Phạt từ các công cụ tìm kiếm: Các công cụ tìm kiếm có thể phạt trang web của bạn nếu phát hiện nội dung trùng lặp trên trang web của bạn. Nếu trang web của bạn bị phạt, thì nó có thể ảnh hưởng đến thứ hạng của trang web và dẫn đến mất điều kiện tham gia vào các chương trình quảng cáo của các công cụ tìm kiếm.
- Mất tiềm năng đối tượng khách hàng: Nếu người dùng tìm kiếm thông tin trên các công cụ tìm kiếm và thấy nhiều trang web có nội dung giống nhau, họ có thể nghi ngờ về tính độc đáo và độ tin cậy của trang web của bạn. Điều này có thể khiến họ không muốn quay lại trang web của bạn trong tương lai.
Vì vậy, để tránh tác hại của duplicate content, bạn nên đảm bảo rằng nội dung trên trang web của bạn là duy nhất và độc đáo.
Xem thêm Viết content Fanpage trên Facebook
Các lý do gây nên duplication content
Có nhiều lý do gây ra duplication content, dưới đây là một số nguyên nhân phổ biến:
- Sao chép nội dung từ trang web khác: Đây là nguyên nhân chính dẫn đến duplication content. Khi bạn sao chép hoặc lấy nội dung từ trang web khác mà không thay đổi gì, nội dung trên trang web của bạn sẽ giống với nội dung trên trang web gốc.
- Sử dụng nhiều URL cho cùng một nội dung: Nếu bạn có nhiều URL khác nhau dẫn đến cùng một nội dung, điều này sẽ tạo ra các bản sao của nội dung và gây ra duplication content. Ví dụ, nếu trang web của bạn có thể truy cập bằng cả địa chỉ www.example.com và example.com, thì điều này sẽ tạo ra hai URL khác nhau nhưng cùng nội dung.
- Trang web sử dụng nhiều thẻ tiêu đề: Nếu trang web của bạn có nhiều thẻ tiêu đề cho cùng một nội dung, điều này cũng có thể gây ra duplication content. Thẻ tiêu đề (header tag) giúp định dạng và chỉ định tiêu đề cho trang web, nếu trang web của bạn sử dụng nhiều thẻ tiêu đề cho cùng một nội dung, thì điều này sẽ làm cho các công cụ tìm kiếm khó đánh giá đúng nội dung chính của trang web.
- Sử dụng một nội dung cho nhiều trang web: Khi sử dụng một nội dung cho nhiều trang web khác nhau, điều này cũng có thể gây ra duplication content. Ví dụ, nếu bạn có một trang web bán hàng và sử dụng một mô tả sản phẩm giống nhau cho nhiều sản phẩm khác nhau, điều này sẽ tạo ra các bản sao của nội dung và gây ra duplication content.
- Sử dụng các trang web con của một trang web chính: Nếu bạn sử dụng các trang web con của một trang web chính và chúng có nội dung giống nhau, điều này cũng có thể gây ra duplication content. Ví dụ, nếu bạn có một trang web chính và sử dụng các trang blog trên trang web con, nếu các bài đăng trên các trang blog giống nhau, điều này sẽ tạo ra duplication content.
Xem thêm Content pillar: tối ưu nội dung content pillar
Cách tìm duplicate content
Để tìm và xác định duplicate content trên trang web của bạn, bạn có thể thực hiện các bước sau:
- Sử dụng công cụ tìm kiếm: Bạn có thể sử dụng các công cụ tìm kiếm như Google, Bing để tìm kiếm các đoạn văn bản giống nhau trên trang web của bạn. Để làm điều này, bạn có thể sao chép một đoạn văn bản từ trang web của mình và dán vào công cụ tìm kiếm.
- Sử dụng công cụ phân tích website: Có nhiều công cụ phân tích website có thể giúp bạn phát hiện duplicate content trên trang web của bạn. Ví dụ, công cụ Screaming Frog có tính năng phát hiện các trang web trùng lặp trong trang web của bạn.
- Sử dụng công cụ trực tuyến: Có nhiều công cụ trực tuyến miễn phí có thể giúp bạn phát hiện duplicate content trên trang web của mình. Ví dụ như Copyscape, Plagium, Grammarly,… Bạn chỉ cần sao chép và dán nội dung của trang web của mình vào các công cụ này và chúng sẽ hiển thị các đoạn văn bản giống nhau trên trang web của bạn.
- Kiểm tra trong các bản sao của trang web: Nếu bạn đã tạo ra các bản sao của trang web của mình, hãy kiểm tra nội dung của chúng để xác định xem có bất kỳ duplicate content nào không. Nếu có, bạn cần thay đổi và tối ưu hóa nội dung của các bản sao để tránh bị phạt vì duplicate content.
Sau khi phát hiện được duplicate content trên trang web của bạn, bạn cần phải xóa hoặc thay đổi các đoạn văn bản trùng lặp để tránh bị phạt bởi các công cụ tìm kiếm và đảm bảo rằng trang web của bạn được đánh giá cao trong kết quả tìm kiếm.
Công cụ phát hiện nội dung trùng lặp
Nếu bạn đang tự hỏi làm thế nào để phát hiện nội dung trùng lặp, đây là một số tài nguyên dành cho bạn:
Một trong những cách dễ nhất để phát hiện nội dung trùng lặp là sao chép và dán một đoạn nội dung của bạn vào Google trong dấu ngoặc kép. Nếu kết quả trả về với cùng một nội dung, bạn biết rằng bạn có nội dung trùng lặp.
Trong ví dụ bên dưới, tôi đã lấy một đoạn trích của một bài đăng blog gần đây và dán nó vào tìm kiếm của Google. Như bạn có thể thấy, kết quả là từ blog Mainstreethost và Cộng đồng doanh nghiệp 2, vì vậy nó không phải là loại nội dung trùng lặp có hại.
Công cụ quản trị trang web của Google
Nếu Google xem nội dung trên trang web của bạn là nội dung trùng lặp, bao gồm tiêu đề và mô tả của bạn, họ sẽ thông báo cho bạn trong Công cụ quản trị trang web.
Copyscape và PlagSpotter
Hai trong số nhiều tùy chọn để phát hiện và giám sát nội dung trùng lặp, PlagSpotter và Copyscape cho phép bạn sao chép và dán các URL của trang để kiểm tra nội dung trùng lặp.
Tôi nên làm gì nếu có nội dung trùng lặp trên trang web của mình?
Nếu bạn có nội dung trùng lặp trên trang web của mình hoặc thậm chí nhiều bản sao khác nhau của trang web, thì đây là một số gợi ý để khắc phục tình trạng này:
Chuyển hướng 301
Nếu bạn có nội dung trùng lặp, một cách để khắc phục điều này là thiết lập chuyển hướng 301. Đây là nơi bạn chuyển hướng trang của nội dung trùng lặp đến trang nội dung gốc. Điều này giúp loại bỏ các trang “cạnh tranh” với nhau để xếp hạng, do đó tăng cường thứ hạng của trang gốc và làm cho nó phù hợp hơn với các công cụ tìm kiếm.
Thẻ Rel = ”canonical”
Thẻ rel = ”canonical” rất giống với chuyển hướng 301; tuy nhiên, nó thường mất ít thời gian hơn nhiều để thực hiện. Đây là một ví dụ về thẻ rel = ”canonical” từ Moz:
<link href = ”http://www.example.com/canonical-version-of-page/” rel = ”canonical” />
Bằng cách đặt thẻ meta này vào tiêu đề của trang nội dung trùng lặp, nó yêu cầu các công cụ tìm kiếm coi nó như một bản sao của URL được cung cấp và tất cả “sức mạnh” mà nó có phải được chuyển vào URL đã cho.
noindex, theo dõi Thẻ Meta
Triển khai thẻ meta “noindex, follow” cho các trang không nên hiển thị trong chỉ mục của công cụ tìm kiếm. Các bot của công cụ tìm kiếm sẽ vẫn có thể thu thập thông tin các liên kết trên trang, nhưng nó sẽ không đưa chúng vào chỉ mục.
“Nội dung trùng lặp” được chấp nhận
Nội dung được cung cấp
Cộng đồng Doanh nghiệp 2 là một cộng đồng trực tuyến cung cấp nhiều loại tin tức liên quan đến truyền thông xã hội, tiếp thị, xây dựng thương hiệu và các lĩnh vực khác. B2C lấy nội dung của họ từ các nguồn bao gồm các bài báo gốc cho trang web và các trang blog khác.
Cộng đồng doanh nghiệp 2 – Ví dụ về nội dung được cung cấp thông tin
Ở cuối các bài viết được lấy từ các nguồn khác, B2C liên kết trở lại nội dung ban đầu:
Liên kết Cộng đồng Doanh nghiệp 2 đến Trang web Ban đầu
Vì lý do này, nội dung trên trang này và các trang tương tự khác không được coi là nội dung trùng lặp có hại. Điều này cũng tương tự đối với các trang web tin tức làm nổi bật tin tức nóng hổi và sau đó có hai trong số các bài báo giống nhau trên các trang khác nhau của trang web.
Nội dung trùng lặp sẽ làm tổn hại đến trang web
Nội dung cóp nhặt
Nội dung cóp nhặt là lấy nội dung từ một trang web có uy tín và xuất bản nó như của riêng bạn mà không ghi nhận tác giả / nguồn gốc. Đây là một hành vi phi đạo đức và từ quan điểm người dùng, nó thường dẫn đến trải nghiệm người dùng kém.
Khi tạo nội dung độc đáo, hãy đảm bảo rằng bạn luôn ghi nhớ khách truy cập của mình; cung cấp cho khách truy cập và khán giả mục tiêu của bạn nội dung và thông tin hữu ích và mang tính thông tin, nếu không, việc cung cấp nội dung sẽ chẳng ích lợi gì.
Mô tả Sản phẩm của Nhà sản xuất
Việc sử dụng mô tả sản phẩm do nhà sản xuất cung cấp không chỉ là một ví dụ về nội dung trùng lặp, mà hãy nghĩ về nó: mô tả sản phẩm của nhà sản xuất được phân phối đến nhiều cửa hàng trực tuyến. Trang web của bạn sẽ cạnh tranh với nhà sản xuất và nhiều trang web khác, những người chọn sao chép và dán nội dung được cung cấp trên trang web của họ.
Mặc dù sẽ mất rất nhiều thời gian và công sức nhưng hãy tạo nội dung độc đáo cho từng mô tả sản phẩm. No se đang thôi ma.
Tùy thuộc vào quy mô trang web và khoảng không quảng cáo sản phẩm của bạn, tôi hiểu đây có thể không phải là một cam kết khả thi; tuy nhiên, tôi khuyên bạn nên xem xét việc sử dụng thẻ meta “noindex, follow” trên các trang mà bạn không tạo nội dung độc đáo. Điều này sẽ đảm bảo bạn không bị phạt vì nội dung trùng lặp.
Trường hợp cho unique content
Khi nói đến nó, đặt cược tốt nhất của bạn là tạo nội dung nguyên bản và độc đáo cho trang web và blog của bạn. Mặc dù có một số ngoại lệ đối với quy tắc về nội dung trùng lặp, nhưng ý tưởng chính đằng sau việc tạo nội dung là tạo ra nội dung có thể sử dụng được cho người dùng của bạn. Trải nghiệm người dùng là một yếu tố quan trọng của một trang web và nếu trang web của bạn không xứng tầm trong mắt khách truy cập, họ sẽ tìm đến nơi khác để tìm thông tin mà họ đang tìm kiếm.
Hãy nhớ rằng, có hàng triệu trang web ngoài kia; làm thế nào để bạn thiết lập trang web của bạn khác biệt với đối thủ cạnh tranh của bạn? Bắt đầu với nội dung độc đáo và đặc biệt. Tôi hứa bạn sẽ không thất vọng.