xác thực google maps

Cách loại bỏ những nội dung bị trùng lặp trên website?

Thảo luận trong 'Thảo luận SEO' bắt đầu bởi Mr_Pi, 15 Tháng hai 2016.

Lượt xem: 6,567

  1. Mr_Pi

    Mr_Pi Thành viên nhiệt tình

    Bài viết:
    599
    Đã được thích:
    89
    I. Trùng lặp nội dung là gì?
    1. Trùng lặp nội dung trên trang

    Trùng lặp nội dung trên trang là hiện tượng trên cùng một trang web có nhiều hơn 1 webpage (URL khác nhau) nhưng có nội dung text giống nhau hoàn toàn hoặc số cụm từ và nội dung text giống nhau trên 40%.
    2. Nguyên nhân:
    Nguyên nhân của vấn đê này có thể là do lỗi cấu trúc web hoặc cấu trúc URL thường do lỗi chủ quan của code (người lập trình trang web), hoặc do sao chép nội dung bài viết trong mục này sang mục khác trong website.
    VD:
    www[.]idichvuseo[.]com
    www[.]idichvuseo[.]com/index.html
    www[.]idichvuseo[.]com/index.php
    http://[.]idichvuseo[.]com​

    Ba trang trên có đường dẫn url hoàn toàn khác nhau nhưng có nội dung trình bay hoàn toàn giống nhau về cầu trúc và nội dung text trên web.

    [​IMG]

    Giải quyết vấn đề này

    Dạng đường dấn có www. hoặc dạng http://
    Để giải quyết vấn đề này bạn nên quyết định dùng dạng http:// hoặc http:// bằng cách sử dụng .htaccess
    Nếu bạn muốn sử dụng dạng www.domain.com thì nên dùng đoạn mã sau
    options +Followsymlinks
    Rewriteengine on
    Rewritecond %%{http_host} ^domain.com$ [NC]
    Rewriterule ^(.*)$ http://www.docmain.com [R=301,L]
    Nếu bạn muốn đung dạng http://domain.com thì nến sử dụng đoạn mã
    Options+
    Rewriteengine 0n
    rewritecond %{HTTP_HOST} !^domian\>com[NC]
    rewriterule ^(.*)$ http://domain.com/[R=301.L]​

    Trong cả hai trường hợp bạn nên thay domain.com tên website của bạn
    trùng lặp nội dung
    A. Vần đề URL trùng nhau do lỗi kỹ thuật ví dụ domaim/san-pham.html và domain.sản-phẩm.html hoặc cập nhật nội dung
    Để giải quyết vấn đề này bạn phải biết rõ về code và thống nhất sử dụng một loại đường dẫn duy nhất.
    B. Vấn đề cùng một nội dung khác nhau nhưng trình bày trong nhiều nhóm khác nhau
    VD: sản phẩm AAAAAAAAAAA bạn cho xuất hiện ở nhiều danh mục sản phẩm khác nha
    domain/san-pham/111111111/AAAAAAAAAA
    domain/san-pham/222222222/AAAAAAAAAA
    domain/san-pham/333333333/AAAAAAAAAA

    a. Sử dụng thẻ rel="cannonical"
    Để giải quyết vấn đề này bạn nên dùng thẻ rel="cannonical" để phân biêt url chính để không phải canh tranh với các bản sao của minh nhờ đó search engine có thể dễ dàng loại bỏ việc đánh chỉ mục các trang trùng lặp

    b. dùng robot.txt
    Bạn nên sử dụng file robot.txt để thông báo với rearch engine không index nhưng trang có nọi dung được sao chép từ trang khác.

    c. Sử dụng google URL Removal
    Bạn vào google mastertool chọn mục URL removal để loại bỏ những trang copy nội dung từ những trang khác để để google không index những trang này.

    II. Trung lặp ngoài trang
    Trùng lặp ngoài trang là hiện tượng có một trang web thứ hai ngoài trang web của bạn có nội dung text hoàn toàn giống nhau hoặc giống nhau một phần
    1. Nguyên nhân:
    Do việc copy nội dung bài viết từ web khác hoặc web khác copy nội dung từ web bạn
    Nhiều web khác nhau cùng giới thiệu về một loại sản phầm của cùng một nhà sản xuất(VD: web bạn giới thiệu một loại sản phẩm mà nhà sản xuất cung cấp các thông số sản phẩm và chi tiết sản phẩm đó cho nhiều web bán hàng online khác ngoài web của bạn)
    2. Khắc phục:
    - Tuyệt đối không copy nội dung ở bất kỳ website nào khác hãy cố gắng xuất bản những nội dung của riêng bạn
    - Sử dụng thẻ rel="cannonical" đểcác rearch engine biết trang gốc mà bạn đã copy nội dung
    - Dùng robot.txt để ngăn không cho google index những trang mà bạn copy nội dung từ những trang
    - Sử dụng URL removal
    Để tránh việc trùng lặp nội dung ngoài trang các bạn cố gắng đừng copy nội dung từ bất kỳ web nào khác
     
    ViaTrần thích bài này.
  2. Ganoipho6

    Ganoipho6 ⚡| Moderator Staff Member

    Bài viết:
    1,492
    Đã được thích:
    946
    Chưa thử của bác nhưng mình thường dùng Xenu check rồi chuyển hướng hoặc xóa URL luôn.
    Trang mình cũng không nhiều bài nên nội dung trùng lặp thì gần như ko có.

    00020422.gif
     
  3. bravolawit

    bravolawit Dự bị

    Bài viết:
    5
    Đã được thích:
    0
    giờ coppy nội dung có chỉnh sửa hết rồi. rất ít người tự sản xuất ra nội dung lắm
     
  4. Mr_Pi

    Mr_Pi Thành viên nhiệt tình

    Bài viết:
    599
    Đã được thích:
    89
    Chỉnh sửa bài viết có sẵn cũng là một quá trình, phải đảm bảo các tiêu chuẩn cần thiết để không bị Google đánh giá lỗi sao chép.
     
  5. chaawy

    chaawy Dự bị

    Bài viết:
    14
    Đã được thích:
    0
    sử dụng thẻ cannical kiểu gì vậy thớt @@ đặt thẻ này ở vị trí nào trên site vậy
     
  6. maynuocnong

    maynuocnong Thành viên

    Bài viết:
    153
    Đã được thích:
    28
    dùng thẻ cannical ở đâu thì mới đúng vậy mấy bác??? Cái này hơi khó hiểu
     
  7. hongkhanh

    hongkhanh Thành viên

    Bài viết:
    298
    Đã được thích:
    95
    htaccess mục đích chính là dùng để di chuyển hoặc định dạng URL cho 1 trang nào đó. Để tránh việc trùng lặp nội dung mình nghĩ dùng thẻ canonical là cách tối ưu nhất.
     
  8. npthanh

    npthanh Thành viên nhiệt tình

    Bài viết:
    785
    Đã được thích:
    299
    Canonical là một thẻ HTML
    Cấu trúc của nó như sau: <link rel="canonical" href="URL Gốc">
    Ví dụ bạn có một page (URL) copy nội dung từ đâu đó và không muốn được GG index thì ngoài những cách như dùng robots.txt , htaccess thì có thể đặt thẻ canonical trên URL có nội dung copy đó. Thẻ này sẽ giúp GG bot hiểu rằng: "Tao copy nội dung từ bài này (URL Gốc), đừng có index cái URL copy này."
     
  9. Tuyenkim

    Tuyenkim Thành viên

    Bài viết:
    61
    Đã được thích:
    4
    Bác nào có công cụ nào check trùng lặp nội dụng không cho em xin với a
     
  10. Mr_Pi

    Mr_Pi Thành viên nhiệt tình

    Bài viết:
    599
    Đã được thích:
    89
    Các bạn cứ làm theo hướng dẫn trên là đảm bảo Ok đáy, mình đã thử và thành công.
     

Chia sẻ trang này