xác thực google maps

Cách khắc phục lỗi 404 No found, đã redirect 301?

Thảo luận trong 'Hỏi đáp - Trợ giúp SEO' bắt đầu bởi lanphonghy, 10 Tháng bảy 2014.

Lượt xem: 13,094

  1. hoaphattrongtin

    hoaphattrongtin Banned

    Bài viết:
    9
    Đã được thích:
    0
    bài này hay hữu dụng cho mình cám ơn bạn
     
  2. visionnguyen

    visionnguyen Dự bị

    Bài viết:
    45
    Đã được thích:
    51
    Chào bạn @lanphonghy , nhìn file robots.txt của bạn thì thấy bạn đã rất cố gắng để giải quyết vấn đề này.
    Có vẻ web bên bạn tự code bằng asp và không kinh nghiệm trong url rewrite nên mới gặp tình huống như vậy. Ngay cả hiện tại đường dẫn các trang tiếng anh vấn còn xử lý rất lúng túng.

    Bạn cần thực hiện theo hướng dẫn sau để fix hết lỗi này; ví dụ link: http://anhungpharma.vn/co-xuong-khop-96---en/ , theo đường dẫn trên thì biết đó là trang en(tiếng anh) có id là 96
    Có 2 trường hợp cần giải quyết
    1. Nếu trang en id 96 còn tồn tại trong hệ thống; và bây giờ tên trang đã chuyển thành : "tên trang chín sau" ; thì bạn cần code redirect 301 link trên về trang http://anhungpharma.vn/ten-trang-chin-sau-96-en/

    2. Nếu trang này không còn tên hệ thống thì trả về trang 404 như cách bạn đang làm, và dùng GWT Remove URL Tool để xóa Url trên.

    Tiếp theo bạn bỏ toàn bộ các dòng Disallow bên dưới dòng /admincp/ vì không cần thiết; bạn dùng nó không đúng mục đích, Disallow có ý là không cho phép vào 1 link đang tồn tại, thế thôi, nó không có ý là xóa link.

    Ví dụ như trang của mình link: http://huemuaban.com/lumia-520-tin42820.html có id là tin42820 bây giờ dù người dùng có đổi tiêu đề tin thành http://huemuaban.com/lumia-520xyzabc-tin42820.html gì đi nữa, khi click vào nó cũng redirect về link ban đầu, vì vậy sẽ không bị lỗi 404 như trang của bạn đang gặp

    Hy vọng giúp được bạn.


    rrtOoaH.png
     
    lanphonghy thích bài này.
  3. ngocbds

    ngocbds Thành viên tích cực

    Bài viết:
    380
    Đã được thích:
    46
    Web mình dùng WP bác hướng dẫn cụ thể giúp mình nhé
     
  4. trytrymmo

    trytrymmo Thành viên

    Bài viết:
    97
    Đã được thích:
    13
    Của mình thì đổi url trong site, nên có gần 200 link bị lổi 404 đã đánh dấu là đã khắc phục nhưng vài ngày nó vẫn vậy nữa. và hiện tại mình đang gỡ các link 404 trên site của minh
     
    lanphonghy thích bài này.
  5. mrstarnguyen

    mrstarnguyen Thành viên tích cực

    Bài viết:
    390
    Đã được thích:
    330
    bên trên @visionnguyen đã hướng dẫn chuẩn, ở đây mình có video nếu cần @lanphonghy có thể xem.

    Khi bạn xóa trên web và direct 301 thì nó chỉ có tác dụng với người dùng, còn BOT thì nó vẫn Crawl lại link lỗi, lý do , link đó đã được lập chỉ mục trong DATA của Google rồi.
    Để giải quyết với số lượng nhỏ thì hãy dùng tính năng remove trong WMT ( visionnguyen đã nói).
    Với số lượng hàng trăm thì dùng Robots.txt (xem video để biết cách làm nhanh)





    *Theo tài liệu GG thì nhưng liên kết dc Disallow quá 90 ngày , sẽ tự động bị xóa khỏi chỉ mục GG, khi đó nó sẽ không báo lại lỗi, xem như link đó chưa từng tồn tại.
    Nhưng theo thực tế mình áp dụng, sau cả nửa năm, mình xóa thử Disallow thì ít ngày GG lại báo lại 404.
    Nên tốt nhất diết nhầm hơn bỏ xót, cứ để nó Disallow trong robots.txt , không cần xóa. Hơi xấu file robots.txt tí :)
     
    lanphonghy and visionnguyen like this.
  6. visionnguyen

    visionnguyen Dự bị

    Bài viết:
    45
    Đã được thích:
    51
    Cảm ơn bạn @mrstarnguyen đã có clip rất chi tiết hướng dẫn Disallow số lượng lớn url bằng robots.txt.

    Mình thấy trong forum cũng có nhiều người hỏi về lỗi 404, có bạn dính tới cả 1000 lỗi. Như vậy vấn đề mình thắc mắc là nguồn gốc nó từ đâu ra? Theo mình các lý do có thể xảy ra lỗi này như sau:
    1. Bài viết bị xóa: vd: trang web công ty, trang báo, một bài tin tức bị xóa; trang rao vặt, hay diễn đàn, người dùng xóa bài viết của mình.
    2. Tiêu đề bài viết thay đổi: ví dụ bài báo, hay trang rao vặt nào đó thay đổi tiêu đề bán lumia 520 thành bán nhanh lumia 520 giá rẻ ... lúc đó đường dẫn cũng thay đổi theo sinh ra lỗi 404
    3. Đổi tên chuyên mục: ví dụ chuyên mục thời trang đổi tên thanh thời trang teen ...
    4. Đổi định dạng url: nhiều trường hợp vì bị lỗi hoặc lý do tối ưu, chủ site thay đổi định dạng url, ví dụ: index.php?category=1 thay thành chuyen-muc-dien-thoai.html rồi đổi thành chuyen-muc/dien-thoai.html ...
    5. Sai đường dẫn: đặt sai đường dẫn tuyệt đối hoặc tương đối cũng sinh ra lỗi này.
    6. Xóa tài nguyên: cho dù là file .html; file flash .swf file pdf ... nếu bạn đã từng liên kết tới chúng và xóa đi cũng dẫn đến lỗi 404
    Theo như các lý do trên, các bạn sẽ thấy một số ít lỗi đến từ mục 5&6; còn lại phần lớn lỗi đến từ mục 1,2,3 và 4. Như bạn chủ topic @lanphonghy có thể đụng vào mục 2,3&4.

    Theo mình nếu redirect 301 đúng, thì sẽ không còn bị lỗi 404 nữa, các bạn xem hình bên dưới sẽ thấy thông báo của Googlebot, vì vậy các bạn nên cố gắng redirect 301 hết sức nếu có thể, không nên lạm dụng Disallow để giải quyết nếu mình còn có thể redirect 301 đến nội dung mới thay thế.

    Theo ý mình các bạn nên xử lý như sau:

    Tình huống 1: không trả về trang 404, mà trả về trang bài viết sản phẩm bình thường với nội dung là "Bài viết hoặc sản phẩm đã xóa hoặc không cung cấp" thay vì trang 404 là bài viết không tồn tại. Khi code cũng ko cần xóa dữ liệu khỏi database mà chỉ cần gắn cờ là đã xóa thôi. Dữ liệu người dùng rất quan trọng, đừng xóa một cái gì cả.
    Tình huống 2: dùng code để redirect 301 đến đường dẫn mới nhất của bài viết
    Tình huống 3 : dùng .htaccess (đối với php) và urlrewrite (đối với ASP) để chuyển hướng 301 đến url mới
    Tình huống 4: có thể dùng code hoặc .htaccess, tùy nếu cái nào tiện hơn
    Tình huống 5&6: các bạn tự xử nhé. :)

    Nói chung ý mình là muốn xử lý theo hướng tự nhiên của nó: nếu 1 link không tồn tại: tức là mình chưa từng tạo ra nó thì trả về 404, nếu đã từng tồn tại và bị xóa thì cứ nói là đã xóa (mã trả về là OK 200) , còn nếu có thay đổi thì mình redirect tới cái mới.

    Hi vọng ý kiến của mình giúp ích được các bạn.


    TfaDb8n.png
     
    lanphonghy and mrstarnguyen like this.
  7. lanphonghy

    lanphonghy Dự bị

    Bài viết:
    39
    Đã được thích:
    2
    @mrstarnguyen Theo như bạn nói thì sau 90 ngày Goole sẽ cập nhật data và không thông báo lỗi nữa phải không bạn.
     
  8. mrstarnguyen

    mrstarnguyen Thành viên tích cực

    Bài viết:
    390
    Đã được thích:
    330
    @lanphonghy
    ví dụ: tôi có link là abc.com/xyz.html -> bị lỗi 404
    Ngày 17/07/2014 BOT google vào crawl link này và nó gặp lỗi 404, đây là lần đầu tiên.
    Mai 18/07/2014 tôi vào WMT tôi thấy báo lỗi, tôi copy link trên chặn trong ROBOTS.TXT
    Thì sau đó BOT nó vẫn vào crawl lại link này , thời gian thì tùy .
    Nhưng từ 18/10/2014 trở đi BOT có quay lại crawl link trên và tiếp tục gặp lỗi 404 thì nó sẽ coi như link này đã hoàn toàn chết thật. và sẽ remove tất cả thông tin liên quan link này khỏi DATA chỉ mục của Google.
     
    lanphonghy thích bài này.
  9. hoangtrihieu

    hoangtrihieu Thành viên nhiệt tình

    Bài viết:
    626
    Đã được thích:
    85
    bạn ơi website mình dùng wordpress và cũng bị nhiều lỗi này, bạn có cách nào xử lý giúp mình mới :'(
     

Chia sẻ trang này