Chào anh em. Vừa rồi mình audit lại website thì phát hiện kha khá một cơ số link 404 do mấy anh nước ngoài spam vào. Những link này có đặc điểm sau:Không có thật nhưng có traffic.99,99% không index (nhưng vẫn có link được index) Hiện tại theo mình biết, đang có 04 luồng quan điểm về vấn đề xử lí link 404 để có kết quả tốt nhất cho SEO như sau:Redirect 301 thẳng về trang chủRedirect 302 thẳng về trang chủRedirect 301 thẳng về trang dạng https://domain.com/404.html sau đó redirect về trang chủ (302 hoặc 301)Hiển thị nội dung giao diện trang lỗi 404 nhưng canonical link trang chủ, sau 5-10s redirect về trang chủ(302 hoặc 301)Mình thấy chủ đề khá thú vị. Mời anh em vào thảo luận chia sẻ quan điểm của mình về việc này. Trong 04 cách trên, thì cách xử lí nào có lợi nhất cho SEO?(Không xét trường hợp Link đã được index, lên top, có traffic - chắc chắn sử dụng cách 1 Redirect về 01 link khác) Hoặc theo kinh nghiệm làm SEO của anh em, thì có cách nào tối ưu hơn cả 4 cách trên?
Chắc site của bác bị boost Google Analytics rồi. Tầm vài năm trước có rất nhiều site hay đi spam kiểu này như:Mã:free-share-buttons.com www.get-free-traffic-now.com ...Mình đã xử lý khá nhiều case 404 này, cách xử lý mình ưu tiên nhất là redirect 301 về trang sitemap dạng html. Vì một số lý do:Nếu để nhiều 404 cũng không tốt cho site, dễ ăn gậy.Set 404 hoặc redirect về 404 cũng giống như trường hợp trên.Redirect 302 về url khác => GSC sẽ báo lỗi Redirect error.Sử dụng link canonical thì sẽ có 1 hạn chế rất lớn là : mặc dù mình set canonical nhưng việc chọn url nào là canonical là của Google.Vậy tại sao mình không redirect 301 về trang chủ mà redirect 301 về trang sitemap dạng html? Vì trong sitemap dạng html mình sẽ ưu tiên các url quan trọng và các url mới được cập nhật => Google sẽ "hiểu" hơn về cấu trúc site và khám phá các url mới dễ hơn.
Trường hợp này nếu trên trang của anh chưa có / chưa từng có cũng như không có liên kết nào trỏ nội bộ tới những URL này thì có thể bỏ qua anh ạ. (thường sẽ trả về trang 404 http:404) Có sửa thì sửa những URL có tồn tại được đặt trỏ đi chủ động trên trang. Hạn chế tối đa việc cố gắng can thiệp 3xx tới URL không liên quan. VD như trang chủ hoặc cố gắng tạo page liên quan để chuyển tới. (Google cũng có khuyến cáo việc này. Khi có chuyển hướng hợp lệ Google sẽ khó xác định cấu trúc trang và xử lý thông báo lỗi 404 tự động ) . URL được index thì thường là có cache. Kiểm tra tếu là nội dung không phải do chủ site đăng tải thì ... Còn nếu là nội dung đăng tải thì có thể là URL nội bộ.
Mình làm mục số 4 với site bán hàng: thông tin lỗi ở mục tìm kiếm. Còn WP thì chuyển về trang chủ theo cơ chế của Yoast, site code tay thì nhờ Code chuyển về trang liên hệ + báo lỗi không tìm thấy!