xác thực google maps

Chuyện gì xảy ra khi site của bạn bị leech toàn bộ?

Thảo luận trong 'Thảo luận SEO' bắt đầu bởi aviaiva, 29 Tháng sáu 2018.

Lượt xem: 6,430

  1. aviaiva

    aviaiva Thành viên tích cực

    Bài viết:
    384
    Đã được thích:
    148
    Làm SEO giờ đã vất vả, nhưng các bác buồn bực khó chịu với site top không làm được gì đành chơi trò tiểu xảo khiến người SEO chân chính mệt mỏi. Không biết rồi trong sự nghiệp của mình các bác có khá hơn được lên không?

    Em làm SEO cơ bản, nội dung bình thường tính cạnh tranh không cao, cũng đã chia sẻ với các bác đầy đủ trên diễn đàn cách để làm được điều đó qua bài https://forum.idichvuseo.com/threads/seo-content-is-king-toi-da-lam-the-va-thanh-cong.52276/

    Sau đó em chỉ tập trung vào chuyên môn chỉ viết bài mà không SEO, không đi link nữa, link đổ về rất tự nhiên cho đến hôm nay lượt visit đột ngột giảm ?temp_hash=d94550c7b5f88ddf74917963f4f5e44d.png
    Về cơ bản là tưởng các cháu vừa thi xong nên vui chơi khiến lượt truy cập giảm, nhưng nay rảnh rỗi mới kiểm tra lại và tìm ra một site nó leech luôn trang của em, toàn bộ bài viết, link đổ về như thác có lẽ vì thế mà bị anh G phạt.
    Site của một bác nào đó chơi không đẹp đây
    Mã:
    giainhanh.net
    Chả biết làm gì ngoài disavow liên kết + đóng code RSS của xenforo + viết bài chia sẻ cho đỡ bực.
    P/s: có bác nào siêu code giúp em chặn toàn bộ khả năng leech bài của trang khác?
     

    Các file đính kèm:

    ThangPV.HR thích bài này.
  2. Mr.N2

    Mr.N2 Administrator Staff Member

    Bài viết:
    2,254
    Đã được thích:
    5,112
    Trường hợp của bạn không phải là hiếm chưa từng xảy ra trước đó, vấn đề này nó liên quan đến đạo kinh doanh hay cá nhân của người làm SEO, mà câu chuyện về làn ranh đạo đức này thì hên xui lắm :)

    Sự cố của bạn thì ngay cả IDVS cũng đã từng bị khi post cái gì lên là lập tức có RSS sẽ được leech về bên các site khác. Nếu các site khác đủ mạnh thì Google sẽ index nội dung trên website đó trước website được xuất bản. Mình gọi trường hợp này là ăn cắp content, cướp index của người khác.

    Vấn đề này mình nghĩ khó sẽ xử lý phức tạp, còn đơn giản thì có cách nhẹ nhàng hơn đó là bạn tham khảo chạy thêm Firewall chặn request từ lớp cao nhất chứ không cần phải gỡ RSS ra như vậy sẽ làm mất tính năng của website.

    Bạn quan tâm thì click vào liên kết dưới footer của IDVS sẽ có đơn vị support cho bạn vấn đề này.
     
    ThangPV.HR and aviaiva like this.
  3. VietSeoSol

    VietSeoSol Thành viên thân thiết

    Bài viết:
    1,791
    Đã được thích:
    532
    Bạn tham khảo, test Offline và tùy biến cho phù hợp :
    RewriteCond %{HTTP_REFERER} !^$
    RewriteCond %{HTTP_REFERER} !^https:// vatlypt.*$ [NC]
    RewriteCond %{HTTP_REFERER} !^https:// vatlypt$ [NC]
    RewriteCond %{HTTP_REFERER} !^https:// vatlypt.*$ [NC]
    RewriteCond %{HTTP_REFERER} !^https:// vatlypt$ [NC]
    RewriteRule .*\.(jpg|jpeg|gif|png|bmp|mp3|wma)$ http:// vatlypt/logo.gif [R,NC]
    Rất thích bài trước đó đã chia sẻ của Bạn trên IDVS.
     
    aviaiva thích bài này.
  4. aviaiva

    aviaiva Thành viên tích cực

    Bài viết:
    384
    Đã được thích:
    148
    cảm ơn bác nhưng em dùng vps ngix nên htass không chạy được

    Cuối cùng em đã tìm ra phương án tối ưu nhất đó là sử dụng chức năng ban IP của diễn đàn, ban thẳng IP của web đó là xong, không cho leech auto, muốn leech tay trên web của em thì cũng gian nan hơn.
     
    Last edited: 29 Tháng sáu 2018
  5. antiddos

    antiddos Moderator

    Bài viết:
    19
    Đã được thích:
    4
    Ban IP thì bạn chỉ ban được tạm thời thôi, nó đổi IP cái là xong
    Kỹ thuật chống leech bài thì cần có một cái proxy trung gian, nó có chức năng là phát hiện con bot và không cho bot này nó gọi vào, bạn vẫn có thể cấu hình chức năng này trên nginx hoặc htacess deny một vài user agent của curl hay php-curl. Tuy nhiên nếu nó giả user agent thì vẫn đi qua đuợc, nên cách tối ưu là có CSDL gọi là fingerprint http request, một dang CSDL về sign của các trình duyệt, thì các con bot chỉ cỏ treo mỏ, trừ phi nguoi ta dung trình duyệt làm thủ công thì mới bó tay.
     
    Mr.N2 and aviaiva like this.
  6. PKdalieu

    PKdalieu Thành viên

    Bài viết:
    119
    Đã được thích:
    27
    Phần mềm hay điều gì giúp bác phát hiện ra có kẻ mạo danh và lấy hết bài viết, Kh và traffic của mình vậy?
    (Chỉ là e tò mò, và muốn biết để phòng trừ trường hợp giả sử bị chơi xấu như vậy)
    Em cảm ơn!
     
  7. Truongbotania

    Truongbotania Thành viên

    Bài viết:
    170
    Đã được thích:
    23
    Cái này thì rồi cũng sẽ bị thôi. Hầu như không tránh được vì leech còn dễ chặn chứ Crawl thì không thể chặn được vì họ là truy cập bình thường như người dùng chứ k phải lấy quá RSS hay gì
     
  8. aviaiva

    aviaiva Thành viên tích cực

    Bài viết:
    384
    Đã được thích:
    148
    Cái này do may mắn thôi bác, em sẻach từ khoá trên google thấy web này từ khoá nằm trong top 5 vào xem thử nên lòi ra nó.
    Ngoài ra có thể kiểm tra trong GWT xem link đến từ các trang bất thường (mình không đi link nhưng lại có quá nhiều link đổ về)
     
    PKdalieu thích bài này.
  9. ThangPV.HR

    ThangPV.HR Thành viên thân thiết

    Bài viết:
    1,367
    Đã được thích:
    414
    Trong một xã hội không tôn trọng bản quyền như ở VN thì việc trộm cắp là đầy rẫy và nhiều khi phải chấp nhận việc đó.
    Giờ chỉ có cách có bài mới là submit ngay với GG, còn máu hơn nữa thì tìm thằng chủ site trộm cắp cho nó cái giày vào mồm.
     
  10. hdthanhxuan

    hdthanhxuan Thành viên

    Bài viết:
    133
    Đã được thích:
    30
    Em nói thế này bác chủ thớt đừng trách em nhé,

    EM check web bác là web mới có ít truy cập nên cứ từ từ mà làm ko phải nôn nóng làm gì cả cứ từ từ viết bài chất lượng là ổn thôi.

    Các bài viết hot trên site của bác em thấy một số bác đi copy từ trang khác về là em thấy không ổn rồi. Nên làm mới nội dung hoặc làm cách nào người dùng tự đăng bài để có lượng truy cập đều nhất.

    Thân!
     

Chia sẻ trang này