xác thực google maps

Cách tạo và sử dụng file Robots.txt

Thảo luận trong 'Thủ thuật SEO' bắt đầu bởi seoict, 18 Tháng hai 2013.

Lượt xem: 19,962

  1. seoict

    seoict Thành viên

    Bài viết:
    218
    Đã được thích:
    59
    Robots.txt là gì? Nó là file dạng văn bản, nó giúp cho các bots hiểu được nên theo hay không theo, kiểu như nofollow và dofollow trong liên kế. Cách tạo và sử dụng file Robots.txt thế nào?, bài viết này sẽ giúp bạn điều đó.

    robots-txt.gif
    Sử dụng file robots.txt​


    Mã:
    User-agent: *
    Disallow: /wp-
    Disallow: /feed/
    Disallow: /trackback/
    “User-agent”:-* có nghĩa là tất cả những robot tìm kiếm từ Google, Yahoo và MSN nên sử dụng hướng dẫn này của bạn để tìm kiếm trang web.
    “Disallow: /wp-“: dòng code này báo cho công cụ tìm kiếm biết nó không nên “lục lọi” ở những filé của WordPress bắt đầu bằng wp-.

    Nếu bạn không sử dụng WordPress, bạn chỉ việc thay thế dòng Disallow với files và folders mà bạn không muốn nó “dòm ngó”, ví dụ:

    Mã:
    User-agent: *
    Disallow: /images/
    Disallow: /cgi-bin/
    Mình có tìm được một trang tạo file robots.txt rất hay, mọi người có thể tham khảo tại đây: Robots.txt Generator

    Copyright @ 2013 - www.vnseo.edu.vn
    Ghi rõ nguồn "vnseo.edu.vn" khi phát hành lại nội dung này!​
     
  2. AnhTuan

    AnhTuan Thành viên tích cực

    Bài viết:
    381
    Đã được thích:
    87
    Bài viết còn hơi đơn giản xíu, em xin chia sẻ robots.txt khá tốt cho Wordpress. Blog em chỉ cần 1p là index rồi :D

     
    longhai thích bài này.
  3. thevoicevnn

    thevoicevnn Thành viên tích cực

    Bài viết:
    328
    Đã được thích:
    52
    theo bác chủ top thì làm sao có thể chặn dc 1 link quảng cáo từ vatgia ads? Thật ra file robots.txt này thì khá đơn giản nhưng có gặp xíu rắc rồi về link động quảng cáo của vatgia?
     
  4. nguyenhongkhanh

    nguyenhongkhanh Banned

    Bài viết:
    108
    Đã được thích:
    5
    google cũng có công cụ tạo file robots rồi :)
     
  5. billtmb

    billtmb Dự bị

    Bài viết:
    23
    Đã được thích:
    2
    theo minh thì cứ allow tất thôi, mấy site lớn đều thế :D

    của mình là
    User-agent: *
    Allow: /
     
  6. nhatron

    nhatron Dự bị

    Bài viết:
    10
    Đã được thích:
    1
    bài này có rất nhiều người đề cập đến rồi, dù sao cũng thank bạn
     
  7. vanphuoc

    vanphuoc Dự bị

    Bài viết:
    22
    Đã được thích:
    1
    theo mình thì rất đồng tính với ý kiến này
     
  8. AnhTuan

    AnhTuan Thành viên tích cực

    Bài viết:
    381
    Đã được thích:
    87
    Tất nhiên là đơn giản và dễ dàng nhất. Nhưng nếu muốn bot "lục lọi" ở những nơi cần thiết và index nhanh hơn thì không nên bác à :p
     
  9. onlylovehn

    onlylovehn Thành viên

    Bài viết:
    174
    Đã được thích:
    90
    Site mình xài drupal thì lên dùng file robots.txt như nào cho hợp lý nhỉ, mọi người chỉ giáo cái . thanks
     
  10. AnhTuan

    AnhTuan Thành viên tích cực

    Bài viết:
    381
    Đã được thích:
    87
    Bạn thử xem :)

    Mã:
    Disallow: /admin/
    Disallow: /aggregator
    Disallow: /comment/reply/
    Disallow: /contact
    Disallow: /logout
    Disallow: /node/add
    Disallow: /search/
    Disallow: /user/register
    Disallow: /user/password
    Disallow: /user/login
    
     

Chia sẻ trang này