YOMEDIA
Tạo và sử dụng file robots.txt – Seo
Chia sẻ: Nguyen Ngoc Han
| Ngày:
| Loại File: PDF
| Số trang:4
78
lượt xem
9
download
Download
Vui lòng tải xuống để xem tài liệu đầy đủ
Dưới đây là hướng dẫn tạo và sử dụng file robots.txt cho website, để các bộ máy tìm kiếm quản lý index nội dung của website bạn
robots.txt là file văn bản có cấu trúc, khi các spider (bot, crawler) của các SE (Search engine) vào website để thu thập dữ liệu thì sẽ vào file robots.txt để xem các chỉ dẫn trong file này.
AMBIENT/
Chủ đề:
Nội dung Text: Tạo và sử dụng file robots.txt – Seo
- Tạo và sử dụng file
robots.txt – Seo
- Dưới đây là hướng dẫn tạo và sử dụng file robots.txt cho
website, để các bộ máy tìm kiếm quản lý index nội dung của
website bạn
robots.txt là file văn bản có cấu trúc, khi các spider (bot,
crawler) của các SE (Search engine) vào website để thu thập
dữ liệu thì sẽ vào file robots.txt để xem các chỉ dẫn trong file
này.
robots.txt có thể quy định từng loại bot khác nhau của các SE
khác nhau có thể vào website hay từng khu vực của website
hay không?
Vài loại bot của các SE: Googlebot (Google), Googlebot-
Image(Google), Yandex(SE của Nga), Bingbot(Bing)/Yahoo
Slurp(Yahoo)…
Những cú pháp thông dụng trong file robots.txt
User-agent: đối tượng bot được chấp nhận
Disallow/Allow: URL muốn chặn/cho phép
- *: Đại diện cho tất cả
Ví dụ: User-agent: * (Có nghĩa là chấp nhận tất cả các loại
bot.)
Khóa toàn bộ site
Disallow: /
Chặn 1 thư mục và mọi thứ nằm trong nó
Disallow: /wp-admin/
Chặn 1 trang
Disallow: /private_file.html
Loại bỏ 1 hình từ Google Images
User-agent: Googlebot-Image
Disallow: /images/sexy.jpg
Bỏ tất cả các hình từ Google Images:
User-agent: Googlebot-Image
Disallow: /
Chặn 1 file hình bất kỳ, ví dụ .gif
User-agent: Googlebot
Disallow: /*.gif$
- Những điều cần tránh trong file robots.txt
- Phân biệt chữ hoa chữ thường.
- Không được viết dư, thiếu khoản trắng.
- Không nên chèn thêm bất kỳ ký tự nào khác ngoài các cú
pháp lệnh.
- Mỗi một câu lệnh nên viết trên 1 dòng.
Cách tạo và vị trí đặt file robots.txt
- Dùng notepad hay bất cứ chương trình nào tạo file, sau đó
đổi tên file là robots.txt.
- Đặt ở thư mục gốc của website. ( sanduatin.com/robots.txt )
Thêm tài liệu vào bộ sưu tập có sẵn:
Báo xấu
LAVA
ERROR:connection to 10.20.1.100:9315 failed (errno=111, msg=Connection refused)
ERROR:connection to 10.20.1.100:9315 failed (errno=111, msg=Connection refused)
Đang xử lý...