Chắc hẳn khi làm SEO, có những lúc bạn muốn ngăn công cụ tìm kiếm truy cập và hiển thị một trang nào đó cho người dùng, hoặc tìm cách để các bot lập chỉ mục website nhanh hơn.
Hãy tạo ngay file robots.txt cho WordPress! Đây chính là giải pháp giúp bạn kiểm soát việc thu thập dữ liệu một cách hiệu quả.
File robots.txt đóng vai trò như một hướng dẫn cho các công cụ tìm kiếm về cách thu thập dữ liệu, lập chỉ mục nội dung và hiển thị website của bạn cho người dùng.
Dưới đây là mẫu file robots.txt chuẩn cho WordPress:
User-agent: *
Disallow: /wp-admin/
Allow: /
Sitemap: https://tenmiencuawebsite.com/sitemap_index.xml
Tệp này cho phép tất cả các công cụ tìm kiếm thu thập và lập chỉ mục toàn bộ dữ liệu trên website, ngoại trừ trang quản trị /wp-admin/. Bạn có thể tùy chỉnh file này để phù hợp với nhu cầu của website mình.
>> Tìm hiểu thêm: Google Index là gì? Cách giúp website index trên Google hiệu quả
Bạn nên hạn chế hoặc ngăn chặn Googlebot thu thập dữ liệu hoặc lập chỉ mục website trong một số trường hợp sau:
Trên website có thể chứa nhiều tập tin hệ thống, plugin WordPress hoặc nội dung không hữu ích với người dùng. Nếu vẫn để các công cụ tìm kiếm lập chỉ mục những nội dung này, website có thể bị loãng, ảnh hưởng đến chất lượng tổng thể.
Nếu website chưa hoàn thiện hoặc đang trong giai đoạn thử nghiệm, bạn nên sử dụng file robots.txt để ngăn công cụ tìm kiếm lập chỉ mục.
Ngoài ra, nếu trang web có các trang con dùng để kiểm tra tính năng hoặc giao diện, việc để người dùng truy cập vào những trang này có thể ảnh hưởng đến hình ảnh và sự chuyên nghiệp của doanh nghiệp.
Mỗi bot có giới hạn khi thu thập dữ liệu trong một lần truy cập. Nếu website có quá nhiều nội dung, bot sẽ mất nhiều thời gian hơn để index, khiến một số nội dung bị trì hoãn đến lần quét tiếp theo.
Nếu không có file robots.txt, bot có thể thu thập tất cả nội dung liên tục, làm giảm tốc độ tải trang, ảnh hưởng đến trải nghiệm người dùng. Điều này có thể dẫn đến giảm lượt truy cập và tăng tỷ lệ thoát trang.
Việc tạo file robots.txt cho WordPress giúp công cụ tìm kiếm hoạt động hiệu quả hơn, góp phần cải thiện SEO cho website.
Hãy cùng tìm hiểu thêm về SEO là gì? Làm SEO như thế nào? để xem bạn đã nắm được bao nhiêu yếu tố quan trọng nhé!
WordPress tự động tạo một file robots.txt ảo trong thư mục gốc (public_html) của website. Bạn có thể kiểm tra file này bằng cách truy cập: tenmiencuaban.com/robots.txt.
Tuy nhiên, do đây là file mặc định và không thể chỉnh sửa trực tiếp, bạn cần tạo một file robots.txt tùy chỉnh để thay thế và kiểm soát tốt hơn cách công cụ tìm kiếm thu thập dữ liệu trên website.
Mỗi file robots.txt bao gồm nhiều chỉ lệnh, mỗi chỉ lệnh được viết trên một dòng riêng. Dưới đây là các thành phần chính của file robots.txt:
Ví dụ:
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php/
File robots.txt này chặn tất cả bot truy cập thư mục /wp-admin/, nhưng vẫn cho phép quét /admin-ajax.php/ để hỗ trợ một số plugin hoạt động.
Lưu ý: Mỗi User-agent cần ít nhất một chỉ lệnh Allow hoặc Disallow.
Ví dụ:
User-agent: *
Disallow: /trang-cam-on/
Noindex: /trang-cam-on/
Sitemap: https://tenmiencuaban.com/sitemap.xml
File này chặn bot truy cập và lập chỉ mục trang cảm ơn, đồng thời cung cấp sitemap để hỗ trợ SEO website.
Dù nhẹ hơn, nhưng Rank Math vẫn tích hợp đầy đủ các tính năng như Yoast SEO. Để tạo file robots.txt, hãy làm theo các bước sau:
Với Rank Math, bạn có thể dễ dàng quản lý file robots.txt ngay trong WordPress mà không cần truy cập vào thư mục gốc của website.
Bạn có thể tự tạo file robots.txt mà không cần plugin bằng cách sử dụng trình soạn thảo văn bản đơn giản như Notepad (Windows) hoặc TextEdit (Mac).
Sau khi tạo xong, tải file lên thư mục gốc của website (public_html) thông qua FTP hoặc trình quản lý tệp của hosting.
Bạn có thể kiểm tra file robots.txt bằng Google Search Console theo các bước sau:
Đến đây chắc các bạn đã nắm được phần nào các thông tin khái quát về cách tạo file robots.txt cho WordPress khi tối ưu SEO rồi đúng không?
Khi được thiết lập đúng cách, file robots.txt giúp website và công cụ tìm kiếm tương tác hiệu quả hơn. Điều này không chỉ tối ưu SEO mà còn đảm bảo trang web của bạn được thu thập dữ liệu và cập nhật chính xác.
Đừng quên để lại bình luận nếu có bất kỳ thắc mắc nào nhé!
Hơn 7 năm kinh nghiệm trong lĩnh vực SEO nói riêng và Digital Marketing nói chung. Tư vấn và trực tiếp triển khai hơn 100 dự án SEO của SEORankLead.