فایل robots.txt به موتورهای جستجو کمک میکند تا بفهمند کدام بخشهای سایت شما را باید ایندکس کنند و کدام بخشها را باید نادیده بگیرند. برای یک وبسایت وردپرسی، حالت بهینه robots.txt معمولاً شامل موارد زیر است:
User-agent: *: این خط به تمام رباتها اجازه میدهد که به سایت شما دسترسی پیدا کنند.
Disallow: • /wp-admin/: جلوگیری از دسترسی به صفحه مدیریت وردپرس. • /wp-includes/: جلوگیری از دسترسی به فایلهای هسته وردپرس. • /xmlrpc.php: جلوگیری از دسترسی به XML-RPC که معمولاً برای حملات مورد استفاده قرار میگیرد. • /trackback/, /comments/, /author/, /?s=*: جلوگیری از ایندکس شدن صفحات خاص.
Allow: • /wp-content/uploads/: اجازه دسترسی به فایلهای بارگذاری شده. • /wp-admin/admin-ajax.php: اجازه دسترسی به AJAX برای عملکردهای خاص.
Sitemap: آدرس نقشه سایت شما را مشخص میکند که به موتورهای جستجو کمک میکند تا ساختار سایت شما را بهتر درک کنند.
نکته:
حتماً آدرس نقشه سایت (Sitemap) را با آدرس واقعی نقشه سایت خود جایگزین کنید.
با توجه به نیازها و ساختار خاص وبسایت خود، ممکن است بخواهید تنظیمات بیشتری اضافه کنید یا تغییراتی ایجاد کنید.
برای جلوگیری از ایندکس شدن فیدهای RSS و Atom در فایل robots.txt، میتوانید از دستورات Disallow استفاده کنید. به طور کلی، فیدها معمولاً در مسیرهای خاصی قرار دارند. برای مثال، فیدهای وردپرس معمولاً به این شکل هستند:
/feed/
/comments/feed/
بنابراین، برای بستن ایندکس فیدها در فایل robots.txt، میتوانید به شکل زیر عمل کنید:
مطمئن شوید که آدرس نقشه سایت (Sitemap) را با آدرس واقعی نقشه سایت خود جایگزین کنید.
با بستن فیدها، موتورهای جستجو به این فیدها دسترسی نخواهند داشت و آنها را ایندکس نخواهند کرد. اگر هدف شما جلوگیری از ایندکس شدن فیدها است، این تنظیمات مناسب خواهند بود.
دیدگاه بگذارید