如何编写和优化WordPress网站的Robots.txt

时间：2020-03-25

阅读：

要知道WordPress robots.txt文件中的“Disallow”命令与页面头部的元描述noindex 的作用不完全相同。您的robots.txt会阻止抓取，但不一定不进行索引，网站文件（如图片和文档）除外。如果搜索引擎从其他地方链接，它们仍然可以索引您的“不允许爬取”的页面。

因此，Prevent Direct Access Gold不再使用robots.txt禁止规则阻止您的网站页面进行搜索索引。相反，我们使用 noindex元标记，这也有助于谷歌和其他搜索引擎正确地在您的网站上为您的内容分发其入站链接值。

Yoast建议保持robots.txt干净，不要阻止包括以下任何内容：

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Disallow: /wp-content/plugins/
Disallow: /wp-includes/

WordPress也同意说理想的robots.txt 不应该禁止任何东西。事实上， /wp-content/plugins/ 和 /wp-includes/ 目录包含您的主题和插件可能用于正确显示您的网站的图像，JavaScript或CSS文件。阻止这些目录意味着插件和WordPress的所有脚本，样式和图像被阻止，这使得Google和其他搜索引擎的抓取工具难以分析和理解您的网站内容。同样，你也不应该阻止你/wp-content/themes/。

简而言之，禁止你的WordPress资源，上传和插件目录，许多人声称可以增强你的网站的安全性，防止任何目标易受攻击的插件被利用，但实际上可能弊大于利，特别是在SEO方面。或者，您应该卸载这些不安全的插件更实际些。

这就是我们默认从robots.txt中删除这些规则的原因。但是，您可能仍希望将它们包含在WordPress的Robots.txt内。

建议包含Sitemap文件

尽管Yoast强烈建议您直接手动将XML站点地图提交到Google Search Console和Bing网站管理员工具，但您仍可将sitemap添加到robots.txt，帮助搜索引擎快速爬取收录你的网站页面。

Sitemap: http://yourdomAIn.com/post-sitemap.xml
Sitemap: http://yourdomain.com/page-sitemap.xml
Sitemap: http://yourdomain.com/author-sitemap.xml
Sitemap: http://yourdomain.com/offers-sitemap.xml

Robots.txt的其他规则

出于安全，建议您阻止您的WordPress的readme.html，licence.txt和wp-config-sample.php文件访问，以便未经授权的人员无法检查并查看您正在使用的WordPress版本。

User-agent: *
Disallow: /readme.html
Disallow: /licence.txt
Disallow: /wp-config-sample.php

您还可以使用robots.txt对不同的搜索引擎爬虫定制不同的爬取规则，如下示例。

# block Googlebot from crawling the entire website
User-agent: Googlebot
Disallow: /

# block Bingbot from crawling refer directory
User-agent: Bingbot
Disallow: /refer/

这是如何阻止蜘蛛抓取WordPress搜索结果，强烈建议加入此规则：

User-agent: *
Disallow: /?s=
Disallow: /search/

Host＆Crawl-delay 是您可能考虑使用的其他robots.txt指令，尽管不太受欢迎。第一个指令允许您指定网站的首选域（www或非www）：

User-agent: *
#we prefer non-www domain
host: yourdomain.com

下面的规则是用来告诉搜索引擎蜘蛛在每次抓取之前等待几秒钟。

User-agent: *
#please wait for 8 seconds before the next crawl 
crawl-delay: 8

完整的robots.txt

综上所述，我们建议WordPress的robots.txt内容编写为：

User-agent: *
Allow: /wp-admin/admin-ajax.php
Disallow: /wp-admin/
Disallow: /wp-login.php
Disallow: /readme.html 
Disallow: /licence.txt 
Disallow: /wp-config-sample.php
Disallow: /refer/
Disallow: /?s= 
Disallow: /search/

#we prefer non-www domain（填入你的网站域名首选域名，一般带www，请根据实际情况填写，部分搜索引擎不支持此规则，慎重添加）
host: yourdomain.com

#please wait for 8 seconds before the next crawl（填入你希望爬虫爬取页面的延迟秒数） 
crawl-delay: 8

Sitemap: http://yourdomain.com/post-sitemap.xml

温馨提示：上述完整的robots.txt仅供参考，请各位站长根据自己的实际情况编写内容，其中User-agent: *规则即对所有搜索引擎蜘蛛通用；Allow: 规则即允许爬取；Disallow: 规则即不允许爬取；host:规则用于指定网站首选域；crawl-delay:规则用于设定爬虫爬取时间间隔；Sitemap:规则用于设定网站的地图地址。

在 WordPress网站后台上传某些特殊格式的图片文件时，如果服务器不允许或者不支持该类格式的文件上传，那么，就会出现如下错误提示：web服务器无法处理该图片，请在上传前将其转换为

2024-01-24 10:36:19

插件简介：Mailpress是一个比较流行的邮件插件。插件下载Plugin Directory：https://wordpress.org/plugins/mailpress/漏洞复现：漏洞详解地址：https://github.com/Medicean/VulAp

2023-10-06 22:02:48

特色图片是您可以添加到博客文章中的最重要的图片之一。特色图片之所以如此重要，是因为它在 WordPress 中的使用方式。当人们偶然发现在社交媒体上分享的您网站的链接时，他们

2023-09-21 20:45:38

需要更新到 Google Analytics 4，但不确定如何更新？很难设置现在所需的 Google Analytics 4？在这篇文章中，我将向您展示如何操作。Google Analytics 4 正在取代其前身 Universal

2023-09-21 20:45:16

需要知道 WordPress 媒体文件的附件 ID？不确定如何找到附件 ID？WordPress 是全球无数网站的支柱。它的灵活性很大程度上归功于各种功能，包括媒体库。这是一个用户友好的媒体文

2023-09-21 20:44:57

WordPress 具有内置菜单管理系统，可以轻松地将菜单添加到您的网站。然而，随着您添加越来越多的页面、帖子和其他杂项内容，将每个目的地都包含在标准菜单栏中可能会变得不可能。

2023-09-21 20:44:37

网站可能会因多种原因突然停止工作。对网站的成功请求通常会给出 200 的状态代码。当网站无法运行时，我们首先要做的事情之一就是找出服务器返回的状态代码。这可能并不总能

2023-09-21 20:44:18

更改 WordPress 网站中的字体大小对于一小部分文本来说可以快速轻松地完成，但如果您想对较大的文本部分进行更改，则可能需要做更多的工作。在这个快速教程中，我将向您展示如何

2023-09-21 20:43:45

正在努力为您的 WordPress 网站创建 PNG 徽标吗？不确定如何将 PNG 徽标上传到 WordPress？创建和添加徽标可能看起来很困难，但它比您想象的要容易得多。本分步指南将详细介绍如

2023-09-21 20:42:37

创建 WordPress 主题时只需要使用两个文件：index.php 文件（充当网站的主模板文件）和 style。 css 文件，这是您网站的主要样式文件。还有第三个文件，名为 functions.php，它实际上不

2023-09-21 20:42:12

毫无疑问，Quform 和 FormCraft 是市场上最受欢迎和评价最高的两个 WordPress 表单构建器，但这两个巨头中的哪一个最适合您呢？今天，我们深入了解一下这些表单构建器的特殊之处。

2023-09-07 21:18:07

自定义后台的侧边栏顶级菜单首先让我们看看，什么是后台的侧边栏菜单:上图就是使用管理员账号登陆后看到的侧边栏所有的菜单项，WordPress给不同角色的用户定义了不同功能的使用

2023-05-29 20:43:45

有很多WordPress博客的固定链接中使用了文章ID，但是WordPress由于种种原因导致了文章ID不连续的问题，也经常有博友在论坛中提问要解决这个问题，但是很少能够得到他们满意的答复

2023-05-29 20:42:43

WordPress如何批量修改文章信息？下面本篇文章给大家介绍一下WordPress批量修改文章内容、摘要、作者、所有评论、敏感词汇等信息，希望对大家有所帮助！你是否遇到过如下几种状况

2023-05-29 20:41:25

效果预览方法1.将以下代码加入到主题的functions.php中//页面加载时间自动检测function wp_page_speed() { date_default_timezone_set( get_option( 'timezone_

2023-04-18 23:24:38

说到wordpress的缓存，大家想到的肯定是 WP-Super-Cache 的静态html缓存，以及 memcached 或 redis 动态缓存，插件的缓存效果肯定是有的，但是容易出现各种问题，比如配置很复杂、配

2023-04-18 23:21:39

上文提到了WordPress博客的Nginx缓存方法，但当我使用时，缓存文件始终清理不掉，更新文章主页访问的仍然是缓存文件，检查了好久发现，清理的缓存文件夹设置错误。解决办法很简单，在 W

2023-04-18 23:20:15

主题制作中往往会使用WP自定义字段实现一些功能，特别是在wordpress淘宝客模板中的使用，产品的价格、链接都可以通过自定义栏目使用。默认的自定义字段使用方法是下拉菜单形式，

2023-04-18 23:17:13

对于类似发布各种活动通知或到期时间内容的wordpress站点，也许会需要这样一个功能：发布活动内容的时候设定活动的到期日期，当活动还没有过期，网页显示“进行中”；当活

2023-04-18 23:16:03

WordPress能承载多大的数据？文章数量十万百万能承载吗？支撑几百万没问题，不过需要自己改写部分代码，去掉WordPress一些耗时大的功能。面对大数据量（百万级），有几方面可以考虑改进：1.

2023-04-04 17:54:12

我们在WordPress中编写文章的时候，经常会用到一些自定义字段，如网页描述description和关键词keywords这两个meta标签，关于这两个标签，可以看我之前写过的一篇文章：WordPress设置

2023-03-08 22:55:58

CorePress Pro是一款非常优秀的wordpress主题，价格不贵，功能很多（尽管部分属于鸡肋）。最重要的是不支持内容页分页，怎么解决呢？找到CorePress-Pro/component/post-content.php（一）解

2023-01-07 14:52:44

WordPress在把文章移动到回收站后，图片附件和特色图片还会存在，这样就会占用服务器资源，再手动一个个删除也很费事。今天我们来实操一下同步删除。百度一下，有文章介绍使用以下

2023-01-06 22:41:14

WordPress程序在上传图片后会生成一大推大大小小的缩略图，久而久之服务器资源就会爆满。通过以下代码，可以实现禁止生成缩略图// 禁用自动生成的图片尺寸function shapeSpace_

2023-01-06 22:40:48

后台文章按修改时间排序在当前主题的functions.php中添加以下php代码即可：function ludou_set_post_order_in_admin( $wp_query ) {
if ( is_admin() ) {
$wp_query->set( &l

2023-01-06 22:36:58

今天给大家分享wordpress网站如何设置指定用户级别查看内容的方法。wordpress用户的默认等级如下，根据这个等级代码调用就可以了：管理员：Administrator: level 10编辑：Editor: L

2023-01-06 22:36:03

一、什么是WordPress的附件页面？wordpress站点对于附件（图片）是有默认页面的，具体查看方法是通过侧边栏的“媒体库”。点开每一张图片，右下角就有查看附件页面，点开来就

2023-01-06 22:32:40

WordPress默认是按照文章发布时间来排序的，这就会产生一个问题，那些定时发布或者后期修改过但是需要展示到首页的文章将永远排在后面，其实WordPress的文章排序是可以更改的，这种

2023-01-06 22:31:45

一、用图片设计软件自行设计背景图片并将其透明度调到50%（看个人喜好），上传到服务器或七牛例如你设计的图片命名为comment.png,并上传到“/wp-content/themes/你的当前主

2022-04-04 19:32:31

如果我们使用WordPress默认主题或者大部分主题的时候，在留言评论处一般是有昵称、URL、邮箱，以及评论内容几个选项的。我们肯定很多人都有留意，有些网友回访评论均不是用来真正

2022-03-14 20:48:56

Robots.txt 文件必须放在网站的根目录。放在子目录的 Robots.txt 文件搜索引擎不能爬取到，所以不会起任何作用。例子：http://www.xxxx.com/robots.txt 有效http://www.xxxx.co

2019-12-06 21:08:11

什么是robots.txt文件?搜索引擎机器人通过链接抵达互联网上的每个网页，并抓取网页信息。搜索引擎机器人在访问一个网站时，会首先检查该网站的根目录下是否有一个叫做robots.tx

2019-12-06 21:07:26

在网站建设过程中我们会有一部分内容不希望被搜索引擎抓取到或者不希望其在互联网中出现，那么要怎么办呢?我要怎么跟搜索引擎说你不要抓取我的xx内容呢?这时候robots就派上用

2019-11-28 12:08:28

Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol)，网站通过Robots协议告诉搜索引擎哪些页面可以抓取，哪些页面

2019-11-19 21:25:06

robots.txt 是存放在站点根目录下的一个纯文本文件。虽然它的设置很简单，但是作用却很强大。它可以指定搜索引擎蜘蛛只抓取指定的内容，或者是禁止搜索引擎蜘蛛抓取网站的部分

2019-09-27 00:00:42

本文实例讲述了帝国CMS中robots.txt文件用法。分享给大家供大家参考。具体分析如下：在说帝国CMS中robots.txt文件使用前先给大家解释下robots.tx是干什么的.robots协议（也称为

2019-03-11 22:05:41

robots协议（也称为爬虫协议、爬虫规则、机器人协议等）通常添加到网站根目录的robots.txt 文件，它的作用在于告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取，从而优化网站的收录

2018-10-24 23:20:24

说到robots.txt大家已经都不会陌生了，但是有些时候很多的细节却还是没有被大多数人注意，比如子凡就忽略了一个细节，导致最近的一些文章在搜索引擎结果中出现了重复而没有意义的

2018-08-28 21:23:10

关于 robots.txt文件使用的格式及注意早在四年前子凡就曾在泪雪博客写过了，robots.txt的重要与必要性不言而喻，而在子凡前段时间的网站SEO诊断之robots.txt文件配置误区

2018-08-28 21:18:37

笔者在百度站长平台检测自己的博客时，出于优化的惯性，对博客的Rbots进行了检测，进而在百度搜索了wordpress博客robots的写法设置问题，看了很多wordpress高手对robots优化设置后，

2018-08-25 17:05:45

2018-08-30

2019-09-12

2018-08-30

2019-09-03

2019-02-27

2018-10-18

2020-04-25

2021-03-24

2020-03-10

2019-09-03

如何编写和优化WordPress网站的Robots.txt

建议包含Sitemap文件

Robots.txt的其他规则

完整的robots.txt

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道