很多新手朋友在学习谷歌SEO相关知识的时候,应该会看到站点地图(Sitemap)这个词。
你可能知道它对谷歌SEO有帮助,但是对它的具体概念及实际作用不是很了解,甚至有的人一看到这个名字这么专业,会产生畏难心理,不想进一步学习。
不用担心,我的这篇站点地图教程博客就是为这样的你准备的。我将带你从零开始,彻底搞懂站点地图这个概念。
不管你是用WordPress建站,还是Shopify建站,读完这篇文章,你将能够学到以下知识:
- 真正理解站点地图是什么,以及它对 Google SEO 的核心作用。
- 分清各种类型的站点地图,并知道你的网站需要的是哪一种。
- 手把手教你学会使用多种工具创建并提交你的站点地图。
- 掌握站点地图的优化技巧,从合格迈向优秀。
- 解决关于站点地图的各种常见疑问。
站点地图是什么
在深入学习之前,咱们先来搞清楚一些基础概念。只有先理解是什么和为什么,我们在实操的时候,才能知其所以然,而不是盲目跟风。
那么,到底什么是站点地图或 Sitemap 呢?简单来说,站点地图就是一个文件,通常以 .xml 结尾。
它就像一个清单,用搜索引擎能看懂的格式,列出了你网站上所有希望被搜索引擎发现和收录的网页、图片、视频等信息。
这里,我用一个简单的比喻来帮助你理解。
我们可以将谷歌的爬虫(Googlebot)想象成一位勤奋的图书管理员,它每天要在浩如烟海的互联网图书馆里发现和整理书籍,而你的网站就是其中一个书架。
如果没有站点地图的话,管理员只能顺着一本书(一个页面)里的引用链接找到另一本书,这种方式不仅效率低下,而且很容易遗漏掉那些放在角落、没有被其他书引用的孤本。
那么,站点地图,就相当于你亲手递给这位图书管理员一张你这个书架的完整书单。这张书单上不仅清楚地标明了每一本书(页面URL)的位置,还可能附带了额外的重要信息,比如:
- 这本书是哪天最新修订的(页面最后更新时间)。
- 这本书有没有其他语言的版本。
- 如果这本书是图册,里面包含了哪些图片。
- 如果这本书是视频,它的播放时长和内容分级是什么。
有了这份书单,谷歌爬虫的工作效率就能提升,可以更快速地找到所有重要书籍,也就是你的重要页面,并确保它们都能被收录。
XML 站点地图的 SEO 作用
很多新手朋友都会关心一个问题,就是:提交了站点地图,我的网站排名会提升吗?
在这里,我可以直接告诉你答案:提交站点地图,并不会直接提升你网站的谷歌 SEO 排名。
站点地图的核心作用是帮助搜索引擎更快速、更全面地发现和理解你的网站内容,从而提升收录(Indexing)的效率和覆盖面。
还有一个重要知识点,也是很多人会产生误解的地方。那就是,只有你的网页先被搜索引擎收录,然后它才获得了参与排名的入场券。
这句话是什么意思呢?
也就是说,如果你的页面都没有被谷歌收录,就不可能在搜索引擎获得排名。换句话说,收录数量不等于排名实力。
总结一下,一个合格的站点地图文件主要有以下几个关键作用:
- 加快新内容发现:当你发布一篇新文章或一个新产品页面时,更新后的站点地图会立刻通知搜索引擎。这对于时效性强的内容(如新闻报道)或全新的网站来说尤其重要,它可以将收录时间从几周缩短到几天甚至几小时。
- 解决孤岛页面:很多人在建站的时候,基础谷歌SEO工作没做好,导致很多页面因为内部链接做得不好,最终变成孤岛页面(没有链接指向的页面),爬虫很难通过常规的页面跳转发现它们。而站点地图可以快速解决这个问题,让孤岛页面也能被搜索引擎找到,避免它们被遗漏。
- 提供重要的富媒体信息:站点地图文件不仅包含 URL 列表,还有关于这些 URL 的附加信息。例如,对于视频和图片,它可以提供播放时长、标题、主题等关键信息,帮助它们在谷歌视频和图片搜索中获得更多展示机会。
- 提升大型或新网站的抓取效率:对于拥有成百上千个页面的大型网站来说,很难为每个页面创建合理的站内链接结构。在这种情况下,站点地图是必不可少的导航工具。而对于一个全新的网站,它通常缺少高质量的外部链接,此时主动提交站点地图是让谷歌认识你的最快途径。
快速自检:我的网站真的需要站点地图吗?
谷歌官方的文档提到,如果你的网站规模“较小”(例如少于 500 个页面),并且内部链接结构非常完善,那么理论上可以不需要站点地图 。
但是,我个人的建议是:无论网站大小,都应该创建一个站点地图,并提交到GSC后台。
为什么?
因为这几乎是一个零成本、高回报的操作。你没有任何损失,却能为你的网站内容收录买一份保险。与其去赌自己的网站结构完美无缺,不如花几分钟时间创建一个站点地图,确保万无一失。
特别是以下几种情况,站点地图是必不可少的,对谷歌 SEO 的作用很大:
- 你的网站很大:当你的网站页面数量超过 500 个时,站点地图就从建议项变成了必需品。
- 你的网站是新站:新网站权重比较低,主动提交站点地图可以加速谷歌发现网站页面的速度。
- 你的网站内部链接结构不佳:如果你发现自己网站存在孤岛页面,那么站点地图可以作为重要的补救措施。
- 你的网站包含大量富媒体内容:如果你希望网站上的视频、图片能够被谷歌视频和谷歌图片搜索收录,站点地图会非常有帮助。
两种常见的站点地图格式
虽然我一直在说站点地图这个谷歌SEO术语,但其实它是一个总称,它有不同类型,服务于不同的对象,目的也是不一样的。
接下来我们一起来看下站点地图的两种主要形式:给用户看的(HTML 站点地图),以及给搜索引擎看的(XML 站点地图)。
1. HTML 站点地图:为真实用户设计
这是一种你可以在网站上直接点击访问的普通网页。它就像一本书的目录,或者商场的楼层导览图,用清晰的列表展示出网站的主要栏目和页面链接。
它的主要目的是帮助真实的用户快速了解网站的整体结构,方便他们快速找到自己需要的信息,从而提升用户体验(User Experience, UX)。
通常,你会在网站的页脚找到指向 HTML 站点地图的链接。下方截图就是一个 HTML 站点地图的例子。

2. XML 站点地图:为搜索引擎设计
这篇博客讨论的主要站点地图类型就是 XML Sitemap,它是遵循特定格式生成的文件,专门给搜索引擎的爬虫看的。
我们也可以直接访问 XML 站点地图的路径查看它的详细信息,但 XML 站点地图没有 HTML 站点地图那么直观,小白朋友可能觉得只是一堆枯燥的代码。
总之呢,XML 站点地图才是谷歌爬虫能理解的官方语言,我们后面讨论的创建站点地图、提交站点地图等工作,都是围绕 XML Sitemap 展开的。

HTML VS XML Sitemap 表格对比
为了让你更清晰地理解两者的区别,我整理了下面这个表格:
特性 | HTML 站点地图 | XML 站点地图 |
---|---|---|
目标受众 | 用户/访客 | 搜索引擎爬虫 |
主要目的 | 改善用户导航和体验 | 提升抓取和收录效率 |
格式 | 标准的 HTML 网页 | 特殊格式的 XML 文件 |
位置 | 网站上可见的页面,通常在页脚链接 | 通常在网站的根目录(如 domain.com/sitemap.xml) |
SEO 影响 | 间接影响(通过改善用户体验和内部链接) | 直接影响(通过引导爬虫,加快收录) |
很多初学者容易混淆这两者,甚至以为创建了一个 HTML 站点地图页面就万事大吉了。
这是一个常见的误区。请记住,为了做好谷歌 SEO,我们必须创建并提交 XML 站点地图。
5 种 XML Sitemap 类型
上面我们说的是站点地图的格式,现在我们来看下XML站点地图有哪些常见的类型。
一个标准的 XML 站点地图主要包含网页的 URL,但它能提供的信息不仅限于此。
通过添加额外的信息类型,我们还能创建专门针对图片、视频和新闻的站点地图,向谷歌提供更丰富的信息。
1. 页面站点地图(Page Sitemap)
这是最基础、最常见的站点地图类型。它主要包含你网站上普通页面的 URL、以及页面最后修改时间 (lastmod) 等信息。
一个重要的提醒:你可能在一些旧的教程里看到过 <priority> (优先级) 和 <changefreq> (更新频率) 这两个标签。但在 2025 年的今天,谷歌官方已经明确表示,他们几乎完全忽略了这两个标签。所以,你完全不用在它们身上浪费时间,专注于确保 lastmod 的准确性就足够了。
Page Sitemap 示例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.example.com/page.html</loc>
<lastmod>2022-06-06</lastmod>
<changefreq>daily</changefreq>
<priority>0.9</priority>
</url>
</urlset>
2. 图片站点地图(Image Sitemap)
其实图片站点地图跟页面站点地图差不多,只不过它重点强调网站上的图片需要被索引。
一般来说,如果你的网站不是类似素材库或者照片分享网站的话,可以不用特地创建图片站点地图。
只有在你觉得这些图片对你的业务来说特别重要,一定要全部被索引,才去创建 image sitemap。
Image Sitemap 示例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
<url>
<loc>https://example.com/sample1.html</loc>
<image:image>
<image:loc>https://example.com/image.jpg</image:loc>
</image:image>
<image:image>
<image:loc>https://example.com/photo.jpg</image:loc>
</image:image>
</url>
<url>
<loc>https://example.com/sample2.html</loc>
<image:image>
<image:loc>https://example.com/picture.jpg</image:loc>
</image:image>
</url>
</urlset>
3. 视频站点地图(Video Sitemap)
视频站点地图类似于图片站点地图,希望搜索引擎爬虫能够抓取我们想要被索引的视频。
但是也是一样的,除非你的网站是做视频素材库,或者有很多视频你觉得很重要,一定要被索引,那么可以创建视频站点地图去提交给谷歌站长工具。
视频站点地图里可以包括这些信息:视频的缩略图 URL、标题、描述、播放时长等。这有助于提升视频在谷歌搜索(包括视频标签页)中的可见度。
Video Sitemap 示例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
<url>
<loc>https://www.example.com/videos/some_video_landing_page.html</loc>
<video:video>
<video:thumbnail_loc>https://www.example.com/thumbs/123.jpg</video:thumbnail_loc>
<video:title>Grilling steaks for summer</video:title>
<video:description>
Alkis shows you how to get perfectly done steaks every time
</video:description>
<video:content_loc>
http://streamserver.example.com/video123.mp4
</video:content_loc>
<video:player_loc>
https://www.example.com/videoplayer.php?video=123
</video:player_loc>
<video:duration>600</video:duration>
<video:expiration_date>2021-11-05T19:20:30+08:00</video:expiration_date>
<video:rating>4.2</video:rating>
<video:view_count>12345</video:view_count>
<video:publication_date>2007-11-05T19:20:30+08:00</video:publication_date>
<video:family_friendly>yes</video:family_friendly>
<video:restriction relationship="allow">IE GB US CA</video:restriction>
<video:price currency="EUR">1.99</video:price>
<video:requires_subscription>yes</video:requires_subscription>
<video:uploader
info="https://www.example.com/users/grillymcgrillerson">GrillyMcGrillerson
</video:uploader>
<video:live>no</video:live>
</video:video>
</url>
</urlset>
4. 新闻站点地图(News Sitemap)
如果你的网站是一个新闻网站,而且希望你的新闻出现在谷歌新闻板块,那么可以提交新闻站点地图。
如果你只是常规的外贸网站或者商城网站,其实没必要再次提交新闻站点地图。
因为新闻对发布时间要求比较高,文件内的内容发布时间必须在两天内,超过两天的新闻需要在站点地图中移除对应网址。
News Sitemap 示例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
<url>
<loc>http://www.example.org/business/article55.html</loc>
<news:news>
<news:publication>
<news:name>The Example Times</news:name>
<news:language>en</news:language>
</news:publication>
<news:publication_date>2020-12-23</news:publication_date>
<news:title>Companies A, B in Merger Talks</news:title>
</news:news>
</url>
</urlset>
5. 站点地图索引文件(Sitemap Index File)
随着网站内容不断增加,你可能会遇到一个问题:单个站点地图文件是有限制的。根据谷歌的规定,一个站点地图文件大小不能超过 50MB,并且其中包含的 URL 数量不能超过 50,000 个。
当你的网站规模超过这个限制时,就需要将一个大的站点地图拆分成多个较小的文件。
这时候,站点地图索引文件(Sitemap Index)就派上用场了。
站点地图索引文件本身也是一个 XML 文件,但它不直接包含网页的 URL,而是包含一个其他站点地图文件的列表。
我们可以用一个形象的比喻来理解:想象一下,你有一套非常厚的《大英百科全书》,全书有 26 卷(A-Z)。每一卷(子站点地图)都有自己的详细目录,列出了该卷的所有词条(页面URL)。而站点地图索引文件,就相当于这套百科全书第一册最前面的那个“总目录”,它会告诉你:“A卷在这里,B卷在这里,C卷在这里……”。
你只需要向谷歌提交这一个索引文件的地址,谷歌就能顺藤摸瓜,找到并处理你所有的子站点地图了。
Sitemap Index File 示例:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.example.com/sitemap1.xml.gz</loc>
</sitemap>
<sitemap>
<loc>https://www.example.com/sitemap2.xml.gz</loc>
</sitemap>
</sitemapindex>
如何快速查找网站的 Sitemap 文件
在教你如何创建XML站点地图之前,我们先来检查下自己的网站是否已经自动生成了站点地图文件。
很多主流的建站系统,比如 Shopify 和 Wix 都会自动生成站点地图。
接下来我们就来看下,怎么快速找到这个特殊的 Sitemap 文件,方法从易到难。
1. 手动检查(最快最直接)
这是最方便的方法,你只需要在浏览器地址栏里,在域名后面加上/sitemap.xml,一般情况下(不同途径生成的站点地图文件后缀可能会不一样),也就是 https://domain.com/sitemap.xml,站点地图都会在这个位置。

如果你的网站上用 WordPress 搭建的,而且站点地图是用 Yoast 插件生成的,那么你需要去站点地图索引文件查看,在域名后面输入 /sitemap_index.xml。

如果页面能成功加载,并显示一堆代码,或者一个站点地图列表的话,那么,恭喜你,你的网站已经有站点地图了。
如果显示的是 404 错误页面,别急,我们试试下一种方法。
2. 利用 robots.txt 文件
robots.txt 文件是一个给搜索引擎爬虫看的指令文件,它会告诉爬虫网站上哪些页面可以抓取,哪些不可以。按照惯例,很多网站也会把站点地图的地址放在这个文件里。
你只需要访问 https://domain.com/robots.txt,看看文件里有没有一行以 Sitemap: 开头的代码,后面跟着的就是站点地图的地址。

接下来,你只要访问这个链接就可以看到自己网站的站点地图文件了。
3. 使用谷歌高级搜索指令
如果以上方法都找不到网站的站点地图文件,我们还可以求助谷歌。通过使用特定的搜索指令,我们可以让谷歌帮我们找。
打开谷歌搜索,尝试输入以下高级搜索指令(记得把 domain.com
换成你自己的域名):
- site:domain.com filetype:xml
- site:domain.com inurl:sitemap
- site:domain.com intitle:sitemap
这些搜索指令会告诉谷歌,只在你的网站里,查找文件类型为 xml 的文件,或者 URL、title 中包含 “sitemap” 字符的页面 。

4. 检查 Google Search Console
如果你已经为你的网站设置了 Google Search Console (GSC),那这个方法是最权威的。
- 登录你的 GSC 账户。
- 在左侧菜单中,找到“索引”这个大类,然后点击下方的“站点地图” 。
- 如果之前有人提交过站点地图,这里会有一个完整的列表,包含地址、状态和最后读取时间。

如果试完这几种方法还是找不到Sitemap文件的话,那就说明你的网站很可能还没有站点地图,是时候自己动手创建一个了。
如何创建站点地图文件
理论知识讲完了,接下来就是大家最关心的实战环节,怎么创建站点地图文件。
下面我会介绍三种主流的站点地图创建方法,你可以根据实际情况选择最适合自己的那种。
1. WordPress 插件一键生成(最推荐)
如果你的网站是使用 WordPress 搭建的,那么使用 SEO 插件来生成站点地图是最简单、最推荐的方法。
因为它们不仅能一键生成 XML Sitemap,还能在你发布或更新内容时自动更新站点地图,省去了所有手动操作的麻烦。
以最流行的 Yoast SEO 插件为例:
- 安装并激活 Yoast SEO 插件:在你的 WordPress 后台,进入插件 > 安装插件,搜索 Yoast SEO 并安装激活。
- 启用站点地图功能:进入左侧菜单的 Yoast SEO > 设置。在“站点功能”这个版块下,找到“XML 站点地图”这一项,确保它的开关是开启状态。这个功能是默认开启的 。
- 查看你的站点地图:然后点击“查看 XML 站点地图”链接。浏览器就会在新窗口打开你的站点地图索引文件,地址通常是 yourdomain.com/sitemap_index.xml。

除了 Yoast,像 Rank Math SEO 和 XML Sitemap Generator for Google 插件也是非常不错的生成站点地图的选择。
2. 在线站点地图生成器(适合所有网站)
如果你的网站不是用 WordPress 搭建的,或者你不想安装 SEO 插件,那么在线站点地图生成器是一个非常不错的选择。
我在这里推荐 XML-Sitemaps.com,这是一个非常老牌且广受好评的免费工具 。
操作步骤如下:
- 访问网站:打开浏览器,进入 https://www.xml-sitemaps.com/。
- 输入你的域名:在首页的输入框里,填上你完整的网站首页地址。
- 点击“Start”:点击开始按钮,工具的爬虫就会开始抓取你的网站页面。
- 下载文件:抓取完成后,点击下载 sitemap.xml 文件 。
- 上传到网站根目录:将下载好的 sitemap.xml 文件,通过 FTP 工具(如 FileZilla)或你的主机服务商提供的文件管理器,上传到你网站的根目录(通常是 public_html 或 www 文件夹)。
需要注意的是,这个免费工具有 500 个页面的数量限制。此外,这种方法生成的站点地图是静态的,当你网站内容更新后,你需要手动重复以上步骤,重新生成站点地图并上传到网站后台。

3. Screaming Frog 生成(高阶玩家必备工具)
如果你想完全掌控站点地图文件,且需要进行深度 SEO 审计的话,Screaming Frog SEO Spider 是一款非常推荐的 SEO 工具。
使用 Screaming Frog 生成站点地图的简要流程:
- 下载并安装:访问 Screaming Frog 官网下载并安装软件。它的免费版可以抓取最多 500 个 URL。
- 抓取网站:在顶部的输入框中输入你的网站首页地址,点击“Start”开始抓取。
- 生成站点地图:等待抓取完成后,点击顶部菜单栏的 Sitemaps > XML Sitemap 。
- 导出并上传:配置好选项后,导出 sitemap.xml 文件,然后像方法二一样,将它上传到你的网站根目录。

为了帮你更好地选择,我将这三种方法总结在下表中:
方法 | 优点 | 缺点 | 最适合 |
---|---|---|---|
WordPress SEO 插件 | 自动生成和更新,配置简单,与 SEO 工作流集成 | 仅适用于 WordPress 网站 | 所有 WordPress 用户,尤其是初学者和希望自动化操作的用户 |
站点地图在线生成器 | 适用任何网站,使用极其简单,无需安装 | 手动流程,文件是静态的(会过时),免费版有页面限制 | 非 WordPress 网站,或需要为小型网站进行一次性快速生成的用户 |
桌面爬虫工具(Screaming Frog ) | 拥有最大程度的控制和自定义选项,可用于审计,是专业级工具 | 学习成本较高,需要安装软件,需要手动上传文件 | SEO 专业人士,大型或复杂网站的所有者,需要进行详细技术审计的用户 |
如何提交站点地图到GSC后台
创建好站点地图并把它放到网站上之后,最后一步就是正式通知谷歌了,这个步骤我们需要访问 Google Search Console (GSC) 后台。
在开始之前,请确保你的网站已经验证了 GSC 所有权,不了解这是什么的话,可以看下我这篇博客的介绍:《GSC 使用教程》。
接下来就跟着我一步步操作:
- 登录 Google Search Console:访问 https://search.google.com/search-console 并登录你的谷歌账号。
- 选择你的网站资源:如果你的 GSC 账户管理着多个网站,请确保在左上角的下拉菜单中选择了正确的网站资源。
- 进入站点地图报告:在左侧的导航菜单中,找到“索引”这个大类,然后点击下方的“站点地图”。
- 添加新的站点地图:在报告页面的顶部,你会看到一个“添加新的站点地图”的区域。在输入框中,填入你的站点地图文件的相对路径。
- 如果你的站点地图地址是 https://yourdomain.com/sitemap.xml,你只需要输入 sitemap.xml。
- 如果你的站点地图地址是 https://yourdomain.com/sitemap_index.xml(Yoast SEO 生成的就是这种),你就输入 sitemap_index.xml。
- 点击提交:输入完毕后,点击“提交”按钮。
搞定!就是这么简单。
提交后,谷歌就会将你的站点地图加入到它的抓取队列中。
你可以在 GSC 的“已提交的站点地图”列表中看到你刚刚提交的文件以及它的状态。如果状态显示为“成功”,就代表谷歌已经收到了你的“书单”并能正确读取它。

如何利用站点地图进行网站审计
好了,现在你已经学会了如何创建和提交站点地图,可以说你已经掌握站点地图这玩意的基础操作了。
但如果你想让自己的谷歌SEO水平再上一个台阶,下面还有一些高级技巧让你学习。
大多数人只把站点地图当作一个提交工具,用完就忘了。但实际上,它还是一个非常强大的网站健康诊断工具。
我们可以用一个比喻来理解:站点地图就像是建筑的“设计蓝图”,它告诉我们这座房子理论上应该有哪些房间。
而用工具去抓取整个网站,就像是派一个“勘测员”去实地走一遍,看看实际上能走进哪些房间。当蓝图和实勘报告对不上的时候,就说明你的网站出了问题。
这个审计过程的核心,就是利用像 Screaming Frog 这样的专业爬虫工具,对比“站点地图中的 URL 列表”和“全站爬取后发现的 URL 列表”,从而揪出那些隐藏的 SEO 问题。
1. 发现孤岛页面(Orphan Pages)
孤岛页面指的是,它存在于你的站点地图之中,但在网站的内部链接结构中却无法被爬虫发现。
用更简单的语言解释的话就是,用户无法通过站内导航或任何链接访问这些页面。
这类页面无法获得权重传递,搜索引擎会认为它们不重要,从而很难获得好的排名。
那么,我们该怎么找到它们呢?
在 Screaming Frog 中,你可以配置它在抓取网站的同时,也处理你的站点地图文件。
抓取完成后,在 “Sitemaps” 标签页下,有一个专门的过滤器叫 “Orphan URLs”,这里列出的就是所有只存在于站点地图、但在网站上找不到任何链接的孤岛页面。
2. 发现站点地图中的无效页面
无效页面指的是你的站点地图中包含了一些本不应该被收录的页面。最常见的就是那些带有 noindex 标签的页面。
这会向谷歌发送极其混乱的信号:“嘿,请通过我的站点地图收录这个页面!哦对了,这个页面上有个 noindex 标签,请不要收录它。”
这种矛盾的指令会浪费谷歌宝贵的抓取预算,也可能影响它对你网站的信任度。
那么,我们该怎么解决这个问题呢?
在 Screaming Frog 抓取完成后,你可以查看站点地图中的所有 URL,然后结合 “Directives” 标签页下的 “Noindex” 过滤器进行分析,找出那些同时存在于站点地图和 Noindex 列表中的 URL。
3. 识别被遗漏的重要页面
上面说完孤岛页面和无效页面,怎么又来个重要页面,这是什么情况?
其实这是和孤岛页面相反的问题。
爬虫在你的网站上通过内部链接发现了很多重要的页面(比如新发布的博客文章或核心产品页),但它们却没有被包含在你的站点地图中。
这会延迟这些新页面的发现和索引过程。你等于放弃了主动通知搜索引擎的机会,只能被动等待它自己来发现。
那么,我们该怎么挽回之前那些被忽视的收录机会呢?
同样在 Screaming Frog 的 “Sitemaps” 标签页下,有一个过滤器叫 “URLs Not In Sitemap”。
这里列出的,就是所有在网站上被爬虫发现了,但却不在你站点地图里的页面。看到这个列表,你就该去检查为什么你的站点地图没有及时更新了。
关于站点地图的常见问题解答 (FAQs)
在和很多朋友交流的过程中,我发现大家对站点地图总有一些反复出现的疑问。这里我把最常见的几个问题整理出来,并给出最直接的解答。
1. 站点地图大小有限制吗?
有。单个文件大小不能超过 50 MB,且其中的网址数量不能超过 50,000 个,Google Search Console 账号最多能提交 500 个站点地图索引文件。
2. 有了站点地图是否就可以忽视内链了?
不可以。站点地图不能替代网站的内部链接结构,优质的内链结构可以帮你合理的分配页面权重,比如说,首页的权重一般比较高,那么从首页链出的链接权重也会高点。
3. <priority> 和 <changefreq> 这两个标签还有用吗?
这在以前有用。但是现在,谷歌官方已经明确表示,他们几乎完全忽略了 和 这两个标签。
因为 priority 的设定主观性太强(每个站长都觉得自己的页面最重要),而 changefreq 的信息也常常不准确。
谷歌现在更倾向于通过页面的 lastmod(最后修改时间)标签、内部链接结构和历史更新数据来判断页面的重要性和更新频率。
所以,我的建议是:不用在它们身上浪费时间。如果你使用的工具自动生成了这些标签,保留默认值即可;如果你的工具已经不再生成它们,那也完全没问题。
4. 我提交了站点地图,为什么我的页面还是不被收录?
这是一个非常常见的问题。大家要搞清楚一个核心原则,提交站点地图只是“敲门”,它保证的是“可发现性”,但并不保证页面一定会被“收录” 。
页面不被收录的原因可能非常复杂,站点地图只能解决“发现”这一环的问题。其他常见原因包括:
- 内容质量问题:内容原创性低、价值不足、或者被谷歌的算法判定为“对用户帮助不大的内容”。
- 网站权重问题:新站的权威性(Authority)较低,谷歌对其信任度不够。
- 技术性问题:页面被 noindex 标签屏蔽,或者被 robots.txt 文件错误地禁止抓取。
- 内部链接不足:页面是“孤岛页面”,缺少来自网站其他页面的内部链接支持。
5. 我一定要提交站点地图文件吗?
不一定,你可以根据实际情况选择要不要提交站点地图文件。
大型网站强烈建议提交站点地图,便于搜索引擎抓取你的网页。
但是,如果你的网站总的页面数量很少(不超过500个),并且你的内链建设的特别完善,爬虫可以沿着首页链接找到所有网页的话,你可以不提交站点地图。
有一点需要注意的是,重要页面必须都是 dofollow 链接,不清楚什么是 dofollow 链接的话,可以查看我之前写的一篇博客,详细介绍了 dofollow 链接和 nofollow 链接的区别。
如果不能保证自己的内链建设的非常合理的话,我还是建议大家提交站点地图,毕竟也不是什么很麻烦的事。
站点地图总结
看了上面的介绍,相信你对HTML和XML站点地图有了一个全面的理解。
虽然它不能直接促进页面的排名,但它能增加我们网站的页面被搜索引擎发现的机会。
还有一个误区要避免,那就是,只有被收录的页面,才能有机会获得排名,收录不代表排名。
我们在提交了站点地图之后,也别忽视了站内链接的重要性,因为谷歌 SEO 排名因素有很多,而且很复杂,我们只有将各个细节都做好,网站获得排名的机会才更大。
如果你在操作过程中遇到任何问题,或者有关于站点地图的更多想法,非常欢迎在下方留言,我们可以一起探讨!