位置:首页 » 文章/教程分享 » 优化Sitemap文件促进网站收录

很多做SEO的小伙伴在谈到SEO的时候,说的最多的是如何提升关键词排名,做SEO,我们要关注排名,同时我们更要关注最根本的问题,就是首先得让搜索引擎收录。本文围绕如何解决网站收录这个主题为大家讲解一下正确利用Sitemap促进网站收录。


网站地图简介

网站地图是一个网站所有链接的容器,是根据网站的结构、框架、内容,生成的导航网页文件。

网站地图分为两种:

普通Html格式的网站地图:它的目的是帮助用户对站点的整体结构有清晰的了解,同时帮助用户方便找到对应的栏目。Html格式的网站地图根据网站结构特征制定,尽量把网站的功能结构和服务内容富有条理地列出来。一般来说,网站首页有一个链接指向该格式的网站地图。

例:http://www.codeinn.net/map.html

XML Sitemap :通常称为Sitemap(首字母大写 S),而不叫“网站地图”。简单来讲,Sitemap 就是网站上链接的列表。制作Sitemap文件,并提交给搜索引擎可以促进网站的内容被尽快收录,包括那些隐藏比较深(层级比较深)的页面。这是一种网站与搜索引擎对话的好方式。

例:http://www.codeinn.net/sitemap.xml

创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。

Sitemap文件详解

目前国内主流搜素引擎(百度、好搜、搜狗)Sitemap协议都支持文本格式(txt)、xml格式、Sitemap索引格式三种格式的Sitemap文件,咱们今天主要针对百度搜索引擎为大家讲解Sitemap xml文件的格式及制作方法。

一、Sitemap xml文件格式详解:

单个xml数据格式如下:

<?xml version="1.0" encoding="utf-8"?>

<!-- XML文件需以utf-8编码-->

<urlset>

<!--必填标签-->

<url> 

<!--必填标签,这是具体某一个链接的定义入口,每一条数据都要用<url>和</url>包含在里面,这是必须的 -->  

<loc>http://www.yoursite.com/yoursite.html</loc>

<!--必填,URL链接地址,长度不得超过256字节-->

<lastmod>2014-12-14</lastmod>

<!--可以不提交该标签,用来指定该链接的最后更新时间-->

<changefreq>daily</changefreq>

<!--可以不提交该标签,用这个标签告诉此链接可能会出现的更新频率 -->

<priority>0.8</priority>

<!--可以不提交该标签,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间-->

</url>

<url> 

<loc>http://www.yoursite.com/yoursite2.html</loc>

<lastmod>2015-05-01</lastmod> 

<changefreq>daily</changefreq>

<priority>0.8</priority>

</url>

</urlset>

若有多条url,按照上述格式重复<url></url>之间的片断,列明所有url地址,打包到一个xml文件。

如何创建sitemap文件

Sitemap文件的创建建议大家使用工具生成,比较简单方便、而且不容易出错。推荐大家使用Sitemap X这个免费工具创建,下载地址(http://cn.sitemapx.com/)

具体创建步骤:

第一步:下载安装Sitemap X工具;

第二步:新建工程

第三步:1)输入正确的网址  2)设置抓取文件深度,一般选择5,确保网站页面都能被抓取到。3)抓取页面超时时间及最大抓取量默认。 4)根据网站网址类型选择对应的网址类型。然后点击下一步:

第四步:每页最大网址数量根据网站页面多少合理选择,上次修改时间可选择自动,让系统自行抓取,这个值对应的是lastmod的属性值,更新频率选择always,这个值对应的是changefreq的属性值。权重值根据页面的层级逐级递减就OK。然后点击右下角抓爬~~~~

第五步:等待抓爬完毕,点击下一步 

第六步:点击右下角的生产xml文件,然后选择打开文件目录

第七步:打开文件夹,就能看到已经生产的不同格式的sitemap文件

如何正确提交Sitemap文件

第一步,将需提交的网页列表制作成一个Sitemap文件

第二步,将 Sitemap文件放置在网站目录下。比如您的网站为example.com,您已制作了一个sitemap_example.xml的Sitemap文 件,将sitemap_example.xml通过FTP上传至网站根目录即example.com/sitemap_example.xml第三步,登录百度站长平台,确保提交Sitemap数据的网站已验证归属。第四步,进入Sitemap工具,点击“链接提交”—“自动提交”—“Sitemap”,填写正确完整的Sitemap文件地址,选择提交。最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的网站链接,可以选择文件后,点击更新所选,即对更新的网站链接进行了提交。

注意事项

  • 百度对已提交的数据,不保证一定会抓取及索引所有网址。但是,百度会使用Sitemap中的数据来了解网站的结构等信息,这样可以帮助百度改进抓取策略,并在日后能更好地对网站进行抓取。 此外,Sitemap 与搜索排名没有关系。 
  • 一个Sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的Sitemap超过了这些限值,请将其拆分为几个小的Sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。
  • 一个站点支持提交的sitemap文件个数必须小于5万个,多于5万个后会不再处理,并显示“链接数超”的提示。 
  • 如果验证了网站的主域,那么Sitemap文件中可包含该网站主域下的所有网址。