Google周期性地公布已设计好的新服务,帮助Web站点管理员处理对站点访问的数据过剩问题或帮助他们捕获更多网络堵塞。其中Google近期支持的一个服务是,通过努力使网虫们能够在站点发现新内容并且通过Google搜索很快得到它们。
在文章中,我将给出Google站点当前处理的具体细节,并且提供示例演示如何获得站点图以及如何运行。我使用http: //www.allinvites.com作为示例站点,这个站点是我妻子的(我已事先征得她的同意)。正常情况下,我使用假设的站点,但是由于本文的目的,我使用到一个小而生动的站点。
具体细节
我已经提到过Google站点图在高层的目标,但是确实还是有很多的服务和警告。首先,Google指出站点图不会危害或帮助站点在Google的队列。实际上,Google已经在站点图FAQ中明确指出:“使用站点图不会影响PageRank(搜索引擎使用的一种网页重要性评估方式,它的值决定了网页在搜索结果中的排名)值,这对于如何计算网页的Ranking值毫无改变。”但是,网页的Ranking值由于以前没有被编入索引而现在被编入 Google索引而升高。我的感受是:如果仅仅为了提升网页的Ranking值,则不需要使用站点图。如果最终Google正式指出站点图可以用于此目的或者你想从站点图获取些别的利益,你可以尝试采用这个方法。
Google没有必要为你所提交的所有网页都制作索引。例如,如果在自己的站点提交URL,而此URL在robots.txt文件中是受保护的,则 Google的网虫们将尊重在robots.txt文件中的设置而忽略提交给站点图服务器的任务。第二,Google不保证所有提交的网页都得到处理,但是提交的站点图仍会被Google的网虫们所使用以了解站点更多信息。正如Google所说的,向站点图提交信息只会帮助你而不会危害你。
与其不显眼的潜在下降相比,站点图是一个很好的服务。首先,它甚至对于商业用途都是免费的。尤其对于那些身无分文的流浪者来说,这从来就不是件坏事。第二,站点图的一个要点就是高效的帮助人们更快的获得站点的索引。通过站点图比通过手工提交可以更快发现和处理你的网站、新的内容和内容的变动。
最后也是最重要的,Google提供了站点图相关的报表工具可以收集到如下的很多方面的信息:
- 查询统计:提供Google搜索用到的和返回关于你的网站的有关查询信息。
- 处理统计:提供关于处理成功或失败的信息和PageRank信息。
- 网页分析:提供站点的页面类信息例如何种类型网页和网页编码等总结信息。
- 索引统计:告知站点是如何被索引的,例如,可以获得一个关于站点的索引列表,一个站点的链接列表,并且可以查看 Google关于你的站点存储信息和其它更多的信息。
使用Google站点图
现在你对于Google站点图能帮你解决那些问题有了更好的理解了,那么,就让我们进入到如何使用这种服务中来吧。
充分利用站点图有3个步骤:
- 为你的站点创建站点图。
- 将创建好的站点图添加到Google帐户。
- 使用Google的报表和统计工具。
创建站点图
Google的站点图服务用到的站点图创建是采用Google自定义的开源的使用XML语言的“站点图协议”来给服务器提供你的站点关于设计方面的信息。Google甚至给你提供Google站点图产生器,它可以很有趣的为你创建现成的Google站点图。
如果要满足下面几项要求,则使用Google站点图产生器是你最好的选择:
- 可以在网络服务器上运行Python2.2+脚本。
- 通过某些方式可以向网络服务器上传文件。
- 如果要使用access日志产生站点图,必须知道这些日志的编码方法。
开始时,需要有Google站点图产生器。因为我的示例站点建立在Linux服务器上,所以下载了产生器的“tar.gz”版本。我的主机支持运行Python脚本程序并且我使用的是Python 2.2.3版本。
将下载的命名成sitemap_gen-x.x.tar.gz文件放置于服务器的某个位置。我将下载的文件放在示例位置的根目录上。下一步,使用“gunzip”命令解压。
Gunzip –dc sitemap_gen-x.x.tar.gz | tar xvf
文件的内容将被解压到去掉“.tar.gz”后缀名的文件夹中。
在此文件夹中,找到example_config.xml文件 并将其拷贝到config.xml。编辑这个文件,注意下面几个必需(有些是可选)的参数。