创新易联欢迎您!16年高端网站建设品牌

深入了解搜索引擎原理第二课

日期:2014-08-27 | 来源:易联网站建设公司 | 阅读:

上一节主要讲解了google搜索引擎更新爬虫,和深度爬虫。

更新爬虫:Google搜索引擎可以同时派出N个爬虫,同时访问互联网,如果发现新的信息就会放到自己所带的数据库中,我们把这种爬虫称之为“更新爬虫”。更新爬虫能够根据互联网上的URL地址,不停的以“光速”爬行,一旦自己所带的数据库装不下更多的信息时,它们会返回谷歌所提供的单独数据库,把自己所带的信息放在里面,然后又出来接着收集信息。

深度爬虫:深度爬虫的主要任务是访问google主索引中已经存在的网站,进行整体的服务器更新,目前google深度爬虫几乎可以每天更新一次,所以如果不注意观察是根本察觉不到的。但是百度深度爬虫的时间就要长一点,大概是一周进行深度爬行一次,所以许多做百度的seo,都盼望百度深度爬行,因为百度深度爬行,就意味着,自己上一周的工作将被百度肯定。

今日重点

这一节将讲解google搜索引擎的具体工作流程,以及如何为我们提供搜索结果。

第一步:google服务器整理,google每天派出大量更新爬虫,到互联网发现新的网站信息,然后带回google服务器等待进行整理。

第二步:Google服务器进行整理后,索引到google主索引中去,将没有被索引的信息进行删除。

第三步:Google服务器整理,每天放出google深度爬虫,爬行主索引,对资料采用关键词排名算法进行计算,列出名次,数据库稳定。

第四步:用户输入主关键词时,GG服务器,将用户输入转换为计算机看的懂的内容,并向主索引索取答案。注意:GG服务器向主索引索取的答案是由:GG主索引内容+更新爬虫内容 一起组成的。

第五步:主索引将关键词列表转换成字符流,交给GG服务器,GG服务器,再将答案显示给用户。

Google何时开始为您打分

以上便是google整个工作流程,对此工作流程比较有争议的是:google何时开始给您的网站关于某个关键词打分。

据笔者观察,google是在爬行您的网站,收集网站信息时就开始记录您网站表现,关于网站的结构是否友好,网站链接相关度是否足够高,网页代码是否友好。等这些排名因素。等到google服务器放出深度爬虫时,主索引根据排名算法进行排名时,更新爬虫会把自己的数据也递交给主索引,帮助排名算法进行工作。

Google提供的搜索结果

对于许多seo来说,google只有一种搜索结果--内容关键词结果。其实google提供的关键词搜索结果还有一种特殊结果--图片,pdt文件等。笔者建议各位seo适当的关注特殊搜索结果。

要知道在未来,并不是单单内容搜索才能获得客户。

—— 微信公众号 ——

热门标签