作为中文搜索引擎的两大巨头,百度和google在网站收录方面,各自有着自己的侧重点和收录原则,对于大型网站(比如门户新闻网站)以及其他更新量大的网站,百度和Google的索引速度都很快,基本上都能做到当天更新。但是对于一些更新量小的网站,两者就有比较明显的区别,Google对于高权重并提交Sitemaps和Ping的网站,索引速度可以达到分钟级别,比如几分钟就可以在搜索排名中看到自己刚刚编写的文章,但百度索引速度较慢,如果不是权重较高的站点,有可能一天、三天甚至更久才被收录。总体来讲,百度对于网站首页的关注以及权重给的似乎特别高,而Google对于最终的文章内容页面的关注多于百度。
作为全球最大的多语言搜索引擎,Google在发展历史过程中已形成了自己的网页收录习惯,也建立起自己的一套标准。研究Goolge收录网页的习惯有利于更好地迎合Google搜索引擎的口味,达到提高网页收录量和收录排名的目的。
Google PageRank能够对网页的重要性做出客观的评价,PageRank并不计算直接链接的数量,而是将从网页A指向网页B的链接解释为由网页A对网页B所投的一票。这样,PageRank会根据网页B所收到的投票数量来评估该页的重要性。谷歌的搜索引擎同时也分析网页内容,他并不采用单纯扫描基于网页的文本(网站发布商可以通过元标记控制这类文本)的方式,而是分析网页的全部内容以及字体、分区及每个文字精确位置等因素,Google同时还会分析相邻网页的内容,以确保返回与用户查询最相关的结果。
百度对于新站一般都不会立刻收录,并且在相当长的时间内都不会收录,当新网站在搜索引擎有了一个不错且稳定的表现,并且有了较多的反向链接,会出现一个阀值。百度判断其网站内容的质量,会开始收录这个新站点内容,这时候网站才会出现来自百度的流量。而百度似乎对于自己的网站(百度知道、百度空间、百度百科等)给予较高的权值,并且更青睐于那些更新频繁的大型门户网站,而对于反向链接似乎没有给予太多的权重。
综上所述,从网站收录速度上来看,Google现在比百度要快,不过由于百度的用户更多一些,所以网站搜索来源大多还是来自于百度,在搜索引擎中的份额约占70%左右。