从flight cases B2C网站中发现百度谷歌抓取和收录方面的几个差异

3月1日开始着手制作一个B2C类型的新网站,在本地调试完毕后上传到空间。这个网站无论从域名、空间还有网站内容都是全新的,域名和空间是当天注册和购买的,flight cases B2C网站具观察了百度和谷歌的蜘蛛抓取情况以及新站收录的整个过程。对于一个全新的网站,百度和谷歌在爬取网站内容和收录过程都有许多差异,主要表现在以下几个方面:
 
一、蜘蛛抓取差异
 
作为flight cases B2C网站seoer,我一直喜欢观察蜘蛛行踪,在许多站长群里面被称为“蜘蛛侠”,就是来源于我的这个习惯和爱好。这次上新站这样的机会是肯定不能错过的。网站内容上传完毕后,首先去几个门户论坛发帖回复引蜘蛛,几个小时后访问日志已经产生了,百度蜘蛛的速度较快,在谷歌之前来到了网站。通过日志查看,谷歌的蜘蛛非常有趣,反复爬取robots文件10多次以后才小心翼翼的抓取首页,之后一边爬取robots一边抓取网站内页。而百度蜘蛛则显得比较着急。
 
从过程可以看出,谷歌的蜘蛛比较有礼貌和注重礼仪规矩,会反复敲门得到陌生新主人许可后才进去,之后的每一个行为都参照robots规则来进行内页的抓取,让我想起了解放军的三大纪律八项注意,在这里赞一个。而百度蜘蛛忽略robots,进门反复咬首页10多口才放手的行为,让人感觉很暴力很野蛮,蜘蛛吃完首页继续吃内页,这个过程中百度蜘蛛完全无视robots文件的存在。
 
二、网站收录差异
 
几小时后site谷歌,已经收录了新站的2个页面,其次是搜搜在24小时内收录了首页。新站到现在为止已经诞生30多小时了,而百度至今还没放出首页。由于搜索机制和规则不一样,目前来说新站收录效率来讲谷歌最给力,百度慢了好几拍。
 
以上分享的是flight casess商品网seoer的新站在谷歌和百度抓取和收录过程中的差异,希望通过这个案例,给研究SEO的朋友和需要上新站的朋友一些学习参考和灵感,让你更了解谷歌百度的抓取规则和收录流程。

▼ "从flight cases B2C网站中发现百度谷歌抓取和收录方面的几个差异" 的相关文章:

杀死一只蜘蛛

    老头儿说有一只蜘蛛趴在卫生间的接线板儿上,一脚搭零线一脚搭火线,样子很找死。那就让它死吧。我见他匆匆回房,取了杀虫剂来,举手无回地,喷,喷,喷,它便狼奔豕突地,逃,逃,逃,逃得越快死得便越快吧——金庸的故事里,人们总在毒发之前提神运气,延缓着等死——爬虫不读武侠。它死的时候我正在刷牙,眼见它爬上镜子,然后一寸一寸地,滑,滑,滑,滑进洗手池,有那么两三条腿,还在不甘地,晃,晃,晃;如果我吐掉这口水,它就会随着泡沫,滚,滚,滚,顺着管道,流,流,流,依着七月的湿热,腐,腐,腐……寿数了...
E健网知识分享 © 2012
本站所有内容均为网上收集,如果违反版权请发邮件至 ask#ej38.com (#替换成@),将在48小时内删除