互联网上的网站是数以万计,按照不同是搜索标准进行对每一个网站评分排序,每一个网站都有可能进入索引排名的机会,也有可能在任何一个关键词下都寻找不到他的踪迹,要想搞懂这些,那么首先你就要了解搜索引擎的工作原理。
那么网站这么多,他是怎么进行排序的呢?首先我们要知道搜索引擎是用户通过关键词搜索让网站与用户见面的,那么关键词就是网站与用户一个工具,而搜索引擎就是一个桥梁。就好比我们从河西走过河东,其间有搭建一座桥,连接着河东与河西两个不同的市集,这座桥就是搜索引擎,而我们是通过马车这样的交通工具通过的,那么这个工具就是关键词。而在桥的出口处有不同的指标,什么样的车可以通过什么的路径,这个也必须按规则行走。紧接着看到第一商铺就是排名第一位的网站,第二个商铺就是排名第二位的网站,以此类推。让每个用户都能找到自己的所需。
首先我们要明白,无论网站有多大,搜索引擎索引排名出来的都是一个网页而已,而不是针对一个网站的排名。只是通常情况下一个网站的首页权重很高,所以首页的排名就容易排上去,而我们是进入首页后,根据网站内部的相关链接而实现浏览的。进入首页后就已经不再是搜索引擎的工作范围了,他已经引导你去到一个地方,剩下的就由你自己决定了。
一个有搜索结果的网站,他的轨迹路程就是搜索引擎的蜘蛛进行爬行和抓取,然后建立索引,然后进行页面去重,关键词分词、信息记录等等,然后根据分词再进行关键词排名。一切好似都十分顺利进行,但事实真的就是如此简单吗。好似我们已经忽略了一个事实,那些无数淘汰的网站呢?好似忽略了一个步骤一样。
其实,当用户在搜索引擎检索信息时,搜索引擎首先派蜘蛛从索引区出发,在互联网中抓取网页,然后放到临时库中,在临时库中的网站若还有其他链接,蜘蛛会顺着链接进入下一个页面,再把这个页面抓取放到临时库中,这样不断的循环。当然很多页面都有重复内容,蜘蛛不可能无限制的重复抓取,这样是很消耗的效能的。去重就是对网页的一个很大的处理机制,即便是两个相同的内容,不同的链接也要去除掉一个链接,并打入小黑屋。临时库中审批一部分不行的或者重复的网页丢弃后,剩下的建立索引,进一步筛分,通过分类、整理、排序,把优质的网页派在前列供用户浏览。
所以我们经常会看到,蜘蛛在我们的网站上有爬行无抓取,有抓取无索引,有索引无排名等等这样情况出现,这都是很正常的。所以根据蜘蛛的习性,什么样的网页容易被拉入小黑箱,什么样的内容不受欢迎,趋利避害,就可以让我们的网站做的越来越好,排名也会靠前并给我们带来收益。
致远网络(http://www.lzzhiyuan.com)
发表评论