百度的收录和清除站点规则解密。
2010-03-04
在网上见到一网友发的一个帖子,要求百度制定搜索收录规则,而实际上百度早就已经制定了名为百度与站长的建站指南,公布了如何让网站被百度收录,什么样的网站会被百度拒绝收录或抛弃等相关条款。在我的《百度反作弊手段失去公信力》一文中,我提到:这些条款太过笼统,而在实际中可以被其意解释和曲解,并无实际的操作意义。那么,本文,石头就针对百度对应的拒绝收录和惩罚站点的相关条款进行分析.以让更多的人了解百度的相关规则。
百度相关规则的全文见于《百度与站长》,仔细阅读完毕,可以得出,一个站点被百度拒绝收录或惩罚的可能原因有如下几条(注意:每一条后面加上了对应的分析):
1、在标题中堆积与正文无关的关键词。
强调了标题和网站内容的相互呼应,如果标题中涉及到某一关键词,而实际网站内容中与该关键词无关的话,那么可能会百度删除.这一条款反映了百度的严格.但值得思考的是,百度是用什么方法去判断网站的内容与标题关键词的相关性呢?是不是标题出现了某关键词,正文就一定要出现呢???如果不是,那么百度目前的搜索技术难道能象人一样,会从意义和逻辑上去分析?比如机器能不能判断区标题中的亚克力跟正文中提到的有机玻璃是同一个意思呢?当然,如果百度全部采用人工审核站点,那么这一条就非常好,非常有操作性!但是这样又出现一个问题,人工审核相关不相关,以谁的说法为准?
2、使用自动跳转的页面,可能会被百度丢弃。
这一条不需多评论,主要针对一些作弊行为采用的跳转.大多数搜索引擎都会有类似的条款.
3、在同一个页面上,不要有过多链接。在那些站点地图类型的页面上,请把重要的内容给出链接, 而不是所有细枝末节。链接太多,也可能会导致无法被百度收录.
究竟多少连接,才算过多??Google好呆还建议最好不要超过100个,百度呢?百度凭这一条就可以任意的惩罚大部分的大型站点,大部分的大型站点首页都有了那么好几十个甚至好几百个连接的.
4、如果您的站点做了很多针对百度的优化,但却给用户带来大量负面体验,那么,您的站点最终可能还是会受到百度的冷落。
什么叫过多针对百度的优化呢?能不能有详细一点的标准?虽然这句话的意思是非常好,似乎任何一个有良知的网民都应该叫好,但是关键问题在于具体操作标准是什么?过度优化和负面体念,任何人都有不同的看法。比如我就是觉得百度搜索结果第一页全是广告,影响了我的感受,是不是该删除?