为什么百度只收录新网站首页,不收录内页?

今天再次用site:farlee.info查询本站在google搜索引擎上的收录结果有40几条,再在百度上查询收录数,发现百度仍然只收录我这个新网站的首页。不禁有些疑惑,为什么百度只收录我的网站首页,而不收录内页呢?下面我们就来分析百度不收录新站内页的原因和解决办法。

现在的情况是网站页面在google上的收录正常,而在百度上只收录了首页,这个很容易解释,因为gg和baidu采用的是不同的算法,收录数肯定 会有差异。那为什么百度不收录内页?我们可以先去看看网站访问日志,发现Googlebot(google蜘蛛爬虫)和BaiDuSpider(百度搜索 引擎机器人)都是基本上每天都会来网站爬一次,也就是说百度蜘蛛并没有将网站抛弃,而是把站点列入了每天都要爬行的任务列表中。

从上面的分析我们得出一个最恰当的原因就是,百度搜索引擎对一个新网站都有一个审核期,根据站长们的经验,这个审核期可长可短,一般短到7天,长到 3个月都有可能。在审核期内,百度搜索引擎蜘蛛爬虫会抓取新网站适当的页面加入索引数据库,只是暂时不显示在搜索结果中罢了。一旦通过百度的新站审核期, 瞬间将会有大量的网站内页被百度收录。所以如果新网站内页暂时没有被百度收录,也不用太担心,只要一直坚持做好每日更新等本职就OK了。除非你的网站存在 下面的问题:

1. 新网站优化过度:检查你的网站首页和内页是否优化过度,是否关键词密度过高,堆叠严重的问题,是否做了一些xx手段。是否经常修改,如描述语description和网站标题title。新网站一般都存在这样的问题,就是早期会不断地调整标题和meta标签以提高用户和搜 索引擎友好度,我的网站也是这样,一直在作相关的调整,百度搜索引擎对此是比较敏感的,所以{zh0}在网站上线前,本地测试的时候就将这些优化工作做好,确定 上线以后,忌一直修改。

2. 网站重复页面问题:一方面百度搜索引擎(google也一样)会检查你的页面是否属于内容采集站,复制了大量的站外内容。如果有这样的问题,{zh0}尽快在首 页添加一些原创文章或者经过稍作修改的“伪原创”内容页面的链接。另外一方面是站内的重复页面问题,首先检查是否存在问题,另外检查你的网站内部两个不同页面的相似度是否过高,这也会引起搜索引擎的反感,尽量减少页面上的这种重复性内容,比如 google在网站管理员指南中提到,页面底部大量的版权声明文字可以放到一个单独的页面中,页面底部只设置一个超级链接即可,这样就大大减少了重复页面 相似度。不过搜索引擎技术越来越先进,蜘蛛爬虫能够应用对高相似度网页的消重技术进行内容索引(也就是搜索引擎算法中,机器人会将站内的多个页面进行分析 比较,提取出内容一样的网页模板文字,然后将这些重复内容消去,对内容不一样的文章正文进行排名算法索引)。Google等在这方面的技术应用比较成熟, 但考虑到其他搜索引擎,还是应当尽量减少重复文字。

3. 链接:包括外部链接和网站内部链接;网站内部链接设置是否合理,检查网站是否存在死链接,{zh0}能够提交网站地图sitemap给搜索引擎;外部链接,根据 一些站长经验,在新网站的首页添加指向大站(如百度)的外部链接能够加快首页和内页被收录的数量。同时还要将自己的网站链接发到外部网站中去,增加自己网 站高质量的外部链接。{zh0}检查是否加入了垃圾链,应当避免。

4. 其他原因:除了上面几个百度不收录内页的主要原因,还有其他各种各样的原因,比如你的网站主题是否合法,网站架构混乱,死链接过多,网站域名曾经被K,网 站空间不稳定或者有不良记录,网站弹窗广告过多,存在木马等等…

如果上面这些问题都解决了,那么就不怕百度不收录内页了,{zh1}就耐心等待搜索引擎全面收录你的页面吧。

留言

郑重声明:资讯 【为什么百度只收录新网站首页,不收录内页?】由 发布,版权归原作者及其所在单位,其原创性以及文中陈述文字和内容未经(企业库qiyeku.com)证实,请读者仅作参考,并请自行核实相关内容。若本文有侵犯到您的版权, 请你提供相关证明及申请并与我们联系(qiyeku # qq.com)或【在线投诉】,我们审核后将会尽快处理。
—— 相关资讯 ——