分析百度不收录内页的原因及对策
首先,让我们来了解一下百度蜘蛛爬行的规则:百度蜘蛛从首页登陆然后抓取首页,调度会计算其中所有的连接,返回给百度蜘蛛进行下一步的抓取连接列表,百度蜘蛛再进行下一步的抓取,网址地图的作用是为了给百度蜘蛛提供一个抓取的方向,来左右百度蜘蛛去抓取重要页面。可以通过连接的构建来达到让百度蜘蛛知道哪个页面是重要页面的目的,越多的页面指向该页,网址首页的指向,父页面的指向等等都能提高该页的权重,地图的另外一个作用是给百度蜘蛛提供更多的连接来达到抓取更多页面的目的,地图其实就是一个连接的列表提供给百度蜘蛛,来计算你的目录结构,找到通过站内连接来构建的重要页面。
那么我们如何迎合蜘蛛的口味呢!首先就是网站的基础:代码 ——精简的代码页,尽量减少信号复杂的网页。再来就是网站的导航:使用文字导航,添加ALT标签和FLASH。第三就是要做好网站内部结构优化,网站的目录,最好不超越3层,即最多三分命中达到页面。当然最好的站点,有时需要更多的需求目录层次,如网页一般的B2B平台的目录,会更加深,但应该是最少的点击数可以达到本网站的任何页面。第四.内链必须方便。我们的网站是四通八达的内部链接,这样不仅可以提高网站蜘蛛好感度,还可以提高网站的用户体验,还可以促进网站更好的权重传输。第五。网站更新必须勤奋,并持之以恒。
“收录”——百度收录永远是SEOer们讨论的关键话题,在搜索引擎网站优化的战争中,能够得到稳定的收录会直接影响到网站的流量。接下来我们就来讨论一下网站只收录首页不收录内页的原因及解决办法。
1.robots设置问题会导致网站内页不受到搜索引擎的索引
对策:检查是否语法错误屏蔽到了蛛蛛的爬行,其中包括:metarobots与nofollow等标签的设置。
2.百度己经收录了但还未把页面放出来,百度对文章的收录也是需要审核时间的,蛛蛛抓成功的索引内容会录入到数据库,这也是需要经过二次的审查是否被判为SPAM然后才放出来并参于排名,具体放出的时间与网站的权重高低有着相对的直接关系,而百度周期更新时才放出收录较为常见的为新站。
对策:在网站安装百度统计工具,在统计工具可以看到每天的索引量,只要索引数量有增加,那么你需要做的就是保证内容定期定量的更新,并进行对网站日志的观察及分析,只要蛛蛛正常爬行,那么你就可以静心的等待着,百度会给你一个惊喜。
3.网站的内部链接存在问题,在网络营销时比如造成了大量的错误链接,不良链接,蛛蛛爬行的不通畅,或根本无法抓取,那么这些不良的网址也会导致您网站降权。
对策:百度针对网站的首页,频道等各个重要的页面进行做错误的链接检查,会检查到留言板,评论版块,等等网友能互动的功能之不良链接,尽量避免不良网站互链。
4.与文章的原创度相关,头部标签的设置会导致页面类似的重复,或者是采集的页面太多时,百度数据库中己存有大量的相似信息而不收录,如果是长期的这样操作会导致降权,不仅是百度,连谷歌也是一样。
对策:多些保持文章的原创度(高度伪原创)质量比数量重要,最好是每天都能够定时定量的更新,这样百度对你的网站抓取也有了守时的好习惯。
5.服务器访问情况,如无法访问,速度缓慢,被挂马等情况。在百度蛛蛛来索引内容时,多次识别网站有着大量的错乱码或者是遇到了服务器无法访问,那么网站也会因此被降权,我们的网站前段时间就是这样,服务器宕机两天网站损失惨重。
对策:做好网站代码优化,提高页面的读取速度,选择好安全的空间服务商,成熟的网站程序编码,并定期的更新补丁,定期对修改文件痕迹做好跟踪,稳定快速的服务器是保证网站快速打开和优化的前提也是基础。
6.网站在推广的过程中使用了不正当手法或者是作弊手法,百度识别后就会对网站进行降权。
对策:做正规的优化,执行力加强,百度是不会对你使用正确方法的付出不给回报的,而且这个回报一向都是可喜的。
7.title、keywords、description、网站结构、模板这些元素千万别频繁修改,每修改一次,就会降低网站在搜索引擎中的信任度。这一点是最最重要的,网站被降权90%的原因在此。
另外,1、网站内部链接很重要,做好内部链接不仅可以提高网页与网页之前的互通性,方便蜘蛛抓取,同样也方便客户浏览,提高用户体验,同时提高网站内页排名。
2、内页的相关链接调用一定要规则化,让每一个页面的主题都醒目突出。
3、外部链接可以适当的做一些内页蛛蛛引导,并在每个细节上都能把握好,让自己放心。
- 上一篇:关于网站被降权的原因
- 下一篇:“电子政务”知识普及