来源:自学PHP网 时间:2015-04-15 10:59 作者: 阅读:次
[导读] 网站遭降权的原因很多,笔者这里记录一段比较痛苦的经历及成功的恢复。笔者所在公司运营的站点已经超过十年,十年前的网页结构和网站构架都有显著的变化,笔者的站在2012年3月...
网站遭降权的原因很多,笔者这里记录一段比较痛苦的经历及成功的恢复。笔者所在公司运营的站点已经超过十年,十年前的网页结构和网站构架都有显著的变化,笔者的站在2012年3月份进行了一次重大的改版,由于网站是做行业人才招聘这块,这此改版的重点是网站横向作区域细分、纵向做行业细分,大方向定下来后,我们进行了页面的构建,在具体实施的时候,却犯了一个很严重的错误。 我们在构建区域频道的时候,又进行了纵向的行业细分这样形成了区域+行业+关键词模式,如江苏+饲料+人才、江苏+饲料+招聘、江苏+饲料+业务员;在构建行业频道的时候,我们又进行了扁平的区域细分,采取了行业+区域+关键词 模式,此外,我们对区域中的省再次进行了市、县细分。 在新版系统上线后,由于页面众多,收录量上升明显,网站长尾关键词流量也有较大的提升,但在2012年10月份左右,来自百度流量急剧减少,快照回档,不幸被降权。后经过4个多月的努力包括投诉、垃圾页面处理、外链拒绝等方法,成功恢复。今天就重点讲述首页快照恢复和低质量页面的处理。 一、首页快照回档的恢复 降权前首页快照隔日更新,降权后一直几个月之前,大约是改版后的一个月的快照。后经过IIS日志分析,我们发现,蜘蛛一天中爬行首页有400-500次,但状态码为304状态的占了80%,只有20%左右的200,而304表明网页内容没有更新,可以想象如果百度认为这个网站首页每次都没有新内容,且网站权重较低,快照也就没有必要经常更新了,我们怀疑是网站首页自动生成静态页面的时间间隔过长,解决办法:将原来网站首页30分钟自动生成一次改成10分钟,同时进行内容更新。效果:大约一周后,快照正常。 二、低质量页面的处理 前言部分,大家可能已经发现,我们区域+行业与行业+区域严重重复,除了网址不一样,内容完全一样,同时,由于对区域还进行了县、市的细分,很多偏远地区并没有这样的岗位和人才,这样大量的页面便没有内容,也就是说,由于网站内容不足导致内容无法支撑构架。阅读百度建站指南《百度认为什么样的网站更有抓取和收录价值》发现,“请不要为搜索引擎创造内容”、“请不要创建多个包含大量重复内容的网页、子域或域”,这些规则在我们不知不觉中就触犯了,我们通过分析IIS日志,也发现降权前的几个月,网站的蜘蛛也从220.181段变成了123.125段,按照很多站长的说法,220.181开头的是正常的蜘蛛,123.125开头的只对新站或降权网站,尽管百度官方说蜘蛛无所谓降权蜘蛛之说,但我们还是相信众多站长的判断。 现在的问题就是如何去除这样重复的和没有内容的页面了,其过程一波三折了,“请神容易送神难”这句算是深刻体会了,我们开始在robots里进行了屏蔽,但后来发现,蜘蛛不会再爬行屏蔽的内容,但已经收录的内容短时间内还是很难从百度索引库中去除。这时候百度改版工具出来了(2012.12.18),我们便进行了301的设置,但很快便发现百度的301生效很慢,且大量的页面指向同一页面,也是不妥的。这时候,我们通过站长平台咨询“对待没有价值的页面,是否最好的方法是用死链工具”,在得到肯定答复后,我们又进行了死链的设置,具体说来:我们在网页端主要处理了重复页面和精简市县级网页、同时只保留少量关键词,对这些页面返回404,并删除网页中链向这些文件的入口,诸多细节在此不再赘述;重点是站长平台死链工具的应用,根据前面的网页结构,我们简单计算了下死链数量,其组合为省 市 行业 关键词,组合网页数大约为130万,问题来了,如果向平台提交130万的死链,那将给蜘蛛爬行带来极大的负担,我们的解决方法是,先将这130万网址记录存贮与数据库,再通过百度搜索网址的方式,验证网址是否被收录(自己写工具了),记录被收录的网址,事实证明,130万页面百度收录大约为2万多,我们提交了这些死链。效果,一周后,这些页面便被清除干净。至此低质量页面便在百度索引库中消失,2013年3月初,网站权重逐渐恢复,蜘蛛也重新变成大部分是220.181段,当然笔者不能说网站恢复完全是因为去除了低质量内容,但至少是成功恢复的因素之一。 这个例子说明,只有为用户提供有价值的内容才是百度喜欢的,大量低质量内容对网站有害无益,同时,网站在运营过程中,其结构需要根据业务的发展来进行,否则变会出现大量无效页面,降低用户体验,笔者之所以写出这个案例,希望能给有同样问题的站长提供一种解决思路,本文由专业的农业畜牧人才网站http://www.5ajob.com,红黑联盟首发,转载的同时希望心怀自由分享之精神手下留情保留链接。 |
自学PHP网专注网站建设学习,PHP程序学习,平面设计学习,以及操作系统学习
京ICP备14009008号-1@版权所有www.zixuephp.com
网站声明:本站所有视频,教程都由网友上传,站长收集和分享给大家学习使用,如由牵扯版权问题请联系站长邮箱904561283@qq.com