自动秒收录

面对百度劲风算法的一点解决方案_蜘蛛技巧


文章编号:2314 / 更新时间:2023-12-07 / 浏览:

最近,在站长圈刮起一股劲风,可能你已经知道是什么了,没错,就是百度即将上线的劲风算法。其实,劲风算法跟小网站没啥网站,因为小网站,在正常情况下,页面都不会超过10000个,而,主要打击的是不利用户体验的聚合页。

从字面意思理解,把信息聚集到一个页面中,正确的说,是把同一注意的内容聚集到一个页面当中来。

如果能在这种状态下,对用户体验绝对是好的,方便用户一站式解决问题。

但,我们反过来思考一下,当你通过搜索引擎,搜索有关“减肥方法”的信息,看到一个聚合页面点击进去,本以为会有自己想要的信息,解决该聚合页全都充斥了游戏、育儿等不相关的信息,减肥的信息只有1-2条,是不是瞬间有种被骗的感觉。

这类的聚合页,就是百度搜索引擎所说的,为了优化而优化的页面。

不过,从另外一方面来说,凡是搜索引擎打击的,说明该方法都是确实有效的,只不过我们要换换思路来做而已。

帮助用户解决问题为主。

劲风算法,主要惩罚的对象是针对恶劣的聚合页。

不管是网站还是百度智能小程序,都在劲风的惩罚范围内。而基于这个算法的面世,其主要问题是行业内,存在很多单纯以获得流量为目的,不管用户搜索需求满足度以及搜索体验的聚合页。百度为了保障搜索用户在使用搜索引擎时的整体体验,同时保证搜索排序的公平公正性。上线了劲风算法。就是为了惩罚创造这一类聚合的网站。

1、站点内容跨领域或过于分散 面对百度劲风算法的一点解决方案蜘蛛技巧

这个指的是网站中包含了太多领域的词汇。例如你既要做游戏、又搞教育,还参与了加盟,甚至有电影。不仅搜索引擎无法识别你网站自身的专注领域,用户访问你站点的聚合页后,得到的体验也是极差的。

这种网站一般都是通过采集拼凑的内容。而这种网站也基本可以理解为是完全基于流量目的的流量站。只能是站长单方面获得了流量,但对用户、对搜索引擎都是伤害的。

2、标题与内容不相符

这里所说的标题,更多的可以理解为是我们聚合页面的关键词,例如这个聚合页你的关键词是SEO培训,而里面调取的内容有介绍游戏的、介绍电影的等与关键词本身不相关的内容。这样即便搜索用户进入到你这个聚合页,还是不能很好的解决用户需求!

3、利用站内搜索生成的聚合页

利用站内搜索功能,批量生成静态页面,这种操作是批量生成聚合页的惯用手法。多为大内容量较大的网站盛行。

SEO通过大量的关键词整理,然后技术人员以这些词为站内的搜索词,将返回的搜索结果批量生成另一种模板的页面。称之为利用站内搜索做聚合页最典型的方式。

这种页面生成的技术含量最难点在于自身搜索引擎的技术能力。而很多网站又没有专业的搜索引擎团队,即便生成出来的内容,相关性差、页面可读性低。同样是劲风算法打击的对象。

4、内容为空,或较少,以及失效的聚合页

批量生成的聚合页,以SEO为首,单纯以获取流量为目的的页面。大多都会存在聚合页内,调取的内容过少,甚至为空的现象。

这种类型的页面可想而知,毫无用户体验可言。所以劲风算法对其进行惩罚也是早晚的事情!

针对命中劲风算法之后,并不是说这个网站就从此废掉了。只要改过自新、百度还是会给机会让网站重新获得百度的信任的。

而劲风算法的惩罚周期官方并没有具体公布,但通过以往算法惩罚后的经验推断。一般在3~6个月左右。具体的要视情况而定!

从经验上来看,网站构成劲风算法的惩罚条件后。会从以下两个维度进行考虑(个人推断):

1、对搜索生态造成影响的程度,例如你聚合页的体量很大,且造成了一定时间内大量搜索用户体验较差的情况。

2、聚合页满足惩罚条件过多的,上面提到的4种情况中,满足一条就会遭受惩罚,但很有可能同时符合4种降权条件:既是领域分散的网站,又利用站内搜索批量生成静态页,且内容为空的、过少的多的自己都没统计过。

更多的会围绕这两个维度的情况,进行智能给出惩罚周期!

那,命中劲风算法之后,我们就等着恢复吗?如果不对网站进行整改是基本不可能恢复的。所以恢复的前提是你已经改过自新了!而针对整改我给出如下建议:

1、针对网站领域过于分散的:

建议确定好一个主要的领域,且将其他领域的内容robots掉,屏蔽搜索引擎抓取,且不再参与搜索引擎排名;

更完美的方式是对其他领域的内容进行删除,并将删除的内容URL在百度搜索资源平台提交404,确保网站无恙。

2、针对题文不相符的:

如果你有精力与资源,可以对应每一个聚合页的主题进行审查,确保聚合页下内容都是针对当前聚合页主题所延展的相关内容。

从技术角度看,建议通过内容相似度计算的方式将网页内的主体文本进行提取计算。得出当前聚合页的主题与内容的相似度得分。

并通过实际观察,确保相似度得分在哪个值上,是可以解决搜索用户需求的。

例如通过观察,我认为相似度得分达到62%(便于理解的假设值)的,基本都是相关页面,那么针对低于62%的暂时就别在前端页面进行展示了,如果这类URL被访问到建议设置404,并提交百度搜索资源平台!

3、针对利用搜索批量生成的:

利用站内搜索批量生成的内容,其最关键的问题在于其内容无法满足用户需求。毕竟你的搜索引擎技术无法与百度相比。这里给出的建议是:

(1)招聘精通搜索引擎的技术人员,针对搜索调取的内容相关进行大幅度提升。从而提升用户的体验度。

(3)技术能力达不到的,可以通过其他办法进行尝试,但最终还是无法确保满足用户需求的,建议删除或者robots操作。

4、针对内容为空或过于少,甚至无效的:

内容为空,甚至过少。在你站点内容资源很丰富没得到更多调取到聚合页的情况时,可以采取以下方式:

将更多品类的内容进行搜索整理,从而提升聚合页下内容整体的丰富度,前期要保证相关性。例如我这个聚合页是围绕爬虫抓取策略展开的,那么其调取的内容都应该基于爬虫抓取的策略,不能剑走偏锋,适得其反!

其次,也可以给予你的聚合页关键词进行分类。例如爬虫抓取、爬虫算法、搜索引擎爬虫、baiduspider,我们认为是一类聚合页。当内容为空或少于X条时,我们可以通过扩展调取的维度进行补全。

从技术需求的实现角度可以为:如果当前聚合页下调取内容为0或不足X条时,那么调取当前聚合页所属关键词同类别的其他内容,补全X条。

这样一来,通过扩大调取的品类,以及给关键词做分类形成补全规则问题就能很少的得到解决!

但如果你的内容资源信息很少,那么建议设定的逻辑为:当内容低于X条,甚至为空时,当前页面返回404。另外,由于我们这些做了404的页面已经被收录或者爬虫抓取了,建议再提交百度搜索资源平台的死链提交工具,进行完备。确保不会让搜索引擎认为你网站存在大量的死链接!

同一个网站存在太多跨领域的主题,比如一个网站中同时存在着,体育、游戏、视频、旅游等领域的内容。

记住,你做的不是门户,你做门户也不行。

目前,搜索引擎的倾向是垂直!

所以,网站本身跨领域的内容太多,也会成为一种累赘,耗资源不说,搜索引擎也无法给你一个准确的定位。

如何解决这个问题呢?

如果你的网站刚上线,那感觉再思考一下网站所做的重点领域,把不相关的内容给处理掉。

正常情况下,还没有起来,可以把一些没有被蜘蛛爬取过,没有收录的页面给删除掉。

注意,是没有被,没有收录的页面

老网站,已经有不少收录了,这个时候,你不能轻易的删除页面,很容易被搜索引擎惩罚。

可以用的方法,把不相关领域的页面给屏蔽掉,这是应对没有被收录的页面。如果在自查后确实不需要这些内容了,可考虑把其删除(按照新站的方法做)

如果是已经被收录的页面,也是可以用robots屏蔽,或者用301跳转到其他页面去。

注意,已经被收录的页面要删除的话,事先一定要记录好网址,后面一一提交到搜索引擎哪里去,这点很重要,切记不要把没有收录的页面地址也提交过去。

关于这个页面,说白了还是网站本身的数据不够充足,没有办法聚合出更相关的内容。

上图所示,所展现的内容只是简单的匹配了造句、句这样的字,并没有跟似有关的内容出现,文不对题的情形很严重。

1、建立你的聚合页词库2、针对关键词去搞内容3、利用python给关键词分词3、关键词每个词语都要调用到。

简单解释一下,比如“减肥食谱一周瘦10斤”这个关键词,通过分词之后,会变成这样:

减肥食谱一周瘦10斤

注意,上方都是跟减肥有关的,那么你在调用内容的时候,要围绕这些词语去调用内容。

比如,10斤这样的词,在通过精准调用后,可能会调用出类似这样的内容:

我的减肥方法好,瘦了10斤向着减10斤的目标去减肥

是不是都跟减肥有关呢?

前提是你的网站里面有这些内容存在,不然也是无内容可掉。

这类玩法太高级,像我这种技术小白还是玩不了的,简单的说,就是通过网站的搜索引擎,把关键词导入进去,生成符合跟关键词有关的页面。

这类玩法太高级,不多少,不过总的原则是,网站内容不够多,调取数据精度不够高也是没用的。

一个页面中只有关键词的多次出现,但没有跟关键词有关的内容出现,这就是无效的空页面,就像上图一样,没啥内容。

怎么解决这类问题呢?

还是以“减肥食谱一周瘦10斤”关键词来说明。

比如,你的网站并没有跟减肥食谱一周瘦10斤匹配的内容出现,那么,你完全可以调用出跟减肥食谱相关的信息出来。

只要是减肥食谱,都具有减肥的效能。

假如,我一开始只想找1种减肥食谱,但打开你的聚合面之后,给了我10种不同的减肥食谱,我也会很高兴的认为,你的内容不错。

按照这个思路,有序的组建内容。


相关标签: 百度算法劲风算法搜索引擎蜘蛛技巧超级蜘蛛查

本文地址:https://www.badfl.com/article/49cfe5bf88c07ae5fc6d.html

上一篇:网站建设流程网站建设都需要哪些步骤?...
下一篇:吸引百度蜘蛛让页面快速收录的方法?...

发表评论

温馨提示

做上本站友情链接,在您站上点击一次,即可自动收录并自动排在本站第一位!
<a href="https://www.badfl.com/" target="_blank">自动秒收录</a>