网站内容重复一直都是一个热议的问题,不管是网站访问用户还是搜索引擎,都不希望在网站上经常看到重复内容。网站上经常出现重复内容,不仅影响用户浏览体验,还会降低搜索引擎信任值。那么怎样才算是网站内容重复呢?
一、重复情况:
一篇文章出现好多个URL的时候,不管这篇文章是否是原创,但是百度仍然会给予惩罚。如果你的是采集站,那么你就要小心了,网站内容多有重复的,有可能会被当作是采集站给处理掉。
也有这样的一批网站,大多以图片为主,文字很少,而图片的URL都指向了同一地址,这样的网站当蜘蛛来的时候很难保证会不会重复的收录,再者网站的板块出现的重复性,板块里面的内容从不更新,或者每个栏目里面的文章都是一样的,这样的网页就会重复度很高。
一些网站没有设置404页面,404页面对蜘蛛是友好的表示,给予用户一种提示,如果你这页删除了而没有设置404或者设置错了,那么在蜘蛛那里这个页面还是存在的,来了就会进行收录。
二、检测方法:
有些站长问到,既然内容重复的现象这么多,那怎么检测呢?检测很简单,比方说,站长在写一篇机器人客服软文的时候,就在自己的软文里面复制一段话,放在百度里面搜索一下,出现大量的红字,也就是大家总说的飘红,这就说明这文章重复度很高。或者也可以利用工具,判断一些相似页面的相似度,一般相似度80%就要进行处理了。
三、重复内容解决:
现在的搜索引擎百度非常看重用户体验,文章内容是用户要找的有价值的内容,所以文章的原创度要高。假如你的网站是一个采集文章比较多,简单伪原创的网站,那宁可收录少一点,也要增加原创内容固定栏目的文章,内容可以随即调用,以避免页面有重复的内容出现。
最后,快商通要说的剩下两点大家就都知道了,就是标题、关键词。描述每个页面都需要不一样的,不管是用规则设置还是手动修改,切勿相同,404是肯定要设置的,防止搜索引擎收录死链接。