減少網站的重復內容,提高網站的整體質量。
為什么會產生重復內容
重復內容是指不同的URL鏈接內容卻是相同的,造成重復內容的原因可能是內容的采集,直接使用采集工具采集其他站點內容;網站因為網址不規范,導致網站有多個URL地址可以訪問,蜘蛛也同時收錄多個重復頁面;網站沒有設置404錯誤頁面,默認所有的錯誤鏈接跳轉到首頁,這樣處理錯誤鏈接的方法也導致網站大量重復頁面;或者因為像商城類的網站,因為產品大小不同,設置多個頁面進行介紹,但是網頁的大體內容是相同的,這樣的情況也會被蜘蛛認為是重復的內容。
重復內容如何檢測
如果自己站點內部存在重復內容,要檢測還是比較容易site:域名,看下搜素引擎是否收錄了重復的內容。但是要是檢測外部頁面是否重復,可以拿頁面中的一句話,加上雙引號后去搜索引擎查找,如果網絡中存在大量的相同句子,點擊查看并可知道是否是整篇網頁是否重復。往往這樣的檢測方法比較難,能找出一句話出現在另一篇文章中的可能性低。對于檢測一篇文章是否被剽竊,title:+文章標題并可找出相同的文章。、
重復內容是否有危害
網站大量存在采集的重復內容,搜索引擎會認為這樣的站點是垃圾站點,會很快遭到搜索引擎的降權處理,往往搜索引擎會降權哪些大量存在重復內容的站點,少量存在復制內容的站點,蜘蛛不會給予降權,蜘蛛會判斷重復的頁面中,哪些頁面是原創頁面,對給予這樣的重復頁面進行排名,搜索引擎有時會存在錯誤的判斷,就會導致站長們經??吹降默F象,自己原創的內容被其他站點轉載,其他站點收錄排名很好,但是自己站點卻并沒有被收錄。
在自己網站中存在重復頁面,蜘蛛收錄的頁面鏈接跟推廣的鏈接不統一,并導致網站權重的丟失,特別是網站中一些重要的頁面,如果存在多個URL鏈接,對用戶來說不容易記憶,對蜘蛛來說也是作弊的優化手段,大量存在重復復制內容的站點,搜索引擎會產生作弊優化的猜疑,給予降權處理。
如何消除重復內容
站內的重復內容往往來源于網址不規范,對于網址不規范的問題,最好的解決方法就是301轉向,把網站所有的內部鏈接,規范到統一的URL鏈接上,減少網站權重的流失。對于是因為版本的不同導致的重復內容,可以使用robots文件屏蔽,禁止蜘蛛抓取不必要的頁面,或者不希望收錄的鏈接可以用nofollow標簽。
前面說到的商城網站因為產品的大小不同,導致的重復頁面收錄,可以使用canonical標簽,百度支持Canonical標簽以后,站長可以通過將 元素和rel="canonical" 屬性添加到該網頁非規范版本的 部分,為搜索引擎指定規范網頁。