fbpx

重複內容有多種,不一定會影響網站搜尋排名

重複內容 Duplicated Content 對搜尋引擎優化 SEO 的影響很多時候被誤解,對排名的影響低估了。有些人說 “重複內容” 會引致被搜尋引擎懲罰 Search Engine Penalty。最近一個客戶問我:想在網頁內利用 CSS 設定不同的桌面和手機排版佈局,有需要將同一段內容重複,會否因重複內容而被搜尋引擎懲罰?搜尋引擎是不會簡單對有重複內容的網頁懲罰。所謂懲罰是指搜尋引擎公司將該頁面從索引資料庫中抽走。網站的內重複內容更多情況是影響搜尋排名的質量評分令,排名下降。

重複內容是互聯網上常態

首先互聯網的世界就是充責著很多很多的重複內容。有些針對重複內容研究說 20% – 30% 左右。例如:

  • 當某網頁引用其他網站的內容時,不免會重複對方網頁上的一些內容。
  • 又例如:當 Donald Trump 贏出成為美國總統,很多媒體都可能是直接抄襲引用官方的生平簡介。更不要說其他網站可能抄襲了你的內容, 你當然可以透過 DMCA 機制向搜尋引擎公司投訴,但一般費時和心力。
  • 網店很多時候亦會出現重複內容,例如:相同的產品描述出現在該產品頁和產品分類下的該產品頁。只要 URL 網址不同搜尋引擎就可能看成不同的頁面。這種情況下的重複對搜尋排名是非常不利需,要使用 rel=“canonical” 來處理。
  • 更普遍的例子是同一網站支援加密連線 HTTPS 和非加密連線 HTTP , 由於 HTTP 和 HTTPS 被搜尋引擎看作不同網址,所以亦可看作重複內容。這種情況下的重複對搜尋排名亦是非常不利。

何為搜尋引擎懲罰?

搜尋引擎是不會簡單對有重複的內容的網頁懲罰處理,原因是普通用戶難以消除重複的內容。搜尋引擎旨在懲罰那些存心操縱搜尋排名的人,而不是那些無心犯錯誤的普通用戶。所謂懲罰是指搜尋引擎公司將該頁面從索引資料庫 Indexing Database 中抽走,導致搜尋用戶不可能從任何搜尋查詢中找到該網頁。再進一步 (在極端的情況下) ,當整個網站被懲罰時搜尋引擎公司會將該網站的全部網頁從索引資料庫中抽走,導致搜尋用戶不可能從任何搜尋查詢中找到該網站的任何網頁。搜尋引擎發現網頁或網站涉及不當的人為操控搜尋結果排名,而將網頁原應有的排名為下調,亦一般被視作搜尋引擎懲罰。

重複內容


不懲罰不等於搜尋引擎是喜歡

搜尋引擎不喜歡重複的網頁內容。理由是:搜尋引擎認為 Query Deserves Diversity (QDD),應份給予搜尋用戶多樣性的搜尋引擎結果頁 SERP 結果。搜尋引擎認為:對搜尋用戶提出的查詢列出的相同答案 (只是網址不同,內容大致是相同) 是浪費搜尋排名結果頁面。對重複的網頁內容搜尋引擎認為列出一個就足夠了。所以搜尋引擎只會從相同答案中抽取最好 (best similar answer) 的一個網址放入搜尋排名結果頁面,其他相同答案被篩走。而這個篩走結果常常被誤解為搜尋引擎懲罰。

搜尋引擎只會從相同答案中抽取最好

一般只有當網站內容大量是一字一句抄襲其他網站而對用戶毫無價值并且目標是操控 SEO排名時,搜尋引擎才會引入懲罰。


重複內容會損害網站質量評分

網站內重複的內容更多情況是影響搜尋排名的質量評分。一般相信搜尋引擎亦會對搜尋排名結果就質量進行過濾,這是以前 Panda 搜尋算法更生做的工作,自 Panda 4.2 已經整合在搜尋引擎的算法內。可視作為搜尋引擎認為:Query Deserves Quality 的一種類型。所以如果將相同一段內容在同一網頁上重複很多次,質量評分和用戶體驗都自然下降,自然不利搜尋排名。

網站內重複的內容另一種傷害是:如果是本身網站內的網頁內容重複,你希望就目標關鍵字是用網頁 A 排名,而搜尋引擎可能覺得相同內容網頁 B 更適合,並使用網頁 B 在 SERP 結果。這就是 cannibalization 關鍵字競食問題。結果導致關鍵字搜尋排名下降。

舉個例子:我們一個做脊醫的客戶經常在報章雜誌上發表關於脊醫健康的資訊,對方順理成章亦將報章雜誌上的專欄直接放在自己的網誌上,當然由於資源所限發佈總是是落後於報章雜誌。他這樣的做法就犯了重複內容的問題,由於報章雜誌的網站排名因素都較他自己的網誌為高,所以網誌上面發表的相同內容都更難被搜尋引擎列出來。而且不是一兩篇文章的重複,而是大量的排名失敗重複,最後亦對網站質量評分帶來負面影響,再又影響網站內其他頁面的排名。


重複的內容不利搜尋引擎索引

但先前的客戶的提問又不同。理由是相同段落一個版本是給桌上電腦,一個是給手機。而當搜尋引擎的索引機械人 Googlebots 檢索網站時,現在身份是扮作桌上電腦。但由於手機瀏覽量已經超過桌上電腦,不久將來索引機械人會是扮作手機,這就是所謂 Mobile First Indexing。由於索引機械人身份只有一個,所以根本不會看到相同內容。

當搜尋引擎發現兩個網頁大多是重覆的內容時、搜尋引擎可能會選擇放棄索引被視為內容重複的網頁。例如:一個客戶網站是銷售成人尿片,產品分為中碼 、大碼 、加大碼等。基本的產品內容是相同的。搜尋引擎會選擇放棄其中兩個。解決方法是在中繼描述 Meta Description 中加入尺寸資料,使內容不被視為重覆的內容。當然在網店中成人尿片尺寸是否應設置為產品項目又是另一回事。


如何檢查網站內重複的內容?

網站太多重複的內容不利搜尋排名。理由是:搜尋引擎會覺得網站質量不好。有些工具例如:siteliner 可以幫助檢查重複內容。檢查 重複內容


其他網站抄襲內容

重複的內容最大的傷害更多時候是其他網站抄襲你的內容而導致搜尋引擎因為 QDD 篩走你的原創內容而不是抄襲者的內容。本網誌其中一些文章 ( 例如:”網站中文字體問題“) 就被其他網站抄襲。你當然可以通過 DMCA 請求 Google 採取行動,例如:將抄襲者的網頁從索引資料庫中移走或者將抄襲者的網頁資量大幅降分。

了解搜尋引擎從一籃子相同內容但不同網址中以什麽條件篩選最好網頁,可能有助你跳過冗長 DMCA 上訴程序將抄襲者擊敗。其中一個條件當然是網站權威性。原創性不是搜尋引擎的主要考慮,所以發佈日期更先者不一定被篩選出來。理由搜尋引擎認為後發佈者可能對內容有所改進而值得被篩選出來。這是 Query Deserves Freshness 的概念。加入結構描述 schema 可能有點幫助但亦非絕對。

2014 年 Google的一份專利文件提及一種機制決定近乎同相內相的多個網頁中,如何決定哪一個網頁才是主要的版本。其中參考的因素可以是 meta data 中如:作者、出版機構、出版日期、第三方參考連結等等。


內容聚合

內容聚合 Content syndication 是指透過自動化技術,將內容重發佈在第三方網站。自身的好處是內容多了曝光機會,第三方網站的好處是借力他人內容來滿足網站訪客。由於出現在第三方網站的內容聚合是和原來內容相同,所以可能會產生重複內容的問題。為了避免重複內容對原內容的排名有所影響,原內容中一般會加入 rel=”canonical” 避免搜尋引擎會排名經過內容聚合的第三方網站頁面。


多語言版本做成的重複

對於一些服務全球的網站,網站有多語言版本,例如:英文、中文正體、中文簡體等等。甚至乎中文正體亦可能由於某些原因有不同的版本。例如:一個酒店集團管理的酒店網絡遍佈台灣、香港、馬來西亞,網站內容可能會針對不同地區就內容上稍作調整。比如香港和臺灣版本內容基本一樣,但為了更佳的用戶體驗,之間只是詞彙稍作本地化改動。但搜尋引擎可能會認為臺灣和香港是重複的。

重複內容 多語言版本

一種做法是通過 hreflang 標記通知搜尋引擎不同語言版本的語言代碼和網址。好處是:

  • 搜尋引擎不會認為不同語言版本是重複內容。
  • 搜尋引擎當成功判斷搜尋用戶的來源地後,能將適合的語言版本列出在搜尋排名結果頁面中。

在上面的例子中,頁面告訴搜尋引擎還有有英文版本 (hreflang=”en”)、中文正體 (hreflang=”zh-Hant”)、中文簡體 (hreflang=”zh-Hans”) 和韓文 (hreflang=”ko”) 版本。

如果您有興趣了解更多,可以考慮報名參考我們的SEO優化課程

Facebook Comments
摘要
重複內容有多種,不一定會影響網站搜尋排名
文章名稱
重複內容有多種,不一定會影響網站搜尋排名
描述
重複內容 Duplicated Content 對 SEO 的影響很多時候被誤解。排版佈局有需要將同一段內容重複。搜尋引擎是不會簡單對有重複內容的網頁懲罰。所謂懲罰是指搜尋引擎公司將該頁面從索引資料庫中抽走...網站的內重複內容更多情況是影響搜尋排名的質量評分令,排名下降。
作者
WaiTing LI
發佈者名稱
Well Develop International Limited
發佈者商標

關於 WaiTing LI

SEO專家地位並非紙上談兵自說自話而來,應該是基於由同業又或者權威的獨立第三方給予的評價。SEO專家地位大致可以從 Google 給予你所競逐一大籃子競爭性高的關鍵字排名結果推斷出來。我關於宣傳推廣、網店、SEO優化的文章取得很高排名,是搜尋引擎給予我專家效應的結果。

也查看

手機 Mobile SEO

手機 Mobile SEO, 如何在手机中搜尋排名第一

手機 Mobile SEO 和 …

發佈留言