搜尋引擎優化的從業員少不免沾染一些黑帽手段走捷徑的技巧。今天再聽到SEO優化重點是強調高質量的內容時,少不免會感到迷茫,甚至乎無所適從。而高 SEO內容質量 這句話容易令人錯覺是說“啞媽是女人”或者是說要造好SEO優化先要改造自己成為所從事業務的專家。不是要求大高了嗎?亦不太可行!
優質內容是約化的王道說法。道是可以領會而難以言傳。術是求道手段,清楚可執行,但當心中忘了道,就容易誤入歧途。從討論這些誤入歧途的技巧我們可以看到搜尋引擎如何衡量質量。
內容目錄
關鍵字堆砌
以前都知道網頁內出現搜尋關鍵字有利搜尋引擎將內容和該關鍵字索引。在 meta 關鍵字加入關鍵字亦可以通知搜尋引擎網頁內容和該關鍵字有相關性。原本是正路的手段,被濫用做成關鍵字堆砌 keyword stuffing, 就是不必要地將關鍵字在內容及 meta 關鍵字中重覆,以為關鍵字出現頻率愈多相關性打分愈高(搜尋引擎發展史中曾經確實是這樣),令內容變得不通順,減低可讀性,變相降低質量。
Google Panda 更生對關鍵字堆砌有針多性處理可追溯至千禧年,例如 2004年 Detecting spam documents in a phrase based information retrieval system 專利文件。簡單來說做法是統計可作關鍵字出現頻率,對不正常頻率降分。正常的內容關鍵字表示的概念更可能以潛在語義索引 Latent Semantic Indexing 形式被提及。所以搜尋引擎告訴你:你只需而撰寫優質內容就足夠。
機械翻譯
有些博主喜歡將英文內容利用機械翻譯 machine translation 轉換成中文放在自己的博客中,因為他們知道搜尋引擎喜歡定期更新博客,但寫作高質量的內容需要花費時間和資源。今天搜尋引擎已經可以就不同語言模型進行分析並就分析結果評分,詳見於 Identifying gibberish content in resources。做法是分隔文章含有關鍵字的段落,利用語言模型分析,比較正常段落的得分,判斷是否胡言亂語。
重複的內容
Google 對付重複的內容 Duplicated content 的辦法詳見 Representative Document selection for sets of duplicate documents 簡單來說被判定為相同內容的只有最高 Pagerank 的會被收錄到搜尋引擎結果頁面 SERP 中,而當網站被發現多份重複抄襲內容時網站的 Pagerank 會被降分。重複的內容當然不能被歸類為優質內容。
文章紡絲
令一種做法重複和內容相近的是文章紡絲 Article Spining,上面提及的 Google 專利文件亦有處理。文章紡絲是指為內容提供多個段落版本 (例如三個首段,三個中段,三個尾段,通過紡絲變成 27個版本),但其實內容大致一樣。通過將不同版本送到文章站投稿增加反向接鏈。
抄襲
另一種常見是抄襲內容。就是未經對方授權下將內容放在自己的網站。Google 對付方法很類似處理重複的內容,詳見 Detect Content Scraping。抄襲者通常為了流量而大量抄襲其他網站內容,所以一般不會是單一事件。Google Panda 更新會計算內容的原創性。當發現大量抄襲內容時將網站降分。抄襲的內容當然不能被歸類為優質內容。
SEO內容質量
優質的內容都不會犯上以上的問題,這些問題都不是搜尋引擎希望碰到的。所以搜尋引擎簡單告訴你:撰寫高質量內容就足夠。但了解搜尋引擎如何判斷高質量內容將有助你爭取高排名。搜尋引擎今時今日是無法利用人工智能很準確知道網頁內容的質量,但優質的內容有一些客觀的特性,例如:內容長度不會太短,瀏覽者可能會花更多的時間閱讀內容,可能包括外部連結提供更深入的參考,瀏覽者很可能會經常新訪問他們的網站等等。利用間接客觀特性的計算可以得到評質量分 Quality Score。更多會追踪根據瀏覽者反饋知道內容是否達到戶期望,詳見於 Click through feedback on search results to improve ranking,從而為內容質量打分。所以搜尋引擎告訴你:你只需而撰寫優質內容就足夠。而我會告訴你,創建內容之後優化質量評分的參數。
如果您有興趣了解更多,可以考慮報名參加我們的 SEO優化課程。

