主頁 / SEO 優化 / 2019 相關性關鍵是 Semantic SEO, 是語義不是關鍵字

2019 相關性關鍵是 Semantic SEO, 是語義不是關鍵字

Semantic SEO 強調的是語義不是關鍵字。了解搜尋引擎操作需要經常觀察搜尋排名結果。最近你可有發現一些搜尋排名最前的 SERP 愈來愈多內容中並沒有直接提及搜尋關鍵字?這表示 Google 已經可以進一步掌握語義分析,對一些常見主題查詢,無需太依賴關鍵字的出現來判斷相關性。當然,對一些長尾關鍵字,關鍵字的出現仍然起主導排名作用。

過去二十年,我們被迫遷就一個沒有語義分析能力的搜尋引擎,將原來日常用語的查詢約化為關鍵字。隨著語音搜尋 Voice Search 普及和深度學習人工智能 deep learning AI 的突破,幾年前搜尋引擎計算排名時已經引入語義分析。現在普及到中文內容。


知識圖 Knowledge Graph

要進行語義分析要先建立對世界觀的語義數據庫。語義數據庫愈大愈完整,分析能力愈大。就像初生嬰兒要先了解 “媽媽”、“爸爸” 才能理解 “媽媽去找爸爸” 這句話的意思。Google 在 2010 年收購了 Metaweb, 一家專門從事建立結構化數據庫 Freebase 的公司,其中的技術和數據庫溶入了 Google 知識圖 Knowledge Graph (KG) 中。過去幾年知識圖數據庫的條目大幅倍增,2016 年 5 月已能夠回答 Google 處理的每月大約 1000億次搜尋中的三分之一。

知識圖

知識圖是關於實體 Entity 和實體之間的關係。當實體數據庫大幅增大語義分析才變得可能。搜尋輸入内容是搜尋用戶作出的一個提問。例如輸入 “網上推廣” 可以是問:

  • 如何做網上推廣?更確切是互聯網 (實體)上有那些文章 (實體) 介紹網上推廣方法 (實體) 。
  • 什麼是網上推廣?更確切是網上推 (實體)  的定義 (屬性) 是什麽?
  • 哪些網站關於網上推廣服務?更確切是那些公司 (實體) 提供 (關係) 網上推廣服務 (實體) ?

Google 最近一個專利文件,利用人工智能在用戶查詢同傳統搜尋結果中間介入,利用人工智能將用戶輸入轉變為不同的搜尋查詢 (術語和概念),再發放到傳統搜尋引擎作查詢,利用人工智能再判斷哪一個返回來了結果為最優,甚致乎整合不同的返回回結果。這種機制很可能已經應用在 RankBrain 中。


Word2Vec 概念

傳統相關性理論是關鍵字 TF -IDF。但這種方法未能考慮詞彙與詞彙中間的關係。例如爸爸、媽媽看獨立的詞彙。詞彙 (例如:爸爸和媽媽) 的相關性需要能被計算,才能利用計算機進行邏輯推理。這是人工智能中利用 Word2Vec 就是利用作分析詞義找出詞彙相關性的新技術,是 AI learning 的一種。

想像每一個網頁都係有一組詞匯組成。谷歌使用是 Word2Vec,為一群用來產生詞向量的相關模型,用來訓練以重新建構語言學之詞文本。訓練完成之後,Word2Vec 模型可用來映射每個詞到一個向量,可用來表示詞對詞之間的關係。詞向量的建立是可以透過輸入大量數據培訓 (train) 出來。Google 提供一個以 300兆詞詞文本培訓出的 3佰萬詞向量的 vector, 免費下載,用於編程。

就是一個向量形式表示每一個字。例如:母親、女人、男人、爸爸詞彙可以有關

母親 爸爸 女人 男人
生育 0.99 0.99 0.5 0.5
婚姻 0.9 0.9 0.4 0.4
男性化 0.01 0.99 0.01 0.99
女性化 0.99 0.01 0.99 0.01
年紀 0.6 0.6 0.4 0.4

女人和母親向量差異 (Vector difference) 在 “生育” 和 “婚姻”。男人和父親向量差異在 “生育” 和 “婚姻”。因此:

母親 – 女人 + 男人 = 父親

更多請參閱:The amazing power of word vectors.


專題權威 Topical Authority

傳統搜尋引擎解答以上問題的做法是依賴關鍵字匹配 Keyword Matching。多年前搜尋引擎公司已經知道關鍵字匹配有很多盲點。最好方法是了解輸入查詢所指向的實體,實體屬性 attribute 和實體與實體之間的關係 relationship。再加上了解用戶搜尋意圖 Search Intention 找出最適合的答案。

例如:以搜尋輸入 “網上推廣公司” 為例。以前是以內容中出現 “網上推廣公司” 這個關鍵字。現在通過語義分析,現在可以找出兩個實體,一個是 “網上推廣”,一個是 “公司”,並理解為:

“公司” → “提供服務” → “網上推廣”

而滿足為 “公司” 實體的又會包含實體屬性如:”聯絡地址”、”聯絡電話”、”網站”、”提供服務”。所以 SERP 根本無需包含 “公司” 詞彙。”公司網站” 也是 “公司” 的其中一個屬性。只要搜尋結果所列出的網站在一 “公司” 實體之下可以。

從以上推斷:什麽樣的網頁能在查詢 “網上推廣公司” 取得高排名?搜尋引擎評估 “公司” 實體會喜歡:

  • 屬於公司網站的網頁優於公司的獨立網誌、優於公司的 Facebook 粉絲專頁。
  • 網公司站中包含大多數公司屬性、如 “聯絡電話”、”聯絡地址”、”代表人物” 等等。
  • 網公司站提到所提供服務,如: “網上推廣”。網站內愈多網頁提及此服務表示該服務對該公司愈重要 (Weight Factor)。換句話說,網站具有專題權威。
  • Google My Business 很可能被搜尋引擎用於判斷公司的屬性。

從 Google 專利文件可以看到評估實體一些準則。除相關性 Relevance 外,包括知名度 Notability (又是關於反向結連),Contribution 評分, Price 獎項等。

但是兩個網站同樣擁有公司屬性,同樣提供網上推廣服務,Google 要判斷那一個更好?需要考慮搜尋引擎如何評估  “網上推廣” 實體?網上推廣的屬性 (或相關服務) 可以是 “Facebook 推廣”,”SEO”,  “SEM”, “Adwords 廣告”, “YouTube 推廣”,”百度 SEO” , Yahoo, Bing 等等。當網頁的其他評分相等,就需要單從內容判斷高下。所以愈多屬性出現,相關性愈高。這是共被引用 Co-citation 概念。


短句,不複雜結構

搜尋引擎優化不喜歡單薄內容 shallow content。從語義分析角度來看,網頁中能夠被理解的句子就是內容,不能被理解的就可能只能視為雜訊 noise。一個網頁中雜訊越多,就越接近被評定為單薄的內容。網頁中具有相同含義但不同類型的措辭將被視為重複內容 duplicated content。語義分析了解短句係比較了解長句和複雜句子容易,所以短句被評定分析為什雜訊機會是較低。最簡單的結論就是語義分析時候短句簡單句法更適合搜尋引擎優化。另一個角度語音搜尋 SERP 統計結果亦確認語音搜尋所提供的答案都是來自較短較簡單和直接內容。


長尾關鍵字排名

長尾關鍵字由於實體並未建立或者不能輕易識別實體之間的關係,所以長尾關鍵字的出現仍然起主導排名作用。通過保留強化語義來排名,成功自然可以為多個關鍵字獲得良好排名。更多關於我們提供的 SEO 服務

Facebook Comments
摘要
2019 相關性關鍵是 Semantic SEO, 是語義不是關鍵字
文章名稱
2019 相關性關鍵是 Semantic SEO, 是語義不是關鍵字
描述
Semantic SEO 強調的是語義不是關鍵字。了解搜尋引擎操作需要經常觀察搜尋排名結果。最近你可有發現一些搜尋排名最前的 SERP 愈來愈多內容中並沒有直接提及搜尋關鍵字?這表示 Google 已經可以進一步掌握語義分析,對一些常見主題查詢,無需太依賴關鍵字的出現來判斷相關性。當然,對一些長尾關鍵字,關鍵字的出現仍然起主導排名作用。
作者
發佈者名稱
Well Develop International Limited
發佈者商標

關於 WaiTing LI

香港SEO專家。專家地位並非紙上談兵自說自話而來,應該是基於由同業又或者權威的獨立第三方給予的評價。SEO專家地位大致可以從 Google 給予你所競逐一大籃子競爭性高的關鍵字排名結果推斷出來。我關於宣傳推廣、網店、SEO優化的文章取得很高排名,是搜尋引擎給予我專家效應 Topical Authority 的結果。SEO 和 SEM 關鍵字廣告又是一體兩面,應該是互相借力。所以有效關鍵字行銷亦必需弄通 SEO 概念。搜尋引擎優化最高境界是結合關鍵字廣告壟斷 SERP 排名結果。

也查看

AMP 網頁:加速行動版網頁載入速度,減少網站負載,間接提升SEO排名

AMP 網頁 是 Google …

發表迴響