網站連結深入分析 (透過 Google Search Console 連結報表)
這篇文章有個前面的導言,但這篇才是本文。
有人問我為甚麼能夠同時幫這麼多公司解決問題,我思考了一下最大的轉捩點是「SEO 總表」的應用,這張表最初是幫「癮科技」做 SEO 顧問時,當時覺得最重要的是「連結數」,2015 年在 Google Search Console 還是叫 Webmaster Tools 時,原本只是計算每頁連結數時做的一張 Sheet,也就是記錄有效頁面數(現在是有索引數)以及內部連結數相除,所以在原本 Google 提供的報表外另外整理的。
但後來發現須要記錄的不只這個數字,當網站發現新的問題要去注意時就會多幾個數字,而現在變成了有一百多個數字的「SEO 總表」,這數字不只是要看的是每一個數值,還有要看其相對值,包含時間變化與各個數字的關係。
所以即使 Google Search Console 有了 API 可以去去做整理,也後來做了 GSC2 的這系統,但還是有很多數字是 API 沒有提供的,因此這張總表還是很重要。
但很重要的連結沒有 API 是最麻煩的,所以在前年因為外部連結攻擊太多,做了一個用下載的方式去記錄連結的變化,這個在今年初也整進了 GSC2 中。
只是這張總表有很大的可以改善的空間,其中包含幾個問題:
- SEO 最希望的是連結越多外,能夠也是連結分布的很廣,雖然在總表透過「取樣」的方式記錄外部連結第 100 筆與第 200 筆,內部連結是第 500筆與 1000 筆,但這樣還是很難看到其分布。
- 雖然有連結數字的總量,但這 1000 資料是否完整?
- 要知道裏面每一個網站、每一個網頁、每一個連結的變化是不太可能,但也要看到其歷史的大概變化,這個也要進一步的分析。
- 建了那麼多連結,是不是有建立到對的網頁上,還是建了連結的網頁事實上對流量沒有幫助?
因為總表只是記錄整體數字,看到連結數字有變化時也無法知道是那個網域或是那個網頁在改變,但透過每次記錄下來去做比較時就找到原因,有時外部連結的變化是對方網站的變化,內部連結的變化常是網站結構的問題。
有時網站經營就是要去注意每個細節,而連結在 SEO 的 Ranking Factor (排名因子) 中本來就是很重要的事,更須要知道其變化,因此須要更去細看連結的狀況。
在 Google Search Console 中有四個連結的表,各是:
- (外部連結)熱門連結網頁
- (外部連結)最常連結的網站
- (外部連結)最常見的連結文字
- (內部連結)熱門連結網頁
通常連結文字 (錨點文字/Anchor Text) 雖然重要,但事實上這資料價值不高,因為大部份的文字都是品牌字,或者是分類標題或是文章/網頁標題,只是要去操作的機會並不高,所以有價值的就是另外三個表,要下載儲存的就是這三個表。
若是能夠拿到這三張表以及兩個內部與外部總連結數,就可比去計算幾個數字:
- 以網頁為角度的外部連結總數與占比
- 以網域為角度的外部連結總數與占比
- 前 1000 筆的內部網頁連結數與占比
更重要的不只是總量與占比,更重要的是分布,而最直覺得是吉尼指數,從這三個數字就可以知道連結的整體狀況。
在 SEO 中最重要的是能夠分布廣而造成的「長尾效應」,也就是每一個網頁都能夠有較好的連結,最後每一個關鍵字都能夠獲得流量是最好,因此吉尼指數是越低越好,而加上前 1000 筆資料是占所有總量越低越好,代表的是超過 1000 筆的量很多。
從上面三個表來看無論內部連結或是外部連結都有很大的差異,大概很接近的是以網域排序的前 1000 名以經夠完整,但相對的大家分布都很極端,所以吉尼指數都很高,但除外兩個以「網頁」為角度的數字倒是有很大的差異。
這邊來看吉尼指數有的低到只有 0.2,但也有高到 0.7 的,雖然是越低越好,但因為當網站越來越大時,前 1000 筆的占比也較低,像外部連結有低到 40% 的,內部連結甚至有 10%的。
而若是以點擊數來看,也是有很大的差異,有的是 100 以上但不到 10% 的,也有的是不到 100 反倒是可以到 10% 的,但通常是數量都是正向的,較大的差別是分布,通常是吉尼指數越低的往往越好也是真的。
事實上每一個網站屬性都差很多,說要去做比較並不實際,真的要看的還是看其變化,因為真正的目的不是追求任何數字而是流量,但也是靠每一次的調整才能讓連結的架構越來越好。
所以在連結建立的觀點是:讓有限的資源,包含版型與合理的使用者行為下,讓值得獲得搜尋流量的網頁,有更高被 Google 認可的連結,這樣的細節不是單純只看「連結總數」或是「每頁平均連結數」而已,只是這也是個「最基本」的開始。
只是怎開始呢?就不是這篇文章的範圍了。