簡易盤點傳媒的SEO基本功(從爬蟲索引觀點)

這幾年網路上多了很多新的「傳媒」,這些傳媒主要是用最簡單的 CMS (Content Management System) 來架設,包含用 Wordpress 或是較低成本的改版與開發,畢竟傳媒的本質是在內容不是在系統,但一個網站若沒注意系統的基本功,對於流量經營是很大的麻煩。

剛剛看到有人整理出一份媒體資料,多出了幾個沒聽過的傳媒,所以職業病發作,想說若是以爬蟲角度來看,這幾個新的傳媒是否及格?既然都要做了,就把幾個經營較早的傳媒加上去,如風傳媒與端傳媒,一起來討論。

因為這只是一個簡易的盤點,當然不會是甚麼完整的 SEO 檢驗報告,只是一個網站若是有觀注在搜尋流量的話,自然會無所不用其極讓 Google 爬蟲能夠很有效的檢索,因此只專注在這角度,而這角度分成幾個部份:

  1. 網頁與網址的結構:包含是否是 SSR (Server Side Render),有沒有 Canonical 制式網址,或是網址是否「正規化」(主要參數放在目錄)這三個項目。
  2. robots.txt 與 RSS:當然這部份包括有沒有 sitemap,或是給 news 用的 sitemap 以及有沒有 RSS 提供較新較即時的索引目錄。
  3. 標籤:有沒有標籤是網站建立連結很重要的項目,而這標籤有沒有寫在 meta、Schema 是主要的檢核項目。
  4. Schema:除了上面有沒有 keywords 寫在 schema 外,也包含有沒有較完整的 ArticleBody,以及有沒有作者頁。

上面四個分類有 15 個項目,其中有一個「是否有完整的 Sitemap」是加分項還是扣分項是見人見智(個人認為是扣分項),而這次除了新的幾個傳媒外,也把兩個較老資格的風傳媒與端傳媒共 12 個一起做比較,看看是否他們也是優等生?

完整表格的圖如下:

新傳媒的 SEO Check…
  1. 在網頁與網址結構中,除了燦鋒傳媒沒有制式網址外大家都有,網址正規化嚴格說也只有菱傳媒沒有,而端傳媒是加了很多不須要的參數,SSR 也只有兩個網站沒有。
  2. 在 robots.txt 與 RSS 中,有做給 GoogleNews 好抓的 xml 只有銳傳媒與大聲傳媒,但不代表其他沒有做,可能只是沒寫在 robots.txt,而這部份只要是用 wordpress 的話大多都是可以輕易做到。
  3. 標籤是只有一個銳傳媒沒有外,其他都有,只是有沒有好好的寫在 meta (雖然不必要,但也是個有趣的指標)以及 schema,就是看細節的完整度,只可惜的是做到的只有風傳媒、信傳媒與農傳媒。
  4. Schema 與作者中是大部份網站都沒有做好的,而全部都做好的只有銳傳媒,畢竟要同時關注到前台的作者頁與後台的 Schema 是要有經驗與精力的。

當然這邊只是以「新興傳媒」來做引子,讓大家知道經營網站在給爬蟲檢索索引的要素有那些,這邊還沒針對 On-Page 的結構去做討論,就可以看到真的要做好沒那麼簡單。

— —

「摘要」近年來,許多新傳媒透過簡易的內容管理系統如Wordpress快速架設,雖重內容輕系統,但基本系統設計對流量至關重要。作者檢視新舊媒體在SEO友好性方面,特別是Google爬蟲效率,考量網頁結構、robots.txt、RSS設定、標籤及Schema標記等15項指標。結果顯示,不同媒體在這些SEO關鍵領域的表現各異,突顯了優化搜尋引擎索引的複雜性與重要性。

「圖說」這張圖描繪了一個充滿活力且引人入勝的數位媒體平台演化景象,通過簡易的內容管理系統如WordPress快速發展。圖中展現了多個媒體出口,每一個都有其獨特的標誌或設計,透過象徵互聯網的數位路徑相連。前景中,有一人正透過放大鏡檢視這些媒體平台,專注於網頁結構、SEO標籤和數位信息流動等特定元素,象徵著對其在數位時代有效性的審查和評估。背景充斥著數位代碼和搜索引擎機器人在這網絡複雜環境中的導航,強調了為搜索引擎能見度進行優化的重要性。整個插畫色彩豐富且具有未來感,捕捉了媒體創新的精髓和技術在內容傳播中的關鍵角色。

--

--