ADC現場報道:大型網站SEO優化與移動WAP SEO實踐
原創【51CTO特約報道】2013年7月13-14日, 由阿里巴巴集團主辦的ADC·阿里技術嘉年華將在杭州海外海國際會展中心舉行,2011年舉辦首屆,今年是第三屆,已發展為互聯網行業最開放、最實戰派的技術交流盛會之一。被大家視為碼農典范的技術大神MySQl的創始人Michael Widenius,將作為嘉賓現場分享。
本屆嘉年華設置了大數據技術與應用、無線技術、業務架構&后端技術、前端技術、搜索、廣告、體驗設計、互聯網測試、系統開發和運維等九大分場,共有80多個主題,其中包括了阿里巴巴、騰訊、百度及更多知名的互聯網公司的在實踐中積累起來的技術經驗。比如阿里巴巴的去IOE、新浪微博的系統穩定性等主題都反映了業界的主流的工程技術方向。
本次演講來自于阿里巴巴中文SEO領域owner 周文軍,話題是《大型網站SEO優化實踐》。周文軍從無到有建立了一套完善的SEO優化體系,通過在CBU探索實踐,SEO流量相比2011年增長了143%。他將從SEO定位,策略,監控等方面與大家淺談大型網站SEO優化實踐的那些事兒。
周文軍一開始就給大家介紹了URL規范舊狀以及帶來的一些問題和挑戰。那么對于周文軍所說的URL規范舊狀以及問題與挑戰主要表現在那些地方呢?從周文軍的演講過程中,小編分別記下了主要的四個點:
URL規范舊狀:
- 多域名;
- 全靜態化,全動態化,半靜態化等多套URL規范;
- URL層級太深;
- URL解析代碼復制冗余,性能低,關鍵是維護成本高。
問題與挑戰:
- 參數全靜態化,本質還是動態化,SEO效果差。
- 跟前端工程師合作效率低。比如JS拼接靜態URL問題。
- URL中特殊字符解析問題。比如%2F(/),%4E(N)等。
- form表單提交產生多余的301挑戰,增加前端性能負擔(20ms左右)。
那么周文軍是如何跟大家給出的URL規范化以及相關的問題對策呢?下面給出了對于搜索引擎應該如何面對方式:
- noindox,nofollow標簽
- 301跳轉
- canonical標簽
- webmaster可設置動態參數處理方式
接下來是周文軍給大家分享的如何提升網站核心資源被爬取效,主要針對抓取的網頁數量,編入索引的網頁總數,和robots阻止的網頁數。
對于引導爬蟲抓取網站的核心資源我們應該作何去做呢?當然了,站點扁平結構,重點優化面包屑這些是非常重要的。sitemap每日全量更新,補充spider URL庫和頁面部分推薦模塊異步改同步加載,核心資源URL部署到權重高的頁面。這樣的話就很容易引導爬蟲抓取我們網站的核心內容或者資源。
為了減少無效的URL抓取,我們也做了一些相關的對策。比如對robotst.txt禁止無效URL被抓取及被索引,還有通過noindex meta標簽禁止URL被索引,不過周文軍老師提示了百度暫不支持noindex。不過大家可以考慮nofollow的使用,這樣也能減少無效URL的抓取。
對于提升網站抓取量,周文軍老師給出了三個思路:
- 避免搜索引擎官方爬蟲被安全軟件攔截;
- 逐步上調站長平臺抓取壓力
- 及時更新死鏈sitemap
在大型網站SEO優化中后期,我們應該注重哪幾個問題呢?這也是大家經常苦惱的問題。周老師跟大家說了一個詞為“Query”。對!就是要專注Query的分析,比如用戶搜索的query是否match頁面Title中的關鍵詞,或者詞庫分庫分檔,再者就是思考Search Query=Search Requirement。
當然了,還有相關的調排名,這里有個準則,就是對排在第二及第三頁的關鍵詞,我們會重點分析及調優。優化第三頁以后的關鍵詞,投入產出比極低。再者就是研究anti-spam,就是堅持白帽,杜絕黑帽。研究anti-spam主要防治不正確優化被判作弊。
周文軍老師給出的全站SEO效果監控圖
相關的分析工具
還有一個對于移動WAP SEO的優化,周文軍老師給出了5點建議。
第一,自助適配,在Apache服務器上根據user-agent自主適配到WAP頁;
第二,標注Meta聲明;
第三,開放適配協議,在百度站長平臺提交開放適配協議,如適配協議與頁面標注Meta聲明沖突,以適配協議為準;
第四,DOCTYPE聲明,DOCTYPE聲明有助于搜索引擎識別該頁面是否適合手機瀏覽,wap頁協議分別為:xhtml協議,wml協議,HTML5協議;
第五,移動標準sitemap,google有特定的移動標準sitemap。
最后,周文軍老師給大家分享了大公司SEO項目合作方式及相關挑戰: