微信上其實還有很多你不知道的事,Python微信平臺開發編寫實錄
本文主要講述如何利用Python開發微信公眾平臺。
說明:如果你是Python小白,爬蟲小白,覺得本節課程的代碼晦澀難懂。沒關系,不需要懂,按照步驟一步步操作就可以了。這一節我們主要是搭框架,幾乎沒有真正的爬蟲代碼。這些代碼和操作,你可能一生也就只用這一次。下一節,我們再講述怎么在這個框架上擴展我們的爬蟲程序。
需要的操作:
- 微信公眾賬號的申請。
- 微信接口的獲取,SAE的設置等。
- 簡單的Python爬蟲代碼編寫
需掌握的知識點:
- 了解微信公眾號與云計算平臺之間的連接關系。明確其運行機制。
- 了解web.py的概念,wsgi的機制。
- 了解簡單的python爬蟲知識,json解析,API調用,urllib庫函數。
自動回復實現原理
首先了解一下,到底是什么樣的機制能實現微信的自動回復功能呢?(不是微信系統的自動回復)原理就是微信平臺將用戶輸入的文字發送到云平臺上,然后云平臺上運行的程序捕捉到這一文字信息,就return一個結果,然后云平臺再將該結果返回至微信平臺。最后微信平臺將返回的結果展現給用戶。用一張圖表示一下:

微信開發者模式與SAE的設置
這一節我盡量講的細致一些,如果仍有不清楚的,可以私信我。
首先需要兩大平臺支持:
- 微信公眾平臺;這個申請比較簡單。只要有郵箱就可以免費申請個人版的訂閱號。不再贅述。
- 云計算平臺;我這里使用的SAE(新浪的去年本來就不收費,坑爹,今年開始收費了,單純代碼托管最低一天1毛),也可以用騰訊云。
具體步驟:
微信公眾號的申請。
只要有郵箱就可以免費申請個人版的訂閱號。不再贅述。
SAE的申請及設置
注冊登錄SAE之后,選用SAE

創建新項目,SAE暫時只支持Python2.7,Python3暫時用不了。


如果項目比較小,建議填寫SVN,因為可以在線編輯。如果項目比較大,就Git吧。這里選用SVN。

創建第一個版本

可以開始編輯啦~

編寫config.yaml和index.wsgi文件。
WSGI是PythonWeb服務器網關接口(Python Web Server Gateway Interface)。我們使用的是web.py框架。同類型比較強大的框架有Django,Flask等。為什么選用web.py呢,是因為它是輕量級的,而且有著良好的xml解析功能。插句題外話,web.py的開發者AaronH. Swartz是個十足的天才,可惜英年早逝。有個關于他的一部紀錄片,推薦看一下:互聯網之子。
好了,言歸正傳,我們首先編寫config.yaml
- name: pifuhandashu
- version: 1
- libraries:
- - name: webpy
- version: "0.36"
- - name: lxml
- version: "2.3.4"
- ...
這里我們引入了web.py框架以及lxml模塊,接著我們編寫index.wsgi文件。
- # coding: utf-8
- import os
- import sae
- import web
- from weixinInterface import WeixinInterface
- urls = ('/weixin','WeixinInterface')
- app_root = os.path.dirname(__file__)
- templates_root = os.path.join(app_root, 'templates')
- render = web.template.render(templates_root)
- app = web.application(urls, globals()).wsgifunc()
- application = sae.create_wsgi_app(app)
這里就是簡單的python利用web.py網頁開發的知識了。設置了根目錄,模板目錄,/weixin的路由,開啟應用。
為了使頁面顯得更整潔,我們再新建了一個py文件weixinInterface.py(weixinInterface.py和index.wsgi在同一級目錄,見后面的截圖)。
- 編輯weixinInterface.py,大小寫一定要看清啊,不然很容易出錯。注意自己填寫一個專屬的token,這個等會微信公眾號設置里面有用到。
- # -*- coding: utf-8 -*-
- import hashlib
- import web
- import lxml
- import time
- import os
- import urllib2,json
- from lxml import etree
- class WeixinInterface:
- def __init__(self):
- self.app_root = os.path.dirname(__file__)
- self.templates_root = os.path.join(self.app_root, 'templates')
- self.render = web.template.render(self.templates_root)
- def GET(self):
- #獲取輸入參數
- data = web.input()
- signature = data.signature
- timestamp = data.timestamp
- nonce = data.nonce
- echostr = data.echostr
- #自己的token
- token = "XXXXXXXXXXX" #注意:填寫之后在微信公眾平臺里輸入的token!!!
- #字典序排序
- list = [token, timestamp, nonce]
- list.sort()
- sha1 = hashlib.sha1()
- map(sha1.update,list)
- hashcode = sha1.hexdigest()
- #sha1加密算法
- #如果是來自微信的請求,則回復echostr
- if hashcode == signature:
- return echostr
代碼大致講解一下,def __init__(self)是告訴我們模板文件的加載位置。 def GET(self)是應微信公眾平臺的要求,進行的token驗證。這里的驗證采用的是哈希算法。具體可參考微信官方的接口接入說明:微信公眾平臺接入指南。里面有個php示例。本文采用的是python實現。

微信開發者模式設置
基本設置


修改配置

URL一定要認真填寫,仔細核對。
比如查看url應用信息:


token填寫剛才新浪SAE里面填寫的token,一定要一致。EncodingAESKey可以隨機生成。填完之后點擊提交。如果提示“提交成功”。恭喜你,最關鍵的一步已經完成了。這個階段可能要折騰蠻長時間。完成之后,一定要啟用開發者模式!!!!切記!!!
微信機器人實現
上一步完成之后,我們就可以做一些有趣的事情:微信機器人。不過在此之前,還要完成一小步:模板的創建。由于微信開發是采用的xml的形式。為了先實現文本形式自動回復(后面可以實現回復音頻,圖文信息等形式),首先新建模板文件夾templates,然后在templates文件夾下創建reply_text.xml文件(文件放置位置見后面的截圖)。根據微信消息被動回復所示,填入以下代碼:
- $def with (toUser,fromUser,createTime,content)
- <xml>
- <ToUserName><![CDATA[$toUser]]></ToUserName>
- <FromUserName><![CDATA[$fromUser]]></FromUserName>
- <CreateTime>$createTime</CreateTime>
- <MsgType><![CDATA[text]]></MsgType>
- <Content>$content</Content>
- </xml>
然后,在weixinInterface.py里的def GET(self)后面編寫POST函數。該函數用來獲取用戶的ID,發送的消息類型,發送的時間等。判斷用戶發送的消息類型,如果是純文本類型,if mstype == 'text',那么可以進行下一步操作。
- def POST(self):
- str_xml = web.data() #獲得post來的數據
- xml = etree.fromstring(str_xml)#進行XML解析
- mstype = xml.find("MsgType").text#消息類型
- fromUser = xml.find("FromUserName").text
- toUser = xml.find("ToUserName").text

為了實現微信機器人,我們需要實現自動回復的內容。這里有兩種方式。
- 爬取網上的機器人回復的內容,比如找不到小黃雞的接口,我就自己爬蟲爬取它的回復結果。
- 調用自動能夠回復的機器人API。
這里我選用第二種方法,采用的是圖靈機器人的API。這種方法方便快捷,一般不會被墻。但是自由度不高,可拓展性差。
注冊圖靈機器人賬號,注意是采用圖靈的網頁api,而不是授權。獲取圖靈機器人回復的key。幾行代碼就可以搞定微信機器人自動回復啦~
源碼展示
index.wsgi源碼
- # coding: utf-8
- import os
- import sae
- import web
- from weixinInterface import WeixinInterface
- urls = (
- '/weixin','WeixinInterface',
- )
- app_root = os.path.dirname(__file__)
- templates_root = os.path.join(app_root, 'templates')
- render = web.template.render(templates_root)
- app = web.application(urls, globals()).wsgifunc()
- application = sae.create_wsgi_app(app)
config.yaml源碼
- name: myzhihu
- version: 1
- libraries:
- - name: webpy
- version: "0.36"
- - name: lxml
- version: "2.3.4"
- ...
templates下的reply_text.xml源碼
- $def with (toUser,fromUser,createTime,content)
- <xml>
- <ToUserName><![CDATA[$toUser]]></ToUserName>
- <FromUserName><![CDATA[$fromUser]]></FromUserName>
- <CreateTime>$createTime</CreateTime>
- <MsgType><![CDATA[text]]></MsgType>
- <Content>$content</Content>
- </xml>
weixinInterface.py源碼
- # -*- coding: utf-8 -*-
- import hashlib
- import web
- import lxml
- import time
- import os
- import json
- import urllib
- from lxml import etree
- class WeixinInterface:
- def __init__(self):
- self.app_root = os.path.dirname(__file__)
- self.templates_root = os.path.join(self.app_root, 'templates')
- self.render = web.template.render(self.templates_root)
- def GET(self):
- #獲取輸入參數
- data = web.input()
- signature=data.signature
- timestamp=data.timestamp
- nonce=data.nonce
- echostr=data.echostr
- #自己的token
- token="################" #這里填寫在微信公眾平臺里輸入的token
- #字典序排序
- list=[token,timestamp,nonce]
- list.sort()
- sha1=hashlib.sha1()
- map(sha1.update,list)
- hashcode=sha1.hexdigest()
- #sha1加密算法
- #如果是來自微信的請求,則回復echostr
- if hashcode == signature:
- return echostr
- def POST(self):
- str_xml = web.data() #獲得post來的數據
- xml = etree.fromstring(str_xml)#進行XML解析
- mstype = xml.find("MsgType").text
- fromUser = xml.find("FromUserName").text
- toUser = xml.find("ToUserName").text
- if mstype == 'text':
- content = xml.find("Content").text#獲得用戶所輸入的內容
- key = '#####################' ###圖靈機器人的key
- api = 'http://www.tuling123.com/openapi/api?key=' + key + '&info='
- info = content.encode('UTF-8')
- url = api + info
- page = urllib.urlopen(url)
- html = page.read()
- dic_json = json.loads(html)
- reply_content = dic_json['text']
- return self.render.reply_text(fromUser,toUser,int(time.time()),reply_content)

尾記
本次教程實現了利用Python開發微信公眾平臺,能夠自動回復用戶輸入的文字。包括了微信公眾平臺的設置,SAE的設置,相關代碼的編寫等。