安裝Python 解析器函數聲明
在標準Python 解析器中,有關缺省變量值的限制非常模糊。基于此,很多編譯器允許開發人員將缺省變量值包含在函數聲明,指向函數的指針和引用,成員函數的指針,以及typedef聲明中。
首先初步了解 DParser 這一由 J. Plevyak 編寫的簡單而強大的解析工具。然后了解用于 Python 的 DParser,它為 Python 程序員提供了一個訪問 DParser 的無縫接口,并看看它與上一期中介紹的解析器的比較。語法規則以類似于 Spark 或 PLY 的方式通過 Python 函數文檔字符串加入到 DParser 中。 有很多可用的 Python 解析器程序庫。
DParser 與所有其他解析器的不同之處是什么?是這樣,類似于 PLY 和 Spark,用于 Python 的 DParser 使用函數文檔字符串來表示其結果(productions)。這種風格使得您可以將動作代碼直接插入到一個結果中,以處理當一個特定的語法規則得到滿足時將發生的事件。
與 PLY 或 Spark 相反,DParser 本身是用 C 編寫的,因而可能會比純粹的 Python 解析器快得多。用于 Python 的 DParser 是底層的 C 程序庫之外的一個非常精簡的包裝器(wrapper) —— 對 Python 的回調需要一些額外的時間。
但是基本的解析是以 C 語言的速度來進行的。不過,就本文而言,我沒有嘗試進行任何具體的基準測試。所以,相對于其他解析器來說,DParser 到底有多快或多慢不是我所能直接評論的。有很多讀者推薦說用于 Python DParaser 值得關注。順便提一句,如您將在示例中所看到的,DParser 不使用任何單獨的標記傳遞。
而只是直接解析。您可以通過定義保留的 d_whitespace() 函數來控制空格的識別(它分離解析符號);這樣就使得您可以隨意使用標記。 后面跟有問號的結果是推測性的嘗試;那些后面其實沒有最終的結果。與此相關, DParser 讓您有能力當結果成為推測的或者是最終解析時采取不同的動作。
默認情況下,函數體中的動作只作用于最終解析。不過,您可以向結果指定兩個額外參數中的一個來處理推測性解析。(還有很多本文中沒有討論的選項參數。) 盡管得到了一些讀者的建議,我還是不太看重 DParser。它有很多可以作用于結果的強大的開關和選項,我還沒有討論到 —— 比如指定關聯性。
大體上,DParser 語言非常健壯,我非常懷疑用于 Python 的 DParser 是否會比純粹的 Python 解析器運行速度快得非常多。 無論如何,我仍然不能對函數文檔字符串風格的解析器具有太多熱情。顯然,關于這一點,很多優秀的 Python 程序員不會贊同我。
此外我還發現一些解析結果有些令人不解:為什么調試模式下可以成功,而標準模式下卻不能成功?含糊問題確切是什么時候發生的?使用任何解析工具開發語法都會有類似的意外,但是我發現 DParser 不知何故尤其出乎意料;例如 SimpleParse,就不會讓我那么感到驚訝。
可能,如果我了解了底層算法的更多復雜細節,它將會更具意義;不過,就我相對淺薄的學識而言,我可能與 95% 以上的讀者差不多。有人比我更加熟悉解析;但是實際上大部分程序員懂得更少。
Python是一門功能強大的高級腳本語言,它的強大不僅表現在其自身的功能上,而且還表現在其良好的可擴展性上,正因如此,Python已經開始受到越來越多人的青睞,并且被屢屢成功地應用于各類大型軟件系統的開發過程中。
與其它普通腳本語言有所不同,Python程序員可以借助Python語言提供的API,使用C或者C++來對Python進行功能性擴展,從而即可以利用Python方便靈活的語法和功能,又可以獲得與C或者C++幾乎相同的執行性能。
執行速度慢是幾乎所有腳本語言都具有的共性,也是倍受人們指責的一個重要因素,Python則通過與C語言的有機結合巧妙地解決了這一問題,從而使腳本語言的應用范圍得到了很大擴展。
在用Python 解析器開發實際軟件系統時,很多時候都需要使用C/C++來對Python進行擴展。最常見的情況是目前已經存在一個用C編寫的庫,需要在Python語言中使用該庫的某些功能。
此時就可以借助Python提供的擴展功能來實現。此外,由于Python從本質上講還是一種腳本語言,某些功能用Python實現可能很難滿足實際軟件系統對執行效率的要求,此時也可以借助Python提供的擴展功能,將這些關鍵代碼段用C或者C++實現,從而提供程序的執行性能。
【編輯推薦】