自然語(yǔ)言處理必讀:5本平衡理論與實(shí)踐的書(shū)籍
本文轉(zhuǎn)載自公眾號(hào)“讀芯術(shù)”(ID:AI_Discovery)。
當(dāng)談到學(xué)習(xí)方法時(shí),我們常常會(huì)提到教程、博客文章、在線課程等等,書(shū)本總是會(huì)被忽略掉。即使是在找一本關(guān)于某個(gè)主題的書(shū),也會(huì)很快發(fā)現(xiàn)這樣的書(shū)太多了,無(wú)法快速判斷哪一本最適合自己。
為了幫助你解決問(wèn)題,我?guī)湍氵x擇5本關(guān)于自然語(yǔ)言處理的書(shū),不像其他的書(shū)單,除了第一本之外,這些書(shū)都不是免費(fèi)的,但事實(shí)證明它們是值得投資的,希望能對(duì)大家有所幫助。
1. 應(yīng)用Python進(jìn)行自然語(yǔ)言處理(Natural Language Processing with Python)
本書(shū)由Steven Bird, Ewan Klein 和 Edward Loper編寫(xiě),你可以從Python系統(tǒng)的角度學(xué)習(xí)自然語(yǔ)言處理的實(shí)用基礎(chǔ)知識(shí),更適合初學(xué)者。它也稱(chēng)為NLTK書(shū)籍,應(yīng)用Python進(jìn)行自然語(yǔ)言處理在整個(gè)過(guò)程中都很大程度上依賴(lài)于NLTK庫(kù)。以下摘自這本書(shū)的序言:
“本書(shū)對(duì)NLP領(lǐng)域介紹通俗易懂。它可以用于個(gè)人學(xué)習(xí),也可以作為自然語(yǔ)言處理或計(jì)算語(yǔ)言學(xué)課程的教科書(shū),或者作為人工智能、文本挖掘或語(yǔ)料庫(kù)語(yǔ)言學(xué)課程的補(bǔ)充。本書(shū)非常實(shí)用,包含數(shù)百個(gè)例子和分級(jí)練習(xí)。本書(shū)適合所有人,無(wú)論以前的編程經(jīng)驗(yàn)如何,只要你想學(xué)如何編程并分析書(shū)面語(yǔ)言,就可以讀它。”
如上所述,這本書(shū)絕對(duì)實(shí)用。雖然你肯定會(huì)在進(jìn)行過(guò)程中得到概念解釋?zhuān)翢o(wú)疑問(wèn),這本書(shū)的確是為那些希望用Python實(shí)現(xiàn)NLP解決方案的人而設(shè)計(jì)的。
2. 使用PyTorch進(jìn)行自然語(yǔ)言處理(NaturalLanguage Processing with PyTorch)
本書(shū)的作者是Delip Rao和Brian McMahan,其中并沒(méi)有介紹NLP領(lǐng)域的傳統(tǒng)技術(shù),而是介紹了如今使用的神經(jīng)網(wǎng)絡(luò)。這門(mén)學(xué)科的另一種實(shí)用方法是使用PyTorch進(jìn)行自然語(yǔ)言處理,將神經(jīng)網(wǎng)絡(luò)應(yīng)用于NLP中。
從這本書(shū)的網(wǎng)站你可以直接看到一些主題,包括:
- 探索計(jì)算圖表和監(jiān)督學(xué)習(xí)范式
- 掌握PyTorch優(yōu)化張量操作庫(kù)的基礎(chǔ)知識(shí)
- 對(duì)傳統(tǒng)的NLP概念和方法進(jìn)行概述
- 學(xué)習(xí)建立神經(jīng)網(wǎng)絡(luò)的基本概念
- 使用嵌入來(lái)表示單詞、句子、文檔和其他特性
- 探索序列預(yù)測(cè)并生成Seq2seq模型
- 學(xué)習(xí)構(gòu)建生產(chǎn)NLP系統(tǒng)的設(shè)計(jì)模式
從更傳統(tǒng)的(基于非神經(jīng)網(wǎng)絡(luò))NLP技術(shù)到當(dāng)代NLP,NLP越來(lái)越依賴(lài)于深度學(xué)習(xí)。
3. 用神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行自然語(yǔ)言處理(Neural Network Methods for Natural Language Processing)
這是Yoav Goldberg寫(xiě)的關(guān)于NLP的神經(jīng)網(wǎng)絡(luò)方法的書(shū)。本書(shū)針對(duì)NLP相關(guān)的概念進(jìn)行了深入解釋?zhuān)憧梢詫W(xué)習(xí)如何輕松地用代碼實(shí)現(xiàn)它們。以下摘自本書(shū)網(wǎng)站:
“這本書(shū)著重于神經(jīng)網(wǎng)絡(luò)模型在自然語(yǔ)言數(shù)據(jù)中的應(yīng)用。本書(shū)第一部分和第二部分涵蓋了監(jiān)督機(jī)器學(xué)習(xí)和前饋神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí),在語(yǔ)言數(shù)據(jù)上使用機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí),以及使用基于向量而不是符號(hào)表征的單詞。”
“本書(shū)第三部分和第四部分介紹了更專(zhuān)業(yè)的神經(jīng)網(wǎng)絡(luò)架構(gòu),包括一維卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)、條件生成模型和基于注意力的模型。這些架構(gòu)和技術(shù)是機(jī)器翻譯、句法分析和許多其他應(yīng)用程序的最新算法背后的驅(qū)動(dòng)力。”
在理論或解釋性領(lǐng)域,自然語(yǔ)言處理的神經(jīng)網(wǎng)絡(luò)方法將大大加強(qiáng)你對(duì)基于現(xiàn)代神經(jīng)網(wǎng)絡(luò)的NLP方法是如何工作的理解。
4. 自然語(yǔ)言處理的語(yǔ)言學(xué)基礎(chǔ)(LinguisticFundamentals for Natural Language Processing)
在使用NLP時(shí),盲目學(xué)習(xí)語(yǔ)言基礎(chǔ)并不好一個(gè)好主意,而且在缺乏任何語(yǔ)言正式學(xué)習(xí)經(jīng)歷的情況下,如果要從純計(jì)算的角度研究NLP或計(jì)算語(yǔ)言學(xué)時(shí),你要注意的地方就有很多了。本書(shū)旨在幫助你彌合這一差距。
網(wǎng)站上這樣描述此書(shū):
- 本書(shū)旨在提供一種簡(jiǎn)潔易懂的信息,它關(guān)于形態(tài)和句法結(jié)構(gòu)的人類(lèi)語(yǔ)言,可以用于創(chuàng)造更復(fù)雜、更獨(dú)立的語(yǔ)言,因此是更成功的NLP系統(tǒng)。”
- 本書(shū)第一章的以下內(nèi)容支撐這一點(diǎn):關(guān)于語(yǔ)言結(jié)構(gòu)的知識(shí)可以為NLP的機(jī)器學(xué)習(xí)方法提供特征設(shè)計(jì)的信息。更具體地說(shuō):語(yǔ)言結(jié)構(gòu)的知識(shí)將導(dǎo)致機(jī)器學(xué)習(xí)呈現(xiàn)更好的特征。”
- 本書(shū)由100個(gè)為更好地理解形態(tài)和語(yǔ)法的要點(diǎn)組成,與要點(diǎn)組成相關(guān)主題的章節(jié)也包含在內(nèi)。如果你沒(méi)有語(yǔ)言學(xué)背景,讀起來(lái)可能有些辛苦,但它將讓你更好地理解語(yǔ)言,并在NLP職業(yè)生涯中熟練使用。”
5. 自然語(yǔ)言處理實(shí)踐(NaturalLanguage Processing in Action)
Hobson Lane, Hannes Hapke 和Cole Howard合著的這本書(shū)將帶我們回到現(xiàn)實(shí)。本書(shū)涵蓋了傳統(tǒng)的和基于神經(jīng)網(wǎng)絡(luò)的NLP方法,可以看作是書(shū)單中前兩本書(shū)的組合,其中涵蓋了使用現(xiàn)代工具,如TensorFlow和Keras的實(shí)際編碼解決方案。
摘自本書(shū)網(wǎng)站:
“《自然語(yǔ)言處理實(shí)際應(yīng)用》是一本指南,幫助你建立可以閱讀和解釋人類(lèi)語(yǔ)言的機(jī)器。你將使用現(xiàn)成的Python包來(lái)捕獲文本中的含義并做出反應(yīng)。本書(shū)擴(kuò)展了傳統(tǒng)的NLP方法,包括神經(jīng)網(wǎng)絡(luò)、現(xiàn)代深度學(xué)習(xí)算法和生成技術(shù),幫助你解決現(xiàn)實(shí)問(wèn)題,如提取日期和名字,編寫(xiě)文本,和回答自由形式的問(wèn)題。”
圖源:unsplash
本書(shū)是目前市場(chǎng)上最新的、最全面和最實(shí)用的書(shū)。但你也可以根據(jù)想要進(jìn)入的系統(tǒng)以及想要獲得的細(xì)節(jié)水平,并考慮其他一些因素,來(lái)選擇更適合自己的書(shū)籍。
這5本都是絕對(duì)值得一讀的好書(shū),你要做的是弄清楚自己到底想學(xué)什么,再做出相應(yīng)的選擇,接著讀下去,絕對(duì)會(huì)大有收獲。