NLP領(lǐng)域索引神器,3000+代碼庫(kù),一鍵查找論文、GitHub庫(kù)
說到搜索,學(xué)術(shù)搜索也是一門學(xué)問。
擅于運(yùn)用搜索可以幫助你快速尋找想要的學(xué)術(shù)資料,起到事半功倍的效果。比如我們常用到的論文及對(duì)應(yīng)源碼的神器 Papers With Code,就收錄了很多 SOTA 論文和代碼,直接搜索論文關(guān)鍵字就可以得到相關(guān)的論文和代碼,還可以分領(lǐng)域進(jìn)行搜索;又比如 arXiv 與文獻(xiàn)調(diào)研神器 Connected Papers 強(qiáng)強(qiáng)聯(lián)合,每篇 arXiv 論文可以在摘要頁(yè)面直接鏈接到其在 Connected Papers 中的關(guān)聯(lián)論文圖。
這種超級(jí)實(shí)用的搜索工具,可以方便研究者查找學(xué)術(shù)資料,節(jié)省了大量時(shí)間,并且可以提供最優(yōu)搜索結(jié)果。
這里我們介紹一個(gè)非常實(shí)用的 NLP 索引工具「The NLP Index」,同樣也是為學(xué)術(shù)搜索而開發(fā),它是免費(fèi)且開源的。

項(xiàng)目地址:https://index.quantumstat.com/
「The NLP Index」擁有 3000 多個(gè)代碼庫(kù),使用者可以搜索其中一個(gè)側(cè)欄,側(cè)欄中包含當(dāng)今 NLP 中一些最重要的主題。當(dāng)你鍵入相關(guān)內(nèi)容時(shí),就可以進(jìn)行搜索。其索引包括 arxiv 研究論文 PDF 格式、文獻(xiàn)調(diào)研神器 ConnectedPapers 鏈接及其相應(yīng)的 GitHub 代碼庫(kù),可謂將這三款學(xué)術(shù)神器進(jìn)行了綜合。
「The NLP Index」介紹
「The NLP Index」左側(cè)欄有 10 個(gè)模塊,如下圖所示,包括數(shù)據(jù)(數(shù)據(jù)擴(kuò)充、數(shù)據(jù)集等)、任務(wù)(關(guān)系提取、語音識(shí)別等)、相關(guān)領(lǐng)域(醫(yī)療、金融等)、模型(BERT、BART 等)、語言類型(跨語言、多語言等)、模型范圍(字符級(jí)別、句子級(jí)別等)、包含架構(gòu)(編碼器、解碼器等)、PIPELINE 等。

我們以左側(cè)欄中第三個(gè)模塊「MODELS(模型)」為例。點(diǎn)擊該模塊,下拉框會(huì)出現(xiàn)如下圖所示的界面,在「MODELS(模型)」下面包含有比較常用到的模型,比如 cnn、rnn、bart、bert、gpt-2等。

MODELS 下拉框包含的部分內(nèi)容。
我們隨機(jī)點(diǎn)擊其中任意模型,如「bert」,右側(cè)會(huì)顯示出帶有「BERT」關(guān)鍵字的相關(guān)論文,并以藍(lán)色字體突出顯示,除此以外還會(huì)顯示論文摘要、論文作者、論文 PDF 鏈接、Graph 鏈接以及 GitHub 鏈接,方便使用者快速查找。

當(dāng)鼠標(biāo)放在對(duì)應(yīng)的模塊上面(如摘要、作者等),相關(guān)內(nèi)容會(huì)全部顯示,以供使用者了解該論文的整體內(nèi)容。

除此以外,「The NLP Index」還關(guān)聯(lián)了 Connected Papers,點(diǎn)擊 Graph 界面跳轉(zhuǎn)至生成的文獻(xiàn)分析網(wǎng)絡(luò)圖,結(jié)果頁(yè)面分三欄,左邊一欄是本文以及相關(guān)參考文獻(xiàn)的題目,右邊一欄是相關(guān)參考文獻(xiàn)的具體內(nèi)容,而中間一欄是文獻(xiàn)檢索分析圖譜。可以在線進(jìn)行分析文獻(xiàn)的引文信息,輕松了解某篇文獻(xiàn)的引用和被引用關(guān)聯(lián),分析出文獻(xiàn)的前世今生,方便研究者對(duì)一篇文獻(xiàn)或者某個(gè)領(lǐng)域進(jìn)行調(diào)研。

對(duì)于這個(gè)免費(fèi)且開放的索引工具,有網(wǎng)友表示:「這太神奇了。數(shù)據(jù)來自 Papers With Code 嗎?」

還有網(wǎng)友表示:「非常感謝為其他人提供了便利。」
