0
| 本文作者: skura | 2019-03-28 18:34 |
雷鋒網(wǎng) AI 科技評論按,人工智能技術(shù)目前越來越火爆,近日,2018 年圖靈獎(jiǎng)得主揭曉,獲獎(jiǎng)的三位科學(xué)家是分別是 Yoshua Bengio、Yann LeCun 和 Geoffrey Hinton。相信在人工智能領(lǐng)域,沒有人不知道這三位,眾所周知,他們被稱為「深度學(xué)習(xí)三巨頭」。
作為人工智能領(lǐng)域「皇冠上的明珠」,NLP 技術(shù)在經(jīng)歷了過去幾年的發(fā)展之后,證明了它落地的可行性,因此目前也是相當(dāng)火爆。想必同學(xué)們也會經(jīng)常在網(wǎng)上找一些好的學(xué)習(xí)資源。
最近,小編在 github 上發(fā)現(xiàn)了一份基于 PyTorch 和 keras 的 NLP 學(xué)習(xí)教程。這份教程內(nèi)容相當(dāng)豐富,內(nèi)容涵蓋神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯、問答匹配、電影評價(jià)分類、新聞分類等多個(gè)領(lǐng)域。
項(xiàng)目的 GitHub 地址為:https://github.com/lyeoni/nlp-tutorial。
這是一個(gè)教你逐步實(shí)現(xiàn)和適應(yīng)簡單的實(shí)詞 NLP 任務(wù)的教程:

項(xiàng)目里面有 4 個(gè)資源:神經(jīng)機(jī)器翻譯、問答匹配、新聞分類和電影分級。這些資源都提供了源碼,對初學(xué)者來說,極為友好。初學(xué)者可以學(xué)會建立自己的模型。
廢話就不多說了,讓我們一起來具體看看這些資源吧~
神經(jīng)機(jī)器翻譯:這個(gè) repo 提供了神經(jīng)機(jī)器翻譯的簡單 PyTorch 實(shí)現(xiàn),以及機(jī)器翻譯過程中各種序列到序列(seq2seq)模型的比較。
關(guān)鍵詞:序列到序列網(wǎng)絡(luò)(seq2seq),注意機(jī)制,自回歸,Teacher-forcing
問答匹配:這個(gè) repo 提供了簡單的 PyTorch 問答匹配實(shí)現(xiàn)。在這里,我們使用來自 Stack Exchange 的英語語料庫來構(gòu)建整個(gè)問題的嵌入。使用這些嵌入,我們找到給定問題的類似問題,并找到相應(yīng)的答案。
關(guān)鍵詞: 長度可變的 LSTM 序列,TF-IDF,文本分類
新聞分類:此報(bào)告包含一個(gè)簡單的源代碼,用于基于 textcn 的文本分類。語料庫是英文的赫夫波斯特新聞分類數(shù)據(jù)集。大多數(shù)開放源代碼對于初學(xué)者來說有點(diǎn)難以學(xué)習(xí)和建立文本分類模型。所以,我希望這個(gè) repo 對于那些想要擁有自己的文本分類模型的人來說是一個(gè)很好的解決方案。
關(guān)鍵詞:textcn,文本分類,文本分類
電影分級(韓國 NLP):此 repo 包含一個(gè)簡單的源代碼,用于基于 TextCNN 的文本分類任務(wù)中。其語料庫是 Huffpost 的新聞分類數(shù)據(jù)集。對初學(xué)者來說,學(xué)習(xí)大多數(shù)開放源代碼、建立文本分類模型是有難度的。所以,我希望這個(gè) repo 可以幫助他們擁有自己的文本分類模型。
關(guān)鍵詞:TextCNN、文本分類、情感分析
如果在學(xué)習(xí)中遇到相關(guān)問題,還可以點(diǎn)擊下面的網(wǎng)址,加入小組答疑:https://github.com/lyeoni/nlp-tutorial/tree/master/question-answering-SQuAD
擁有這么好的資源,同學(xué)們趕快開始學(xué)習(xí)吧!
via:https://github.com/lyeoni/nlp-tutorial
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。