新聞中心
它是自然語(yǔ)言處理中的重要過(guò)程之一。 分塊的主要工作是識(shí)別詞類(lèi)和短語(yǔ),如名詞短語(yǔ)。 我們已經(jīng)研究了令牌化的過(guò)程,即令牌的創(chuàng)建。 分塊基本上就是這些令牌的標(biāo)簽。 換句話說(shuō),組塊會(huì)告訴我們句子的結(jié)構(gòu)。

創(chuàng)新互聯(lián)主營(yíng)薌城網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營(yíng)網(wǎng)站建設(shè)方案,重慶APP開(kāi)發(fā)公司,薌城h5微信小程序搭建,薌城網(wǎng)站營(yíng)銷(xiāo)推廣歡迎薌城等地區(qū)企業(yè)咨詢
在下面的章節(jié)中,我們將學(xué)習(xí)不同類(lèi)型的分塊。
組塊的類(lèi)型
有兩種類(lèi)型的組塊。 類(lèi)型如下 -
- 上分塊 在這個(gè)組塊過(guò)程中,對(duì)象,事物等向更普遍的方向發(fā)展,語(yǔ)言變得更加抽象。 有更多的協(xié)議機(jī)會(huì)。 在這個(gè)過(guò)程中縮小。 例如,如果將“汽車(chē)是為了什么目的”這個(gè)問(wèn)題大肆渲染?我們可能會(huì)得到答案是:“運(yùn)輸”。
- 下分塊 在這個(gè)組塊過(guò)程中,對(duì)象,事物等朝著更具體的方向發(fā)展,語(yǔ)言更加滲透。 更深層次的結(jié)構(gòu)將進(jìn)行仔細(xì)檢查。 在這個(gè)過(guò)程中會(huì)放大。例如,如果將“專門(mén)講述一輛汽車(chē)”這個(gè)問(wèn)題歸納起來(lái)? 會(huì)得到關(guān)于汽車(chē)的更小的信息。
示例
在這個(gè)例子中,我們將通過(guò)使用 Python 中的 NLTK 模塊來(lái)進(jìn)行 Noun-Phrase chunking,這是一種 chunking 類(lèi)別,它可以在句子中找到名詞短語(yǔ)塊,
在 python 中執(zhí)行這些步驟來(lái)實(shí)現(xiàn)名詞短語(yǔ)分塊 -
第1步 - 在這一步中,需要定義分塊的語(yǔ)法。 它將包含需要遵循的規(guī)則。 第2步 - 在這一步中,需要?jiǎng)?chuàng)建一個(gè)塊解析器。 它會(huì)解析語(yǔ)法并給出結(jié)果。 第3步 - 在最后一步中,輸出以樹(shù)格式生成。
按照以下步驟導(dǎo)入必要的 NLTK 包 -
import nltk現(xiàn)在,我們需要定義這個(gè)句子。 這里,DT 表示行列式,VBP 表示動(dòng)詞,JJ 表示形容詞,IN 表示介詞,NN 表示名詞。
sentence=[("a","DT"),("clever","JJ"),("fox","NN"),("was","VBP"),
("jumping","VBP"),("over","IN"),("the","DT"),("wall","NN")]現(xiàn)在,我們需要給出語(yǔ)法。 在這里以正則表達(dá)式的形式給出語(yǔ)法。
grammar = "NP:{?*}" 我們需要定義一個(gè)解析器來(lái)解析語(yǔ)法。
parser_chunking = nltk.RegexpParser(grammar)解析器解析該句子如下 -
parser_chunking.parse(sentence) 接下來(lái),需要獲得輸出。 輸出在名為 output_chunk 的變量中生成。
Output_chunk = parser_chunking.parse(sentence)執(zhí)行以下代碼后,以樹(shù)的形式繪制輸出結(jié)果。
output.draw()執(zhí)行上面代碼,得到以下結(jié)果 -
本文標(biāo)題:創(chuàng)新互聯(lián)AI教程:AI人工智能塊化:將數(shù)據(jù)分割成塊
轉(zhuǎn)載來(lái)于:http://www.dlmjj.cn/article/dhsjjjj.html


咨詢
建站咨詢
