python 利用jieba.analyse進(jìn)行 關(guān)鍵詞提取
代碼如下:
#!/usr/bin/env python# -*- coding: utf-8 -*-# @File : jieba.analyse.py# @Author: 趙路倉(cāng)# @Date : 2020/3/14# @Desc : 提取關(guān)鍵字# @Contact : 398333404@qq.comimport jieba.analysetext=’安全、防止水合物和段塞生成的重要措施之一。因此,針對(duì)未來(lái)還上油田開(kāi)發(fā)技術(shù),我們預(yù)先開(kāi)展了水深1500米管道式油氣水分離器的概念設(shè)計(jì)。通過(guò)該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開(kāi)’Key=jieba.analyse.extract_tags(text,topK=3)print(Key)
keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=()) 第一個(gè)參數(shù):待提取關(guān)鍵詞的文本 第二個(gè)參數(shù):返回關(guān)鍵詞的數(shù)量,重要性從高到低排序 第三個(gè)參數(shù):是否同時(shí)返回每個(gè)關(guān)鍵詞的權(quán)重 第四個(gè)參數(shù):詞性過(guò)濾,為空表示不過(guò)濾,若提供則僅返回符合詞性要求的關(guān)鍵詞
代碼如下:
#!/usr/bin/env python# -*- coding: utf-8 -*-# @File : jieba.analyse.py# @Author: 趙路倉(cāng)# @Date : 2020/3/14# @Desc : 提取關(guān)鍵字# @Contact : 398333404@qq.comimport jieba.analyse# 字符串前面加u表示使用unicode編碼content = u’安全、防止水合物和段塞生成的重要措施之一。因此,針對(duì)未來(lái)還上油田開(kāi)發(fā)技術(shù),我們預(yù)先開(kāi)展了水深1500米管道式油氣水分離器的概念設(shè)計(jì)。通過(guò)該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開(kāi)’keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())# 訪問(wèn)提取結(jié)果for item in keywords: # 分別為關(guān)鍵詞和相應(yīng)的權(quán)重 print(item[0], item[1])
以上就是python 利用jieba.analyse進(jìn)行 關(guān)鍵詞提取的詳細(xì)內(nèi)容,更多關(guān)于python 關(guān)鍵詞提取的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. 前端html+css實(shí)現(xiàn)動(dòng)態(tài)生日快樂(lè)代碼2. 不要在HTML中濫用div3. el-input無(wú)法輸入的問(wèn)題和表單驗(yàn)證失敗問(wèn)題解決4. CSS3實(shí)例分享之多重背景的實(shí)現(xiàn)(Multiple backgrounds)5. XML基本概念XPath、XSLT與XQuery函數(shù)介紹6. XML入門(mén)的常見(jiàn)問(wèn)題(四)7. WML的簡(jiǎn)單例子及編輯、測(cè)試方法第1/2頁(yè)8. vue實(shí)現(xiàn)復(fù)制文字復(fù)制圖片實(shí)例詳解9. 關(guān)于html嵌入xml數(shù)據(jù)島如何穿過(guò)樹(shù)形結(jié)構(gòu)關(guān)系的問(wèn)題10. XML入門(mén)的常見(jiàn)問(wèn)題(三)
