怎么在python中使用jieba.analyse提取关键词-创新互联
这篇文章给大家介绍怎么在python中使用jieba.analyse提取关键词,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
创新互联公司是一家专业提供阿巴嘎企业网站建设,专注与成都做网站、网站设计、外贸营销网站建设、成都h5网站建设、小程序制作等业务。10年已为阿巴嘎众多企业、政府机构等服务。创新互联专业网站制作公司优惠进行中。1、简单应用
代码如下:
#!/usr/bin/env python # -*- coding: utf-8 -*- # @File : jieba.analyse.py # @Author: 赵路仓 # @Date : 2020/3/14 # @Desc : 提取关键字 # @Contact : 398333404@qq.com import jieba.analyse text='安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开' Key=jieba.analyse.extract_tags(text,topK=3) print(Key)
2、含参使用
keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())
第一个参数:待提取关键词的文本
第二个参数:返回关键词的数量,重要性从高到低排序
第三个参数:是否同时返回每个关键词的权重
第四个参数:词性过滤,为空表示不过滤,若提供则仅返回符合词性要求的关键词
代码如下:
#!/usr/bin/env python # -*- coding: utf-8 -*- # @File : jieba.analyse.py # @Author: 赵路仓 # @Date : 2020/3/14 # @Desc : 提取关键字 # @Contact : 398333404@qq.com import jieba.analyse # 字符串前面加u表示使用unicode编码 content = u'安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开' keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=()) # 访问提取结果 for item in keywords: # 分别为关键词和相应的权重 print(item[0], item[1])
关于怎么在python中使用jieba.analyse提取关键词就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
文章标题:怎么在python中使用jieba.analyse提取关键词-创新互联
路径分享:http://cdiso.cn/article/ccgioe.html