大家好,我是Python进阶者。
一、前言
前几天在有个粉丝问了个问题,大概意思是这样的:基于Python代码,要求输出word文档中的关键词和词频,并且将关键词的词性也标注出来,最终输出一个Excel文件,一共3列,列名分别是关键词、词频和词性。
二、实现过程
这里一开始我也不知道怎么处理,后来问了科大讯飞的AI平台,给了一个代码,如下所示,但是跑不起来。
一直提示AttributeError: 'str' object has no attribute 'tag',没办法,方法是好的,把tag改为flag,也不好使。后来求助了Zelinai,其给了一个解决方法,如下所示:
可以使用 Python 中的 docx 和 openpyxl 库实现该功能,具体步骤如下:
下面是可能的实现代码:
请注意在使用前需要先安装 jieba, nltk 和 openpyxl 库。
这里运行之后,会出现一个这样的报错,(nltk加载词性词库报错)Resource averaged_perceptron_tagger not found. Please use the NLTK Downloader to obtain the resource:。
其实就是未找到资源averaged_perceptron_tagger,请使用NLTK下载器获取资源。根据报错给的URL,然后去下载对应的语义安装包即可,然后放到任意的一个目录之下,就出来了。
查了蛮多资料,后来总算是找到了一个靠谱的解决方法。
最后就可以得到预取的结果了,如下图所示:
以上就是本篇文章【基于word文档,使用Python输出关键词和词频,并将关键词的词性也标注出来】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/quote/4609.html 行业 资讯 企业新闻 行情 企业黄页 同类资讯 网站地图 返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多