最新动态
基于word文档,使用Python输出关键词和词频,并将关键词的词性也标注出来
2024-10-31 23:13

大家好,我是Python进阶者。

基于word文档,使用Python输出关键词和词频,并将关键词的词性也标注出来

一、前言

前几天在有个粉丝问了个问题,大概意思是这样的:基于Python代码,要求输出word文档中的关键词和词频,并且将关键词的词性也标注出来,最终输出一个Excel文件,一共3列,列名分别是关键词、词频和词性。

二、实现过程

这里一开始我也不知道怎么处理,后来问了科大讯飞的AI平台,给了一个代码,如下所示,但是跑不起来。

一直提示AttributeError: 'str' object has no attribute 'tag',没办法,方法是好的,把tag改为flag,也不好使。后来求助了Zelinai,其给了一个解决方法,如下所示:

可以使用 Python 中的 docx 和 openpyxl 库实现该功能,具体步骤如下:

下面是可能的实现代码:

请注意在使用前需要先安装 jieba, nltk 和 openpyxl 库。

这里运行之后,会出现一个这样的报错,(nltk加载词性词库报错)Resource averaged_perceptron_tagger not found. Please use the NLTK Downloader to obtain the resource:。

其实就是未找到资源averaged_perceptron_tagger,请使用NLTK下载器获取资源。根据报错给的URL,然后去下载对应的语义安装包即可,然后放到任意的一个目录之下,就出来了。

查了蛮多资料,后来总算是找到了一个靠谱的解决方法。

最后就可以得到预取的结果了,如下图所示:

    以上就是本篇文章【基于word文档,使用Python输出关键词和词频,并将关键词的词性也标注出来】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/quote/4609.html 
     行业      资讯      企业新闻      行情      企业黄页      同类资讯      网站地图      返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多