Python数据挖掘-关键字提取

Posted 我不要被你记住

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python数据挖掘-关键字提取相关的知识,希望对你有一定的参考价值。

jieba.analyse.extract_tags(sentence, topK=20, withWeight=False, allowPOS=())

sentence 为待提取的文本
topK 为返回几个 TF/IDF 权重最大的关键词,默认值为 20
withWeight 为是否一并返回关键词权重值,默认值为 False
allowPOS 仅包括指定词性的词,默认值为空,即不筛选

 

模块:os、codecs、pandas、jieba、

 

import os
import codecs
import pandas
import jieba
import jieba.analyse

filePaths = []
contents = []
tag1s = []
tag2s = []
tag3s = []
tag4s = []
tag5s = []

for root, dirs, files in os.walk(
    "D:\PDM\2.6\SogouC.mini\Sample\"
):
    for name in files:
        filePath = root + \ + name;
        f = codecs.open(filePath, r, utf-8)
        content = f.read().strip()
        f.close()
        tags = jieba.analyse.extract_tags(content, topK=5)
        filePaths.append(filePath)
        contents.append(content)
        tag1s.append(tags[0])
        tag2s.append(tags[1])
        tag3s.append(tags[2])
        tag4s.append(tags[3])
        tag5s.append(tags[4])

tagDF = pandas.DataFrame({
    filePath: filePaths, 
    content: contents, 
    tag1: tag1s, 
    tag2: tag2s, 
    tag3: tag3s, 
    tag4: tag4s, 
    tag5: tag5s
})

 





以上是关于Python数据挖掘-关键字提取的主要内容,如果未能解决你的问题,请参考以下文章

比较有用的php代码片段

从单个按钮从多个片段中提取数据

当我使用python从CSV文件中提取特定关键字的数据时,为什么会出现KeyError?

Python数据挖掘-关键字提取

python实现关键词提取

Android课程---Android Studio使用小技巧:提取方法代码片段