Pandas-文本分析

Posted

技术标签:

【中文标题】Pandas-文本分析【英文标题】:Pandas-Profiling in text 【发布时间】:2021-07-12 18:16:44 【问题描述】:

我想在文本中应用分析,但在我必须清理和识别最常用的单词之前。但是当我应用 nltk 时,它会返回一个列表,我无法创建分析。有没有办法做到这一点?

corpus = []
for i in range(17000):
  review = re.sub('[^a-zA-Z]', ' ', dataset['Descrição Reparo'][i])
  review = review.lower().split()
  review = [word for word in review if not word in set(stopwords.words('portuguese'))]
  review = ' '.join(review)
  corpus.append(review)

cv = CountVectorizer()
X = cv.fit_transform(corpus).toarray()

【问题讨论】:

【参考方案1】:

希望它会起作用

feature=cv.get_feature_names()

现在您可以使用 pandas 分析

【讨论】:

以上是关于Pandas-文本分析的主要内容,如果未能解决你的问题,请参考以下文章

Pandas数据分析:处理文本数据(str/object)各类操作+代码一文详解

100天精通Python(数据分析篇)——第73天:Pandas文本数据处理方法之查找替换拼接正则虚拟变量

100天精通Python(数据分析篇)——第73天:Pandas文本数据处理方法之查找替换拼接正则虚拟变量

100天精通Python(数据分析篇)——第71天:Pandas文本数据处理方法之str/object类型转换大小写转换文本对齐获取长度出现次数编码

100天精通Python(数据分析篇)——第71天:Pandas文本数据处理方法之str/object类型转换大小写转换文本对齐获取长度出现次数编码

文本情感分析-机器学习实验三