如何处理以下文本文件进行文本分类?我希望每个段落都作为 pandas 数据框中的一行,但我无法做到 [关闭]
Posted
技术标签:
【中文标题】如何处理以下文本文件进行文本分类?我希望每个段落都作为 pandas 数据框中的一行,但我无法做到 [关闭]【英文标题】:How can I procees the below text file for text classification? I would like each paragraph as a row in a pandas dataframe, I am unable to do that [closed] 【发布时间】:2019-06-19 21:05:31 【问题描述】:(https://i.stack.imgur.com/AbOLA.jpg)
1
Loren ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem iplorem ipsum lorem ipsum lorem ip ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum lorem ipsum
有 154 个这样的段落,我想在 python 中将每个段落读取为一行。请看图片以获得清晰的示例
【问题讨论】:
【参考方案1】:f = open('sample_text.txt', 'r')
data = f.read()
paragraphs = data.split("\n\n")
paragraphs[:] = (value for value in paragraphs if value != '\t')
【讨论】:
提供一些解释将有助于以后的读者理解你的答案。 @BrunoCaceiro 审稿时请注意。此答案中没有链接可见,因此您选择的审核选项不合适。以上是关于如何处理以下文本文件进行文本分类?我希望每个段落都作为 pandas 数据框中的一行,但我无法做到 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章
我如何处理这个机器学习/NLP 上下文感知文本分类项目?请参阅下面的说明
Keras 1d 卷积层如何处理词嵌入 - 文本分类问题? (过滤器、内核大小和所有超参数)