取出csv文件中的中文评论数据
Posted zhzhang
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了取出csv文件中的中文评论数据相关的知识,希望对你有一定的参考价值。
# -*- coding: utf-8 -*- import csv import re csvfile = \'weibo.csv\' def columns_data(path, column): columns_data = \'\' csvfile = open(path, \'r\', encoding=\'utf-8\') DicReader = csv.DictReader(csvfile) for row in DicReader: columns_data = columns_data+row.get(column) return columns_data comments = columns_data(csvfile, \'comment\') print(comments) pattern = re.compile(r\'[\\u4e00-\\u9fa5]+\') filterdata = re.findall(pattern, comments) print(filterdata) cleaned_comments = \'\'.join(filterdata) print(cleaned_comments)
数据来源:Python爬取新浪微博评论数据,写入csv文件中
本文等同:筛选出一段文字中的中文
以上是关于取出csv文件中的中文评论数据的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 Python 获取 PickleType 数据并转换为文件夹中的 csv 文件