取出csv文件中的中文评论数据

Posted zhzhang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了取出csv文件中的中文评论数据相关的知识,希望对你有一定的参考价值。

# -*- coding: utf-8 -*-

import csv
import re

csvfile = \'weibo.csv\'

def columns_data(path, column):
    columns_data = \'\'
    csvfile = open(path, \'r\', encoding=\'utf-8\')
    DicReader = csv.DictReader(csvfile)
    for row in DicReader:
        columns_data = columns_data+row.get(column)
    return columns_data

comments = columns_data(csvfile, \'comment\')
print(comments)

pattern = re.compile(r\'[\\u4e00-\\u9fa5]+\')
filterdata = re.findall(pattern, comments)
print(filterdata)

cleaned_comments = \'\'.join(filterdata)
print(cleaned_comments)

 

数据来源:Python爬取新浪微博评论数据,写入csv文件中

本文等同:筛选出一段文字中的中文

 

以上是关于取出csv文件中的中文评论数据的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 Python 获取 PickleType 数据并转换为文件夹中的 csv 文件

将海量 CSV 文件读入 Oracle 表

Python爬取新浪微博评论数据,写入csv文件中

python 读取多个csv文件中某一列,并生成一个新csv文件

去年的京东评论项目

nzSQLException 读取超时错误