python 大数据处理小结

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 大数据处理小结相关的知识,希望对你有一定的参考价值。

1.shop_min=shop.drop([‘category_id‘,‘longitude‘,‘latitude‘,‘price‘],axis=1)
pandas中删除多个列

2.mall=shop_min.drop_duplicates(subset=‘mall_id‘)
pandas中将某一列去重

3.python写文件有空行
# Python 2
with open(‘/pythonwork/thefile_subset11.csv‘, ‘wb‘) as outfile:
writer = csv.writer(outfile)

# Python 3
with open(‘/pythonwork/thefile_subset11.csv‘, ‘w‘, newline=‘‘) as outfile:
writer = csv.writer(outfile)

4.python file 打开文件方式
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。




















以上是关于python 大数据处理小结的主要内容,如果未能解决你的问题,请参考以下文章

18大经典数据挖掘算法小结

大数据知识小结

大数据相关资料论文小结

数据安全小结

大数据(4h)Kafka经验小结(不定更)

新手数据比赛中数据处理方法小结(python)