【转】http://wenqiang-china.github.io/2016/05/13/python-opetating-excel/
python 读写excel
Posted 菩提本无树007
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 读写excel相关的知识,希望对你有一定的参考价值。
今天我来给大家介绍一下如何用 Python来读写 excel表格,其实 Excel表格是最常用的数据分析工具,今天我们就来用 Python来读写 Excel表格,从而获得有用的数据。 1、首先我们先打开一个 Excel工作表。 2、然后我们需要进行数据预处理,即数据筛选和数据去重。首先我们要进行一个数据筛选,这里我用的是 numpy模块。 3、然后我们就要进行一个去重,使用 summary函数将多列的数据进行去重处理,得到一个新的数据。 4、接着我们就可以用 pandas模块对新得到的数据进行分析了,在 pandas模块中,有两个函数,分别是 filter ()和 document ()。 5、然后就可以使用 document ()函数来提取新得到的数据了。 6、最后我们就可以将提取出来的新的数据导出到 Excel表格中了。
-
一、数据预处理
1、打开 excel文件,我们需要先对数据进行一个筛选,这个就是我们要进行的数据筛选,它的代码如下: 2、在 numpy模块中,我们可以对筛选出来的数据进行一个去重处理,它的代码如下: 4、接下来我们就可以对新得到的数据进行分析了,我们可以使用 pandas模块来对新得到的数据进行一个分析。 5、 pandas模块中有两个函数分别是 filter ()和 document (), filter ()用于将多列的数据转换为一个新的列名; document ()用于从新生成的 Excel表格中提取新的数据。
-
二、数据筛选
在对数据进行筛选之前,我们首先要进行一个数据预处理,也就是数据筛选,在 numpy模块中有一个很常用的函数叫做 search (),它的作用是找出一条记录中所有符合条件的记录。 2、接下来我们要用 numpy模块来进行数据筛选,在 numpy模块中有一个很重要的函数就是 record (),这个函数主要是用于进行多列筛选。 3、下面我们就来使用一下这个 record ()函数,我们可以先把多列数据复制出来,然后再用 numpy模块进行筛选。 4、如果我们想要对数据进行排序,那么我们就可以使用 numpy模块的 mask ()函数来对数据进行排序。 5、最后我们就可以得到一个结果了,这个结果就是按照数据排序后的结果。 6、我们还可以通过 numpy模块对结果进行计算。
-
三、去重
去重的功能也比较简单,它只需要对一个表格中的数据进行去重。下面我给大家演示一下,用 Python来对 excel进行去重。 首先,我们在 excel文件中输入一个公式:= summary (table_size),这个公式可以进行数据筛选,也可以用于计算表格中每个列的数据个数。 然后,我们在 excel文件中输入一个 summary函数,这个函数的功能就是将多列的数据进行去重。 由于 excel表格比较大,我们使用 summary函数处理一下。然后我们再使用 filter ()函数进行一个数据筛选。
-
四、 pandas模块分析
首先我们需要使用 filter函数,来对多列数据进行去重处理,并对数据进行一个初步分析。 接下来我们需要使用 document函数来提取新的数据,并且将新得到的数据导出到 Excel表格中。 那么我们应该如何使用 pandas模块呢?首先我们先来看看 pandas模块的相关说明: 可以看出, pandas模块包含了两个函数: 它可以对多列数据进行一个初步分析。 所以我们可以看到,这两个函数的功能非常相似,都可以从多列数据中提取出新的数据。但是 filter ()函数在提取新的数据时,使用的是布尔值,而 document ()函数使用的是布尔值。
-
五、 document ()函数提取
首先我们来看一下 document ()函数,在 pandas模块中, document ()函数是用来从表格中提取数据的,这个函数和 filter ()函数是一样的,也是对 Excel表格中的数据进行处理,得到我们需要的数据。下面我们来看一下 document ()函数的使用: 我们在使用 document ()函数提取数据时,可以使用不同的方法来提取不同的数据,例如使用 filter ()函数提取数据时,可以使用多个方法。
-
六、 pandas的数据可视化
1、接下来我们就可以进行数据可视化处理了。 2、首先我们需要在 Excel中输入一列数据,然后在 pandas中输入: 3、接着我们可以使用 pandas的 shell命令来对数据进行可视化处理了,如图所示: 4、首先我们使用 pandas的 data模块,对数据进行一个分析,如图所示:
-
七、总结
1、在用 pandas读写 excel表格时,如果需要处理多个数据集,可以使用 summary函数,也可以使用 pandas模块中的多个函数。 2、在数据预处理时,我们可以先使用 numpy模块中的 summary函数将多列的数据进行过滤,然后再使用 pandas模块中的 filter ()和 document ()函数来对过滤后的数据进行分析。 filter ()可以用来处理多列数据; document ()可以用来提取数据。在 Python中, filter ()和 document ()函数是使用比较多的两个函数。 5、在 pandas模块中还有一些其他比较常用的函数,如果大家有兴趣了解,可以看一下 Python相关教程。
-
常用的python读写excel代码有需要 的收藏:
-
1. 读取Excel文件
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel('file.xlsx', sheet_name='Sheet1')
# 打印数据
print(df.head())
```
2. 写入Excel文件
```python
import pandas as pd
# 创建数据
data = 'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [25, 30, 35, 40],
'Salary': [50000, 60000, 70000, 80000]
# 创建DataFrame
df = pd.DataFrame(data)
# 写入Excel文件
df.to_excel('file.xlsx', sheet_name='Sheet1', index=False)
# 打印成功信息
print('Excel文件写入成功!')
```
3. 更新Excel文件
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel('file.xlsx', sheet_name='Sheet1')
# 更新数据
df.loc[df['Name'] == 'Bob', 'Salary'] = 65000
# 写入Excel文件
df.to_excel('file.xlsx', sheet_name='Sheet1', index=False)
# 打印成功信息
print('Excel文件更新成功!')
```
python 操作excel读写
以上是关于python 读写excel的主要内容,如果未能解决你的问题,请参考以下文章
别用ExcelPython了,我找到了实现报表自动化最快的方法
ExcelPython靠边站,这才是实现报表自动化最快的方法
windows下python3.5安装setuptools以及百度坐标系(bd-09)火星坐标系(国测局坐标系gcj02)WGS84坐标系之间的坐标互转python实现以及python中exce