2019-12-13 (一)使用Xlwings从Excel,取数至Pandas的DataFrame和Series

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2019-12-13 (一)使用Xlwings从Excel,取数至Pandas的DataFrame和Series相关的知识,希望对你有一定的参考价值。

参考技术A """

Createdon Mon Jul  8 22:05:32 2019

@author:

same3

"""

我们通过Xlwings 调用 Excel特定区域的数据集,将用来测试Panda对于None值/NaN/null/空值(以下统称空值)的处理,本次我们将会学到:

对含有空值的DataFrame进行各种选择操作,以及对空值数据的填充fillna()、删除dropna(),我们将在后面陆续介绍。

笔者是技术进步的拥趸,Python 的IDE:Spyder,从刚开始是Python(x,y)的作者为Python开发的一个简单的集成开发环境,发展到现在V4.0白、富、美的开发环境,着实令人惊艳!感谢这个世界上众多无私付出、默默耕耘的人们,有了你们,世界越来越好!

和其他的Python开发环境相比,Spyder最大的优点就是模仿MATLAB的“工作空间”的功能,可以很方便地观察和修改对象的值。

学习使用spyder(python IDE) 参考资料:https://blog.csdn.net/u010547283/article/details/76860428

'''

##引入三个Python 包

##Pandas:数据分析包

import pandas as pd 

#"as"顾名思义,即以后可以在程序中以缩写pd 代表 pandas

#numpy:科学计算包

import numpy  as np

##xlwings:python操作Excel的模块,最好的Excel操作包之一,有取代VBA的趋势

## xlwings中文入门学习资料之一:https://www.cnblogs.com/catgatp/p/7875683.html

## xlwings英文官方学习网站https://docs.xlwings.org/en/stable/

import xlwings as xw

##声明Excel应用程序,及workboos文件路径

file= r'D:\VBA\LEARNING_ERP.xlsm' 

#字符串前面加r,是表示其后的字符串不转义,使用真实字符

wb=xw.Book(file)

wb.app.display_alerts=False

#禁止Excel弹出提示的对话框

#“view”作为存放结果数据集的sheet表

sht_view=wb.sheets['view']

##“基础表”作为存放原始数据集的sheet表

sht_base=wb.sheets['基础表']

##让我们看一下Excel中的原始数据吧:

'''选中存放原始数据集所在的区域,将数据导入Series

第25行第9列,可以使用sheet.range(row,column)的方法,也可以使用sheet[row-1,

column-1]的方法,第一种方法是标准的VB-Excel风格,下标从1开始,使用小括号();第二种方法遵循的是Python风格,下标从0开始,使用中括号[]。'''

s_choose=sht_base.range(25,9).options(pd.Series,expand='table').value

## expand='table',指示将从单元格沿right、down扩展取数,详见Xlwings文档。

'''按F5运行程序,然后在IDE右下方的即时窗口In[ ]:后面输入print(s_choose),按回车,显示如下:'''

##上面是VB-Excel风格,试一下第二种方法,遵循的是Python风格

s_choose=sht_base[24,8].options(pd.Series,expand='table').value

##可见两种方法,结果是一样的

##选中employee 所在的区域,第25行第1列

range_employee=sht_base[25,1].api.currentregion

##命名区域

range_employee.name='range_employee'

##导入Dataframe

df_employee=sht_base['range_employee'].options(pd.DataFrame,header=1,index=True).value

'''index=True,指示使用原始数据集中的索引默认第一列,而不是使用自动索引,自动索引从0开始

header=1,指示使用原始数据集中的第一行作为列名,而不是使用自动列名,更多使用方法,将在后面陆续介绍。'''

#按F5运行程序,然后在IDE右下方的即时窗口In:后面输入print(df_employee),按回车,显示如下:

##计算机显示的时候,对齐有跑题的嫌疑(对不上标题),不过,习惯了就好!

以上是关于2019-12-13 (一)使用Xlwings从Excel,取数至Pandas的DataFrame和Series的主要内容,如果未能解决你的问题,请参考以下文章

模块“xlwings”没有属性“书”

从 xlwings 调用 Pycharm 中的断点

xlwings module.py 从 excel 调用 python

使用 Python 3 的 xlwings 问题

插上翅膀,让Excel飞起来——xlwings

xlwings 激活变量工作表名称