Python基础入门自学——18--操作Excel-工作实践需求
Posted kaoa000
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python基础入门自学——18--操作Excel-工作实践需求相关的知识,希望对你有一定的参考价值。
工作中突然要操作一堆Excel表格,就想着能否用Python来处理,这一篇就学习一下Python操作Excel表。
我需要在一个内网环境安装python开发环境,在网上下载了pycharm2018,好像再新的版本没有windows 32位的版本了。
安装:
安装步骤:先下载安装python3.8,然后安装第三方库openpyxl,openpyxl需要下载openpyxl-3.0.7-py2.py3-none-any.whl,安装还需要其jdcal和et_xmlfile库的支持,下载jdcal-1.4.1-py2.py3-none-any.whl,et_xmlfile-1.1.0-py3-none-any.whl。
将这三个文件放在一个文件夹中,命令窗口切换至这个文件夹,执行pip命令进行安装,前提是在环境变量path中增加了python的路径,能够找到pip命令,pip命令在python目录下的scripts子目录下。
pip install jdcal-1.4.1-py2.py3-none-any.whl
pip install et_xmlfile-1.1.0-py3-none-any.whl
pip install openpyxl-3.0.7-py2.py3-none-any.whl
然后安装pycharm,安装成功后,有一个问题,虽然前面安装openpyxl成功了,但是在pycharm中还是没有,需要在pycharm的python console中重新执行一遍前面的三条pip命令。
使用:
首先要有一个概念的体系结构,对excel的操作,最大的对象就是工作簿,即Workbook,然后是工作表,即Sheet,最后是单元格,即Cell。
创建一个新的工作簿:使用openpyxl.Workbook,这相当于调用openpyxl.workbook.Workbook
这就生成了一个工作簿对象,这个工作簿里面还没有工作表,这跟我们操作excel是打开excel自动会创建3个默认工作表不一样,需要手工创建工作表:
然后是单元格:
生成了一个单元格对象。操作单元格
保存工作簿,就是在磁盘中生成保存excel文件。最后关闭工作簿
打开新生成的文件:
可以看到在创建的工作表之外,还有一个默认创建的Sheet表。
操作已有表:就使用已创建的test1111.xlsx,修改一下:
打开已有excel文件,使用:
load_workbook()第一个参数是打开的工作簿的文件名称,后面的参数主要注意data_only选项,这个选项控制读取的单元格内容,如果单元格里是一个公式,那么使用这个选项,读取出来的就是公式计算后的值,否则,读取的是公式本身。
获取工作表:
可以看到,get_sheet_by_name方法也不被建议使用,直接使用工作簿加工作表的索引来引用相应的工作表:
读取单元格:
跟获得工作表类似,使用索引的方法,中括号中是要读取单元格的地址,但是获得的是单元格对象,要获取其值,需要使用value属性:
pycharm没有提示出来:
读取C2单元格试一下:
读取的是公式本身
修改一下:
此时读取的是公式计算后的值。
做一个测试:wb对象能够弹出data_only属性,
打开工作簿后,不能再次设置data_only。
对于取一个区域的单元格,其返回的是一个嵌套的元组,里面的元组是以同一行的多列单元格为元素。
具体项目1:有多个考核明细表,编程实现将多个明细表的数据汇总到一个表中。
明细表、汇总表的结构:
程序:
#!/usr/bin/env python3
# -*- coding:utf-8 -*-
import openpyxl
import os
mxfiles = os.listdir('excelmx') # 获取全部明细考核表文件
hzfile = '考核汇总表.xlsx' # 汇总表文件
wbhz = openpyxl.load_workbook(hzfile) #打开汇总表工作簿
wshz = wbhz['Sheet1'] # 获得汇总的工作表
hzrowstart = 4 # 汇总表的开始行号
# 下面的while语句判断汇总表开始写入数据的行号,汇总表中可能有前期的数据了
# 判断的依据就是B列从第4行开始往下的第一个空单元格开始插入数据
while True:
celltemp = 'B' + str(hzrowstart)
if wshz[celltemp].value == None:
break
hzrowstart += 1
# 下面的for循环遍历每个明细表,将数据一条一条插入汇总表
for mxfile in mxfiles:
mxfile_t = 'excelmx\\\\' + mxfile # mxfile需要加上子目录,形成excelmx\\xxxx.xlsx形式完整名
n = 1
wbmx = openpyxl.load_workbook(mxfile_t)
wsmx = wbmx['Sheet1'] # 明细表固定在Sheet1工作表上
while True:
# 组合明细表和汇总表对应拷贝的单元格,明细表中的B4拷贝到汇总表中的B4,C4到C4。。。
hzcellb = 'B' + str(hzrowstart)
mxcellb = 'B' + str(n+3)
hzcellc = 'C' + str(hzrowstart)
mxcellc = 'C' + str(n + 3)
hzcelld = 'D' + str(hzrowstart)
mxcelld = 'D' + str(n + 3)
hzcelle = 'E' + str(hzrowstart)
mxcelle = 'E' + str(n + 3)
hzcellf = 'F' + str(hzrowstart)
mxcellf = 'F' + str(n + 3)
hzcellg = 'G' + str(hzrowstart)
mxcellg = 'G' + str(n + 3)
hzcellh = 'H' + str(hzrowstart)
mxcellh = 'H' + str(n + 3)
hzcelli = 'I' + str(hzrowstart)
mxcelli = 'I' + str(n + 3)
if wsmx[mxcellb].value == None: # 判断如果明细表数据为空了,就结束
wbmx.close()
break
wshz[hzcellb] = wsmx[mxcellb].value
wshz[hzcellc] = wsmx[mxcellc].value
wshz[hzcelld] = wsmx[mxcelld].value
wshz[hzcelle] = wsmx[mxcelle].value
wshz[hzcellf] = wsmx[mxcellf].value
wshz[hzcellg] = wsmx[mxcellg].value
wshz[hzcellh] = wsmx[mxcellh].value
wshz[hzcelli] = wsmx[mxcelli].value
hzrowstart += 1
n += 1
wbhz.save(hzfile)
wbhz.close()
具体项目2:上面的汇总明细表,以前四项为唯一值,即作为一个考核汇总项,形成一个新的考核表,将汇总明细表中不同的考核人+考核说明填到这个考核表的考核说明中,如单位名称1+1月+ 基础工作+小项1共有2个人考核,有两个说明,要把这个两个人的说明合并填写到这个表的一个单元格中。实际工作中有二十多个考核人,并且每个考核人考核的项也不相同,每个人按照不同的分工对自己负责的一部分进行考核打分,用excel本身实现合并很麻烦。编程实现。
解决思路:
#!/usr/bin/env python3
# -*- coding:utf-8 -*-
import openpyxl
destfile = '考核汇总表.xlsx'
wb = openpyxl.load_workbook(destfile)
wshz = wb['Sheet1'] #汇总工作表对象
wskh = wb['Sheet2'] #考核工作表对象
khrow = 4 #考核表数据开始行号
while True:
cell_tmp = 'B' + str(khrow)
if wskh[cell_tmp].value == None:
break
khrow += 1 #while语句判断考核表数据的行数,最后一行数据的行号为khrow-1
hzrow = 4 #汇总表数据也从第4行开始
while True:
cellhz_temp = 'B' + str(hzrow)
if wshz[cellhz_temp].value == None:
break
hzrow += 1
#计算汇总表数据范围
cellrange = 'B4:E' + str(hzrow-1) #选择汇总表的前前四列数据
wshz_tmp = wshz[cellrange]
wshz_list = []
for temp in wshz_tmp:
s = ''
for temp1 in temp:
s = s + temp1.value
wshz_list.append(s)
# for语句将汇总表的前四列合并然后添加到wskh_list,形成一个列表
for k in range(4,khrow):
s1 = ''
match_temp = ''
khcellb,khcellc,khcelld,khcelle = 'B' + str(k),'C' + str(k),'D' + str(k),'E' + str(k)
s1 = s1 + wskh[khcellb].value + wskh[khcellc].value + wskh[khcelld].value + wskh[khcelle].value
i = 0
while i < len(wshz_list):
if s1 == wshz_list[i]:
cell_h = 'H' + str(i + 4)
cell_i = 'I' + str(i + 4)
match_temp = match_temp + wshz[cell_h].value + ':' + wshz[cell_i].value + '|'
i += 1
wskh['H'+str(k)] = match_temp
wb.save(destfile)
wb.close()
以上是最简单的excel使用,只是从功能上实现了工作中需求,性能上因为个人刚学习,水平所限,无法判断好坏,如有高手希望指点一二,谢谢。
以上是关于Python基础入门自学——18--操作Excel-工作实践需求的主要内容,如果未能解决你的问题,请参考以下文章