Python基础入门自学——18--操作Excel-工作实践需求

Posted kaoa000

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python基础入门自学——18--操作Excel-工作实践需求相关的知识,希望对你有一定的参考价值。

工作中突然要操作一堆Excel表格,就想着能否用Python来处理,这一篇就学习一下Python操作Excel表。

我需要在一个内网环境安装python开发环境,在网上下载了pycharm2018,好像再新的版本没有windows 32位的版本了。

安装:

安装步骤:先下载安装python3.8,然后安装第三方库openpyxl,openpyxl需要下载openpyxl-3.0.7-py2.py3-none-any.whl,安装还需要其jdcal和et_xmlfile库的支持,下载jdcal-1.4.1-py2.py3-none-any.whl,et_xmlfile-1.1.0-py3-none-any.whl。

将这三个文件放在一个文件夹中,命令窗口切换至这个文件夹,执行pip命令进行安装,前提是在环境变量path中增加了python的路径,能够找到pip命令,pip命令在python目录下的scripts子目录下。

pip install jdcal-1.4.1-py2.py3-none-any.whl

pip install et_xmlfile-1.1.0-py3-none-any.whl

pip install openpyxl-3.0.7-py2.py3-none-any.whl

然后安装pycharm,安装成功后,有一个问题,虽然前面安装openpyxl成功了,但是在pycharm中还是没有,需要在pycharm的python console中重新执行一遍前面的三条pip命令。

使用:

首先要有一个概念的体系结构,对excel的操作,最大的对象就是工作簿,即Workbook,然后是工作表,即Sheet,最后是单元格,即Cell。

创建一个新的工作簿:使用openpyxl.Workbook,这相当于调用openpyxl.workbook.Workbook

 

这就生成了一个工作簿对象,这个工作簿里面还没有工作表,这跟我们操作excel是打开excel自动会创建3个默认工作表不一样,需要手工创建工作表:

 然后是单元格:

 生成了一个单元格对象。操作单元格

 

 保存工作簿,就是在磁盘中生成保存excel文件。最后关闭工作簿

打开新生成的文件:

 可以看到在创建的工作表之外,还有一个默认创建的Sheet表。

操作已有表:就使用已创建的test1111.xlsx,修改一下:

打开已有excel文件,使用:

 load_workbook()第一个参数是打开的工作簿的文件名称,后面的参数主要注意data_only选项,这个选项控制读取的单元格内容,如果单元格里是一个公式,那么使用这个选项,读取出来的就是公式计算后的值,否则,读取的是公式本身。

 获取工作表:

可以看到,get_sheet_by_name方法也不被建议使用,直接使用工作簿加工作表的索引来引用相应的工作表:

 读取单元格:

 跟获得工作表类似,使用索引的方法,中括号中是要读取单元格的地址,但是获得的是单元格对象,要获取其值,需要使用value属性:

 pycharm没有提示出来:

读取C2单元格试一下:

读取的是公式本身

修改一下:

 此时读取的是公式计算后的值。

做一个测试:wb对象能够弹出data_only属性,

 打开工作簿后,不能再次设置data_only。 

 对于取一个区域的单元格,其返回的是一个嵌套的元组,里面的元组是以同一行的多列单元格为元素。

具体项目1:有多个考核明细表,编程实现将多个明细表的数据汇总到一个表中。

明细表、汇总表的结构:

 

程序:

#!/usr/bin/env python3
# -*- coding:utf-8 -*-
import openpyxl
import os

mxfiles = os.listdir('excelmx')  # 获取全部明细考核表文件
hzfile = '考核汇总表.xlsx'   # 汇总表文件

wbhz = openpyxl.load_workbook(hzfile)  #打开汇总表工作簿
wshz = wbhz['Sheet1']   # 获得汇总的工作表
hzrowstart = 4   # 汇总表的开始行号
# 下面的while语句判断汇总表开始写入数据的行号,汇总表中可能有前期的数据了
# 判断的依据就是B列从第4行开始往下的第一个空单元格开始插入数据
while True:
    celltemp = 'B' + str(hzrowstart)
    if wshz[celltemp].value == None:
        break
    hzrowstart += 1

# 下面的for循环遍历每个明细表,将数据一条一条插入汇总表
for mxfile in mxfiles:
    mxfile_t = 'excelmx\\\\' + mxfile    # mxfile需要加上子目录,形成excelmx\\xxxx.xlsx形式完整名
    n = 1
    wbmx = openpyxl.load_workbook(mxfile_t)
    wsmx = wbmx['Sheet1']    # 明细表固定在Sheet1工作表上
    while True:
        # 组合明细表和汇总表对应拷贝的单元格,明细表中的B4拷贝到汇总表中的B4,C4到C4。。。
        hzcellb = 'B' + str(hzrowstart)
        mxcellb = 'B' + str(n+3)
        hzcellc = 'C' + str(hzrowstart)
        mxcellc = 'C' + str(n + 3)
        hzcelld = 'D' + str(hzrowstart)
        mxcelld = 'D' + str(n + 3)
        hzcelle = 'E' + str(hzrowstart)
        mxcelle = 'E' + str(n + 3)
        hzcellf = 'F' + str(hzrowstart)
        mxcellf = 'F' + str(n + 3)
        hzcellg = 'G' + str(hzrowstart)
        mxcellg = 'G' + str(n + 3)
        hzcellh = 'H' + str(hzrowstart)
        mxcellh = 'H' + str(n + 3)
        hzcelli = 'I' + str(hzrowstart)
        mxcelli = 'I' + str(n + 3)
        if wsmx[mxcellb].value == None:    # 判断如果明细表数据为空了,就结束
            wbmx.close()
            break
        wshz[hzcellb] = wsmx[mxcellb].value
        wshz[hzcellc] = wsmx[mxcellc].value
        wshz[hzcelld] = wsmx[mxcelld].value
        wshz[hzcelle] = wsmx[mxcelle].value
        wshz[hzcellf] = wsmx[mxcellf].value
        wshz[hzcellg] = wsmx[mxcellg].value
        wshz[hzcellh] = wsmx[mxcellh].value
        wshz[hzcelli] = wsmx[mxcelli].value
        hzrowstart += 1
        n += 1
wbhz.save(hzfile)
wbhz.close()

 具体项目2:上面的汇总明细表,以前四项为唯一值,即作为一个考核汇总项,形成一个新的考核表,将汇总明细表中不同的考核人+考核说明填到这个考核表的考核说明中,如单位名称1+1月+ 基础工作+小项1共有2个人考核,有两个说明,要把这个两个人的说明合并填写到这个表的一个单元格中。实际工作中有二十多个考核人,并且每个考核人考核的项也不相同,每个人按照不同的分工对自己负责的一部分进行考核打分,用excel本身实现合并很麻烦。编程实现。

 

解决思路:

 

#!/usr/bin/env python3
# -*- coding:utf-8 -*-
import openpyxl

destfile = '考核汇总表.xlsx'

wb = openpyxl.load_workbook(destfile)

wshz = wb['Sheet1']     #汇总工作表对象
wskh = wb['Sheet2']     #考核工作表对象

khrow = 4               #考核表数据开始行号
while True:
    cell_tmp = 'B' + str(khrow)
    if wskh[cell_tmp].value == None:
        break
    khrow += 1           #while语句判断考核表数据的行数,最后一行数据的行号为khrow-1

hzrow = 4     #汇总表数据也从第4行开始
while True:
    cellhz_temp = 'B' + str(hzrow)
    if wshz[cellhz_temp].value == None:
        break
    hzrow += 1
    #计算汇总表数据范围

cellrange = 'B4:E' + str(hzrow-1)   #选择汇总表的前前四列数据
wshz_tmp = wshz[cellrange]
wshz_list = []
for temp in wshz_tmp:
    s = ''
    for temp1 in temp:
        s = s + temp1.value
    wshz_list.append(s)
    # for语句将汇总表的前四列合并然后添加到wskh_list,形成一个列表

for k in range(4,khrow):
    s1 = ''
    match_temp = ''
    khcellb,khcellc,khcelld,khcelle = 'B' + str(k),'C' + str(k),'D' + str(k),'E' + str(k)
    s1 = s1 + wskh[khcellb].value + wskh[khcellc].value + wskh[khcelld].value + wskh[khcelle].value
    i = 0
    while i < len(wshz_list):
        if s1 == wshz_list[i]:
            cell_h = 'H' + str(i + 4)
            cell_i = 'I' + str(i + 4)
            match_temp = match_temp + wshz[cell_h].value + ':' + wshz[cell_i].value + '|'
        i += 1
    wskh['H'+str(k)] = match_temp

wb.save(destfile)
wb.close()

以上是最简单的excel使用,只是从功能上实现了工作中需求,性能上因为个人刚学习,水平所限,无法判断好坏,如有高手希望指点一二,谢谢。

以上是关于Python基础入门自学——18--操作Excel-工作实践需求的主要内容,如果未能解决你的问题,请参考以下文章

Containerd 入门基础操作

Python基础入门自学——19--访问数据库

Python基础入门自学——22--异步IO

Python自学入门基础教程-数据类型

Python基础入门自学——14--进程和线程

Python基础入门自学——16--常用内建模块2