处理Excel电子表格
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了处理Excel电子表格相关的知识,希望对你有一定的参考价值。
一个Excel电子表格文档称为一个工作薄。
每个工作薄可以包含多个工作表。
用户当前查看的表,称为活动表。
python没有自带openpyxl,所以必须安装。
c:\python\Scripts>pip3.6 install openpyxl Collecting openpyxl Downloading openpyxl-2.4.9.tar.gz (157kB) 100% |████████████████████████████████| 163kB 183kB/s Collecting jdcal (from openpyxl) Downloading jdcal-1.3.tar.gz Collecting et_xmlfile (from openpyxl) Downloading et_xmlfile-1.0.1.tar.gz Installing collected packages: jdcal, et-xmlfile, openpyxl Running setup.py install for jdcal ... done Running setup.py install for et-xmlfile ... done Running setup.py install for openpyxl ... done Successfully installed et-xmlfile-1.0.1 jdcal-1.3 openpyxl-2.4.9 c:\python>python.exe Python 3.6.1 (v3.6.1:69c0db5, Mar 21 2017, 18:41:36) [MSC v.1900 64 bit (AMD64)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> import openpyxl >>>
用openpyxl模块打开Excel文档
>>> import openpyxl >>> wb=openpyxl.load_workbook('example.xlsx') >>> type(wb) <class 'openpyxl.workbook.workbook.Workbook'>
openpyxl.load_workbook()函数接受文件名,返回一个workbook数据类型的值。这个workbook对象代表这个Excel文件。
example.xlsx需要在当前工作目录,才能处理它。可以导入os,使用函数os.getcwd()确定当前工作目录,并用os.chdir()改变当前工作目录。
从工作薄中取得工作表
调用get_sheet_names()方法可以取得工作薄中所有表名的列表。
>>> import openpyxl >>> wb=openpyxl.load_workbook('example.xlsx') >>> wb.get_sheet_names() ['Sheet1', 'Sheet2', 'Sheet3'] >>> sheet=wb.get_sheet_by_name('Sheet3') >>> sheet <Worksheet "Sheet3"> >>> type(sheet) <class 'openpyxl.worksheet.worksheet.Worksheet'> >>> sheet.title 'Sheet3' >>> anotherSheet=wb.get_active_sheet() >>> anotherSheet <Worksheet "Sheet3">
每个表由一个Worksheet对象表示,可以通过向工作薄方法get_sheet_by_name()传递表名字符串获得。
调用Workbook对象的get_active_sheet()方法,取得工作薄的活动表。
从表中取得单元格
>>> import openpyxl >>> wb=openpyxl.load_workbook('example.xlsx') >>> sheet=wb.get_sheet_by_name('Sheet1') >>> sheet['A1'] <Cell 'Sheet1'.A1> >>> sheet['A1'].value='apple' >>> sheet['A1'].value 'apple' >>> c=sheet['B1'] >>> c.value='juice' >>> str(c.row) '1' >>> c.row 1 >>> c.column 'B' >>> c.coordinate 'B1'
Cell对象的value属性,包含这个单元格中保存的值。
Cell对象也有row、column和coordinate属性,提供该单元格的位置信息。
第一行或第一列的整数是1,不是0。
>>> sheet.cell(row=1,column=2) <Cell 'Sheet1'.B1> >>> sheet.cell(row=1,column=2).value 'juice' >>> for i in range(1,8,2): ... print(i,sheet.cell(row=i,column=2).value) ... 1 juice 3 None 5 None 7 None
可以通过Worksheet对象的get_highest_row()和get_highest_column()方法,确定表的大小。
get_highest_column()方法返回一个整数,而不是Excel中出现的字母。
列字母和数字之间的转换
要从字母转换到数字,就调用openpyxl.cell.column_index_from_string()函数。
要从数字转换到字母,就调用openpyxl.cell.get_column_letter()函数。
从表中取得行和列
>>> import openpyxl >>> wb=openpyxl.load_workbook('example.xlsx') >>> sheet=wb.get_sheet_by_name('Sheet1') >>> tuple(sheet['A1':'C3']) ((<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.B1>, <Cell 'Sheet1'.C1>), (<Cell 'Sheet1'.A2>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.C2>), (<Cell 'Sheet1'.A3>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.C3>)) >>> for i in sheet['A1':'C3']: ... for j in i: ... print(j.coordinate,j.value) ... print('--- END OF ROW ---') ... A1 apple B1 juice C1 cake --- END OF ROW --- A2 None B2 nurse C2 None --- END OF ROW --- A3 None B3 None C3 None --- END OF ROW ---
总结:
1、导入openpyxl模块
2、调用openpyxl.load_workbook()函数
3、取得Workbook对象
4、调用get_active_sheet()或get_sheet_by_name()工作薄方法
5、取得Worksheet对象
6、使用索引或工作表的cell()方法,带上row和column关键字参数
7、取得Cell对象
8、读取Cell对象的value属性
【扩展】
1、Font对象
Font对象的style属性影响文本在单元格中的显示方式。
要设置字体风格属性,就向Font()函数传入关键字参数。
2、公式
>>> sheet['B10']='=sum(B1:B9)' >>> wb.save('example.xlsx') ##保存
3、调整行和列
Worksheet对象由row_dimensions和column_dimensions属性,控制行高和列宽。
>>> sheet.row_dimensions[1].height=70 >>> sheet.column_dimensions['B'].width=40 >>> wb.save('example.xlsx')
利用merge_cells()工作表方法,可以将一个矩形区域中的单元格合并为一个单元格。
要拆分单元格,就调用unmerge_cells()工作表方法。
>>> sheet.merge_cells('A1:D3') >>> wb.save('example.xlsx')
在OpenPyXL中,每个Worksheet对象都有一个freeze_panes属性,可以设置为一个Cell对象或一个单元格坐标的字符串。
单元格上边的所有行和左边的所有列都会冻结,但单元格所在的行和列不会冻结。
要解冻所有的单元格,就将freeze_panes设置为None或‘A1’。
>>> sheet.freeze_panes='A2' ##行1将永远可见 >>> wb.save('example.xlsx')
如果需要创建图标,需要做下列事情:
1、从一个矩形区域选择的单元格,创建一个Reference对象
2、通过传入Reference对象,创建一个Series对象
3、创建一个Chart对象
4、将Series对象添加到Chart对象
5、可选地设置Chart对象的drawing.top、drawing.left、drawing.width和drawing.height变量
6、将Chart对象添加到Worksheet对象
如果加载一个Workbook对象,然后马上保存到同样的.xlsx文件名中,实际上会删除其中的图表。
以上是关于处理Excel电子表格的主要内容,如果未能解决你的问题,请参考以下文章
雷林鹏分享:Apache POI电子表格/Spreadsheet