处理Excel电子表格

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了处理Excel电子表格相关的知识,希望对你有一定的参考价值。

一个Excel电子表格文档称为一个工作薄。

每个工作薄可以包含多个工作表。

用户当前查看的表,称为活动表。


python没有自带openpyxl,所以必须安装。

c:\python\Scripts>pip3.6 install openpyxl
Collecting openpyxl
  Downloading openpyxl-2.4.9.tar.gz (157kB)
    100% |████████████████████████████████| 163kB 183kB/s
Collecting jdcal (from openpyxl)
  Downloading jdcal-1.3.tar.gz
Collecting et_xmlfile (from openpyxl)
  Downloading et_xmlfile-1.0.1.tar.gz
Installing collected packages: jdcal, et-xmlfile, openpyxl
  Running setup.py install for jdcal ... done
  Running setup.py install for et-xmlfile ... done
  Running setup.py install for openpyxl ... done
Successfully installed et-xmlfile-1.0.1 jdcal-1.3 openpyxl-2.4.9
c:\python>python.exe
Python 3.6.1 (v3.6.1:69c0db5, Mar 21 2017, 18:41:36) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import openpyxl
>>>


技术分享图片


用openpyxl模块打开Excel文档

>>> import openpyxl
>>> wb=openpyxl.load_workbook('example.xlsx')
>>> type(wb)
<class 'openpyxl.workbook.workbook.Workbook'>

openpyxl.load_workbook()函数接受文件名,返回一个workbook数据类型的值。这个workbook对象代表这个Excel文件。

example.xlsx需要在当前工作目录,才能处理它。可以导入os,使用函数os.getcwd()确定当前工作目录,并用os.chdir()改变当前工作目录。


从工作薄中取得工作表

调用get_sheet_names()方法可以取得工作薄中所有表名的列表。

>>> import openpyxl
>>> wb=openpyxl.load_workbook('example.xlsx')
>>> wb.get_sheet_names()
['Sheet1', 'Sheet2', 'Sheet3']
>>> sheet=wb.get_sheet_by_name('Sheet3')
>>> sheet
<Worksheet "Sheet3">
>>> type(sheet)
<class 'openpyxl.worksheet.worksheet.Worksheet'>
>>> sheet.title
'Sheet3'
>>> anotherSheet=wb.get_active_sheet()
>>> anotherSheet
<Worksheet "Sheet3">

每个表由一个Worksheet对象表示,可以通过向工作薄方法get_sheet_by_name()传递表名字符串获得。

调用Workbook对象的get_active_sheet()方法,取得工作薄的活动表。


从表中取得单元格

>>> import openpyxl
>>> wb=openpyxl.load_workbook('example.xlsx')
>>> sheet=wb.get_sheet_by_name('Sheet1')
>>> sheet['A1']
<Cell 'Sheet1'.A1>
>>> sheet['A1'].value='apple'
>>> sheet['A1'].value
'apple'
>>> c=sheet['B1']
>>> c.value='juice'
>>> str(c.row)
'1'
>>> c.row
1
>>> c.column
'B'
>>> c.coordinate
'B1'

Cell对象的value属性,包含这个单元格中保存的值。

Cell对象也有row、column和coordinate属性,提供该单元格的位置信息。

第一行或第一列的整数是1,不是0。

>>> sheet.cell(row=1,column=2)
<Cell 'Sheet1'.B1>
>>> sheet.cell(row=1,column=2).value
'juice'
>>> for i in range(1,8,2):
...     print(i,sheet.cell(row=i,column=2).value)
...
1 juice
3 None
5 None
7 None

可以通过Worksheet对象的get_highest_row()和get_highest_column()方法,确定表的大小。

get_highest_column()方法返回一个整数,而不是Excel中出现的字母。


列字母和数字之间的转换

要从字母转换到数字,就调用openpyxl.cell.column_index_from_string()函数。

要从数字转换到字母,就调用openpyxl.cell.get_column_letter()函数。


从表中取得行和列

>>> import openpyxl
>>> wb=openpyxl.load_workbook('example.xlsx')
>>> sheet=wb.get_sheet_by_name('Sheet1')
>>> tuple(sheet['A1':'C3'])
((<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.B1>, <Cell 'Sheet1'.C1>), (<Cell 'Sheet1'.A2>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.C2>), (<Cell 'Sheet1'.A3>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.C3>))
>>> for i in sheet['A1':'C3']:
...     for j in i:
...             print(j.coordinate,j.value)
...     print('--- END OF ROW ---')
...
A1 apple
B1 juice
C1 cake
--- END OF ROW ---
A2 None
B2 nurse
C2 None
--- END OF ROW ---
A3 None
B3 None
C3 None
--- END OF ROW ---


总结:

1、导入openpyxl模块

2、调用openpyxl.load_workbook()函数

3、取得Workbook对象

4、调用get_active_sheet()或get_sheet_by_name()工作薄方法

5、取得Worksheet对象

6、使用索引或工作表的cell()方法,带上row和column关键字参数

7、取得Cell对象

8、读取Cell对象的value属性



【扩展】

1、Font对象

Font对象的style属性影响文本在单元格中的显示方式。

要设置字体风格属性,就向Font()函数传入关键字参数。


2、公式

>>> sheet['B10']='=sum(B1:B9)'
>>> wb.save('example.xlsx')       ##保存


3、调整行和列

Worksheet对象由row_dimensions和column_dimensions属性,控制行高和列宽。

>>> sheet.row_dimensions[1].height=70
>>> sheet.column_dimensions['B'].width=40
>>> wb.save('example.xlsx')

利用merge_cells()工作表方法,可以将一个矩形区域中的单元格合并为一个单元格。

要拆分单元格,就调用unmerge_cells()工作表方法。

>>> sheet.merge_cells('A1:D3')
>>> wb.save('example.xlsx')

在OpenPyXL中,每个Worksheet对象都有一个freeze_panes属性,可以设置为一个Cell对象或一个单元格坐标的字符串。

单元格上边的所有行和左边的所有列都会冻结,但单元格所在的行和列不会冻结。

要解冻所有的单元格,就将freeze_panes设置为None或‘A1’。

>>> sheet.freeze_panes='A2'  ##行1将永远可见
>>> wb.save('example.xlsx')

如果需要创建图标,需要做下列事情:

1、从一个矩形区域选择的单元格,创建一个Reference对象

2、通过传入Reference对象,创建一个Series对象

3、创建一个Chart对象

4、将Series对象添加到Chart对象

5、可选地设置Chart对象的drawing.top、drawing.left、drawing.width和drawing.height变量

6、将Chart对象添加到Worksheet对象

如果加载一个Workbook对象,然后马上保存到同样的.xlsx文件名中,实际上会删除其中的图表。


以上是关于处理Excel电子表格的主要内容,如果未能解决你的问题,请参考以下文章

雷林鹏分享:Apache POI电子表格/Spreadsheet

雷林鹏分享:Apache POI电子表格/Spreadsheet

python处理Excel表格--写入Excel表格

python处理Excel表格--写入Excel表格

python处理Excel表格--写入Excel表格

编写大型 Excel 电子表格