Python处理Excel文档之openpyxl

Posted 独孤_败天

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python处理Excel文档之openpyxl相关的知识,希望对你有一定的参考价值。

openpyxl 可以很好的处理 2010版本以上的表格。

示例:

 1 #coding:utf8
 2 \'\'\'
 3 Created on 2018年8月18日
 4 
 5 @author: Administrator
 6 \'\'\'
 7 from openpyxl import Workbook
 8 import datetime
 9 wb = Workbook()
10 
11 # grab the active worksheet
12 ws = wb.active
13 
14 # Data can be assigned directly to cells
15 ws[\'A1\'] = "班级人员统计表"
16 
17 # Rows can also be appended
18 list_str=["记录时间","学号","姓名","性别","年龄"]
19 ws.append(list_str)
20 
21 list_str2=["1","诸葛亮","","89"]
22 time1=datetime.date.today()
23 list_str2.insert(0, time1)
24 ws.append(list_str2)
25 
26 # 如果你要在已经有的数据上进行修改,会自动覆盖掉,原有的数据
27 # import datetime
28 # ws[\'A2\'] = datetime.datetime.now()
29 
30 # Save the file
31 wb.save("sample.xlsx")


在内存中处理一个工作簿:

创建一个工作簿

没有必要利用 openpyxl 先去创建一个文件系统上的文件然后才能开始使用。你只要导入工作簿类,然后开始使用它吧。

>>> from openpyxl import Workbook
>>> wb = Workbook()

A workbook is always created with at least one worksheet. You can get it by using the  openpyxl.workbook.Workbook.active()  property

一个工作簿被创建后,总会在里面默认创建一张工作表。你可以通过使用方法 openpyxl.workbook.Workbook.active() 来得到它。

 ws = wb.active

  默认状态下,函数 the _active_sheet_index property 的 index设置为0,除非你手动修改它的数值,否则的话,你用这个方法,只会拿到第一个工作表。

 1 @property
 2     def active(self):
 3         """Get the currently active sheet or None
 4 
 5         :type: :class:`openpyxl.worksheet.worksheet.Worksheet`
 6         """
 7         try:
 8             return self._sheets[self._active_sheet_index]
 9         except IndexError:
10             pass
11 
12     @active.setter
13     def active(self, value):
14         """Set the active sheet"""
15         self._active_sheet_index = value
16 
17     def create_sheet(self, title=None, index=None):
18         """Create a worksheet (at an optional index).
19 
20         :param title: optional title of the sheet
21         :type title: unicode
22         :param index: optional position at which the sheet will be inserted
23         :type index: int
24 
25         """
26         if self.read_only:
27             raise ReadOnlyWorkbookException(\'Cannot create new sheet in a read-only workbook\')
28 
29         if self.write_only :
30             new_ws = WriteOnlyWorksheet(parent=self, title=title)
31         else:
32             new_ws = Worksheet(parent=self, title=title)
33 
34         self._add_sheet(sheet=new_ws, index=index)
35         return new_ws
View Code

 

可以通过 openpyxl.workbook.Workbook.create_sheet() 方法,创建工作表。

wb.create_sheet("mysheet", 1)
wss=wb.create_sheet()

ws1 = wb.create_sheet("Mysheet111") # insert at the end (default)
ws2 = wb.create_sheet("Mysheet222", 0) # insert at first position

工作表的名字是自动命令。按照列表(Sheet, Sheet1, Sheet2, …)的内容,顺序命名。你也可以自定义工作表名字。

ws.title = "New Title"

默认情况下,包含此标题的选项卡的背景颜色为白色。您可以将此更改为为 sheet_properties 提供RRGGBB颜色代码。 tabColor 属性:

ws.sheet_properties.tabColor = "1072BA"

 一旦你给一个工作表命名一个名字,你就可以把这个名字作为一个键去访问工作簿中的工作表:

ws3 = wb["New Title"]

 你也可以通过方法 openpyxl.workbook.Workbook.sheetnames() 去遍历,查看工作簿中左右工作表的名称。

查看工作表:

print(wb.sheetnames)

  结果:

[\'Sheet\', \'mystudent\']

遍历工作表:

1 for sheetname in wb:
2     print(sheetname.title)

您可以在一个工作簿中创建工作表的副本:使用 openpyxl.workbook.Workbook.copy_worksheet() 方法

>>> source = wb.active
>>> target = wb.copy_worksheet(source)

  注意:1、只复制单元格(包括值、样式、超链接和注释)和某些工作表属性(包括维度、格式和属性)。所有其他工作簿/工作表属性都不会被复制-例如图像,图表。

               2、您不能在工作簿之间复制工作表。如果工作簿以只读或只读模式打开,您也不能复制工作表。

把玩数据

操作单一单元格

我们已经知道如何从外部进去工作表了。现在就可以对工作表里面的单元格内容进行各种操作了。

单元格可以作为工作表的键直接访问

 c = ws[\'A4\']

这将返回A4大小的单元格,或者如果单元格还不存在,就创建一个单元格。值可以直接分配

ws[\'A4\'] = 4

当然,你也可以通过方法 openpyxl.worksheet.Worksheet.cell() 去访问。该方法通过行和列的索引去访问,并且可以进行赋值操作。

d = ws.cell(row=4, column=2, value=10)

当一个工作表在内存中被创建的时候,他是不包含单元格。单元格只有在初次使用的时候,才会被创建。所以,当你访问一个不存在的单元格时,会报错。out of ranges

注意:由于这个特性,在内存中,当单元格没有值得时候,而需要访问它们,我们可以利用滚动访问的方式替代直接访问的方式。 

>>> for i in range(1,101):
...        for j in range(1,101):
...            ws.cell(row=i, column=j)

 以上代码会创建一个100*100的空白单元格。

批量操作单元格

可以使用切片访问单元格范围

cell_range = ws[\'A1\':\'C2\']

行或列的范围可以类似地得到:

>>> colC = ws[\'C\']
>>> col_range = ws[\'C:D\']
>>> row10 = ws[10]
>>> row_range = ws[5:10]

你也可以使用方法 openpyxl.worksheet.Worksheet.iter_rows() ,从左到右返回

>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2):
...    for cell in row:
...        print(cell)
<Cell \'mystudent\'.A1>
<Cell \'mystudent\'.B1>
<Cell \'mystudent\'.C1>
<Cell \'mystudent\'.A2>
<Cell \'mystudent\'.B2>
<Cell \'mystudent\'.C2>

相似的方法 openpyxl.worksheet.Worksheet.iter_cols() 从上到下返回

>>> for col in ws.iter_cols(min_row=1, max_col=3, max_row=2):
...     for cell in col:
...         print(cell)
<Cell Sheet1.A1>
<Cell Sheet1.A2>
<Cell Sheet1.B1>
<Cell Sheet1.B2>
<Cell Sheet1.C1>
<Cell Sheet1.C2>

如果需要遍历文件的所有行或列,可以使用 openpyxpath .worksheet. worksheet. rows() 属性:

>>> ws = wb.active
>>> ws[\'C9\'] = \'hello world\'
>>> tuple(ws.rows)
((<Cell Sheet.A1>, <Cell Sheet.B1>, <Cell Sheet.C1>),
(<Cell Sheet.A2>, <Cell Sheet.B2>, <Cell Sheet.C2>),
(<Cell Sheet.A3>, <Cell Sheet.B3>, <Cell Sheet.C3>),
(<Cell Sheet.A4>, <Cell Sheet.B4>, <Cell Sheet.C4>),
(<Cell Sheet.A5>, <Cell Sheet.B5>, <Cell Sheet.C5>),
(<Cell Sheet.A6>, <Cell Sheet.B6>, <Cell Sheet.C6>),
(<Cell Sheet.A7>, <Cell Sheet.B7>, <Cell Sheet.C7>),
(<Cell Sheet.A8>, <Cell Sheet.B8>, <Cell Sheet.C8>),
(<Cell Sheet.A9>, <Cell Sheet.B9>, <Cell Sheet.C9>))

或者  openpyxl.worksheet.Worksheet.columns()  属性

>>> tuple(ws.columns)
((<Cell Sheet.A1>,
<Cell Sheet.A2>,
<Cell Sheet.A3>,
<Cell Sheet.A4>,
<Cell Sheet.A5>,
<Cell Sheet.A6>,
...
<Cell Sheet.B7>,
<Cell Sheet.B8>,
<Cell Sheet.B9>),
(<Cell Sheet.C1>,
<Cell Sheet.C2>,
<Cell Sheet.C3>,
<Cell Sheet.C4>,
<Cell Sheet.C5>,
<Cell Sheet.C6>,
<Cell Sheet.C7>,
<Cell Sheet.C8>,
<Cell Sheet.C9>))

数据存储

一旦我们通过 openpyxl.cell.Cell ,拿到单元格,我们就可以给它赋值了。

>>> c.value = \'hello, world\'
>>> print(c.value)
\'hello, world\'

>>> d.value = 3.14
>>> print(d.value)
3.14
 1 Python 3.7.0 (v3.7.0:1bf9cc5093, Jun 27 2018, 04:59:51) [MSC v.1914 64 bit (AMD64)] on win32
 2 Type "copyright", "credits" or "license()" for more information.
 3 >>> import openpyxl
 4 >>> wb=openpyxl.Workbook()
 5 >>> ws=wb.create_sheet()
 6 >>> ws.title="mystudent"
 7 >>> ws.sheet_properties.tabColor="1072BA"
 8 >>> c=ws[\'A4\']
 9 >>> d=ws.cell(row=4,column=2,value=10)
10 >>> c.value="中国"
11 >>> c
12 <Cell \'mystudent\'.A4>
13 >>> print(c.value)
14 中国
15 >>> d.value
16 10
17 >>> d.value=3.1415926
18 >>> print(d.value)
19 3.1415926
20 >>> 
View Code

你也可以使用类型和格式。 注意::guess_types=True  测试使用,暂时用不了。会报错。没有这个参数。python37

 1 >>> wb = Workbook(guess_types=True)
 2 >>> c.value = \'12%\'
 3 >>> print(c.value)
 4 0.12
 5 
 6 >>> import datetime
 7 >>> d.value = datetime.datetime.now()
 8 >>> print d.value
 9 datetime.datetime(2010, 9, 10, 22, 25, 18)
10 
11 >>> c.value = \'31.50\'
12 >>> print(c.value)
13 31.5

保存文件

 保存工作簿的最简单和最安全的方法是使用 openpyxl.workbook.Workbook 对象提供的 openpyxl.workbook.Workbook.save() 方法。

>>> wb = Workbook()
>>> wb.save(\'balances.xlsx\')

  注意:如果文件名为已有的文件名,此操作将在没有任何警告的情况下覆盖现有文件。

您可以指定属性template=True,以将工作簿保存为模板:

>>> wb = load_workbook(\'document.xlsx\')
>>> wb.template = True
>>> wb.save(\'document_template.xltx\')

或将此属性设置为False(默认),保存为文档:

>>> wb = load_workbook(\'document_template.xltx\')
>>> wb.template = False
>>> wb.save(\'document.xlsx\', as_template=False)

  您应该监视数据属性和文档扩展,以便在文档模板中保存文档,反之亦然,否则结果表引擎无法打开文档。

接下的操作会保存失败:

>>> wb = load_workbook(\'document.xlsx\')
>>> # Need to save with the extension *.xlsx
>>> wb.save(\'new_document.xlsm\')
>>> # MS Excel can\'t open the document
>>>
>>> # or
>>>
>>> # Need specify attribute keep_vba=True
>>> wb = load_workbook(\'document.xlsm\')
>>> wb.save(\'new_document.xlsm\')
>>> # MS Excel will not open the document
>>>
>>> # or
>>>
>>> wb = load_workbook(\'document.xltm\', keep_vba=True)
>>> # If we need a template document, then we must specify extension as *.xltm.
>>> wb.save(\'new_document.xlsm\')
>>> # MS Excel will not open the document

加载文件:

与编写相同的方法是,可以导入 openpyxx .load_workbook() 来打开现有的工作簿:

>>> from openpyxl import load_workbook
>>> wb2 = load_workbook(\'test.xlsx\')
>>> print wb2.sheetnames
[\'Sheet2\', \'New Title\', \'Sheet1\']

 

简单操作到此结束。

 

以上是关于Python处理Excel文档之openpyxl的主要内容,如果未能解决你的问题,请参考以下文章

Python_Openpyxl模块.Excel数据处理

Python 利用 openpyxl 操作 Excel 之 图表

python之openpyxl模块

openpyxl模块(excel操作)

python模块之openpyxl

用python从符合一定格式的txt文档中逐行读取数据并按一定规则写入excel(openpyxl支持Excel 2007 .xlsx格式)