学Python，用Python自动创建PDF文档，实现办公自动化

Posted 2021-09-07 人邮异步社区

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了学Python，用Python自动创建PDF文档，实现办公自动化相关的知识，希望对你有一定的参考价值。

我们经常将DOC/DOCX、PPT文档另存或者转换为PDF文档。但是这个转换过程不可控，结果不一定能够达到我们的版式需求，因此本节介绍如何使用库从零开始制作PDF文档。

8.2.1　用ReportLab库创建PDF文档

ReportLab是一个用于创建PDF文档的Python库，其功能非常强大，安装方法也非常简单，直接用pip命令安装即可。

1．创建简单的PDF文档

下面我们看一下8.1节示例中的PDF文档是如何自动创建的。

首先从reportlab包的pdfgen目录下导入canvas模块。

>>> from reportlab.pdfgen import canvas

canvas是画布的意思，制作PDF文档好比在空白的画布上作画。

canvas模块有个Canvas类，是创建PDF文档的入口。通过help函数可以查询它的用法。

>>> help(canvas.Canvas)
...
def__init__(self,filename,pagesize=None,bottomup=1,pageCompression=None,invariant=None,verbosity=0, \\  
|encrypt=None,cropMarks=None,pdfVersion=None,enforceColorSpace=None,initialFontName=None, \\  
initialFontSize=None,initialLeading=None,cropBox=None,artBox=None,trimBox=None,bleedBox=None,lang=None,):
...

初始化方法可以传入的值很多，必须传入的是待创建的PDF文档的文件名（filename）。

>>> c=canvas.Canvas('H:\\示例\\第8章\\HelloWorld.pdf')
>>> c
<reportlab.pdfgen.canvas.Canvas object at 0x00000000025674E0>

方法返回的是
reportlab.pdfgen.canvas.Canvas类的一个实例对象，赋值给变量c，后面用c指代该实例对象。

用dir函数查看对象的属性和方法，主要包括：absolutePosition、acroForm、addLiteral、addOutlineEntry、addPageLabel、addPostScriptCommand、arc、beginForm、beginPath、beginText、bezier、bookmarkHorizontal、
bookmarkHorizontalAbsolute、bookmarkPage、bottomup、circle、clipPath、cross、delCatalogEntry、delViewerPreference、doForm、drawAlignedString、drawBoundary、drawCentredString、drawImage、drawInlineImage、drawPath、drawRightString、drawString、drawText、ellipse、endForm、freeTextAnnotation、getAvailableFonts、getCatalogEntry、getCurrentPageContent、getPageNumber、getViewerPreference、getpdfdata、grid、hasForm、highlightAnnotation、imageCaching、init_graphics_state、inkAnnotation、inkAnnotation0、line、linearGradient、lines、linkAbsolute、linkRect、linkURL、listLoadedFonts0、pageHasData、pop_state_stack、push_state_stack、radialGradient、rect、resetTransforms、restoreState、rotate、roundRect、save、saveState、scale、setArtBox、setAuthor、setBleedBox、setCatalogEntry、setCreator、setCropBox、setDash、setDateFormatter、setEncrypt、setFillAlpha、setFillColor、setFillColorCMYK、setFillColorRGB、setFillGray、setFillOverprint、setFont、setFontSize、setKeywords、setLineCap、setLineJoin、setLineWidth、setMiterLimit、setOutlineNames0、setOverprintMask、setPageCallBack、setPageCompression、setPageDuration、setPageRotation、setPageSize、setPageTransition、setProducer、setStrokeAlpha、setStrokeColor、setStrokeColorCMYK、setStrokeColorRGB、setStrokeGray、setStrokeOverprint、setSubject、setTitle、setTrimBox、setViewerPreference、shade、showFullScreen0、showOutline、showPage、skew、state_stack、stringWidth、textAnnotation、textAnnotation0、transform、translate、wedge。

通过这些方法，我们可以在画布上绘制复杂的PDF文档。

使用setPageSize方法设置页面大小。

>>> c.setPageSize((1200,800))

页面大小也可以在初始化Canvas对象的时候，通过代入.pagesize进行设置。

使用setFont方法设置字体。

>>> c.setFont('Helvetica',200)

设置后，我们可以看到属性值发生了变化。

>>> c._pagesize, c._fontname,c._fontsize
((1200, 800), 'Helvetica', 200)

使用drawString方法在画布上书写，参数包括起点坐标和文本内容。PDF文档中的每个元素都和位置相关，所以绘制元素时必须指定坐标。画布上的每个点都可以用坐标（x,y）表示，原点（0,0）在左下角，向右移动增加x值，向上移动增加y值。

>>> c.drawString(50, 400, 'Hello,World!')

画布画完后，使用showPage方法关闭当前页并翻页，继续绘制下一页。

>>> c.showPage()

本例只有一页，直接保存文件，结束任务。

>>> c.save()

用PDF阅读器或者文本编辑器打开PDF文档，可以看到和8.1.1节的PDF文档是一样的。

我们可以解析PDF文档。

>>> import re
>>> from reportlab.lib.utils import import_zlib as z_pdf
>>> from reportlab.lib.rl_accel import asciiBase85Decode as abd_pdf
>>> pdf=open('H:\\示例\\第8章\\HelloWorld.pdf', 'rb').read()
>>> stream=re.compile(b'.*?FlateDecode.*?stream(.*?)endstream', re.S)
>>> [z_pdf().decompress(abd_pdf(s.strip(b'\\r\\n'))) for s in re.findall(stream,pdf)]
 [b'1 0 0 1 0 0 cm  BT /F1 12 Tf 14.4 TL ET\\nBT /F1 200 Tf 240 TL ET\\nBT 1 0 0 1 50 400 Tm (Hello,World!) Tj T* ET\\n \\n']

作画之前还可以设置画笔的状态，例如颜色、线条的宽度（_lineWidth）、写字用的字体（＿fontname、_fontsize）等。前面我们设置了英文字体，由于reportlab包不带中文字体，需要通过官方渠道下载字体文件（下面用到微软雅黑msyh.ttf），放到reportlab安装包下面的font文件夹中，如图8-5所示。

要注意的是，字体使用之前还需要注册。

>>> from reportlab.pdfbase.ttfonts import TTFont
>>> from reportlab.pdfbase import pdfmetrics
>>> pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))

图8-5

对页面大小的修改在翻页以后仍然有效，但是字体的设置只在本页有效。

>>> c.setPageSize((1200,800))
>>> c.setFont('Helvetica',200)
>>> c.showPage()
>>> c._pagesize, c._fontname,c._fontsize
((1200, 800), 'Helvetica', 12)

也就是说，每次翻页，字体都恢复到最初状态。最初的字体状态是由类实例化时传入的数值控制的。

>>> c._initialFontName,c._initialFontSize
('Helvetica', 12)

类实例化时调用了init_graphics_state方法，初始化了画笔状态，包括字体、颜色、字符间距、线条宽度等。showPage方法调用了_startPage方法，后者又调用了init_graphics_state方法，最终将字体恢复到最初状态（_initialFontName、_initialFontSize）。

如果我们需要在同一页面多次设置画笔状态，可以使用saveState和restoreState方法保存和还原画笔状态。

下面以字体设置为例。

>>> c.setFont('Courier',100)
>>> c.saveState()
>>> c._pagesize, c._fontname,c._fontsize
((1200, 800), 'Courier', 100)
>>> c.setFont('Helvetica',300)

使用restoreState方法可以将画笔恢复到上次使用saveState方法保存的状态。

>>> c.restoreState()
>>> c._pagesize, c._fontname,c._fontsize
((1200, 800), 'Courier', 100)

案例：制作精美的封面

下面我们多次设置画笔状态，书写汉字，并绘制线条和图形。

   from reportlab.pdfgen import canvas
   from reportlab.lib.pagesizes import landscape, letter
   from reportlab.pdfbase.ttfonts import TTFont
   from reportlab.pdfbase import pdfmetrics
   from reportlab.lib.colors import pink, black, red, blue, green
⓿ pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))
   c=canvas.Canvas(r'H:\\示例\\第8章\\report.pdf')
❶ c.setPageSize((1200,800))
   c.drawImage(r'H:\\示例\\第8章\\background.png',0,500,1200,300)
   c.drawImage(r'H:\\示例\\第8章\\logo.png',0,800-72,190,72)
❷ c.setFont('微软雅黑',50)
   c.drawCentredString(600, 400,'2020年汽车金融专题研究报告')
   c.setFont('微软雅黑',30)
   c.drawCentredString(600, 300, '南山研究院 分析师 金融哥')
   c.setFont('微软雅黑',20)
   c.drawString(50, 120, '因 / 为 / 专 / 注 / 所 / 以 / 专 / 业')
   c.setFont('微软雅黑',30)
   c.drawRightString(1150, 120, '2020年3月')
❸ c.setLineWidth(10)
   c.line(0, 100,1200 ,100 )
   c.setFont('微软雅黑',15)
   c.drawString(50, 80, '本产品保密并受到版权法保护')
   c.drawRightString(1150, 80, 'Confidential and Protected by Copyright Laws')
❹ c.setFillColor(red)
   c.rect(800, 500, 1200, 20, stroke=0, fill=1)
❺ c.setFillGray(0.75)
   c.setFillAlpha(0.3)
   c.rect(0, 500, 800, 20, stroke=0, fill=1)
   c.showPage()
   c.save()

语句⓿注册中文字体微软雅黑；语句❶设置画布大小；语句❷设置书写要用到的字体；语句❸设置画笔线条宽度；语句❹设置图形填充色；语句❺设置矩形的灰度。还用了drawImage方法添加图片，用rect方法绘制矩形，图片和矩形的参数均要指定起始坐标、宽度和高度，另外图片还要指定文件路径。打开生成的PDF文档，效果如图8-6所示。

图8-6

如果一个PDF文档有多页，每页都有固定的元素，每页都重复绘制的话，代码量就比较大，因此可以将固定部分的制作代码放入循环。

使用Canvas类的doForm、beginForm、endForm方法也可以达到同样的效果。

   from reportlab.pdfgen import canvas
   from reportlab.pdfbase.ttfonts import TTFont
   from reportlab.pdfbase import pdfmetrics
   pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))
   c=canvas.Canvas(r'H:\\示例\\第8章\\mydoc_form.pdf')
   c.setPageSize((1200,800))
⓿ c.beginForm('LOGO')
   c.drawImage(r'H:\\示例\\第8章\\logo.png',0,800-72,190,72)
❶ c.endForm()
   list=['2020年汽车金融专题研究报告','2020年消费金融专题研究报告',         
   '2020年融资租赁专题研究报告','2020年汽车销售专题研究报告']
   for item in list:
❷     c.doForm('LOGO')
       c.setFont('微软雅黑',80)
       c.drawCentredString(600, 400,item)
       c.showPage()
   c.save()

语句⓿创建form，并将其命名为LOGO；语句❶结束并保持form；语句⓿和❶之间的代码绘制封面的固定内容，通过循环和语句❷，完成文字的书写。打开生成的PDF文档，效果如图8-7所示。

图8-7

在以上例子中，我们用drawString、line、rect方法可以书写不同类型的内容。但是这种“画图”的方式非常低端，始终离不开坐标，如果我们要写入一大段文字，则需要计算每一行能放多少字，并不断调整坐标。由于所有的文字都是图画点，也就没有“自动换行”的功能。

pdfgen目录里面的模块还有很多，都只能进行比较底层的操作。如果要制作更复杂的内容，就要用到页面布局（platypus）。

2．添加段落、表格与图表

要想提升效率，就要减少重复劳动，多用模板和样式。在reportlab包中，platypus目录里的模块就是用来实现各种样式、版式的。platypus是“Page Layout and Typography Using Scripts”的缩写，它致力于把文档的样式和内容分开，段落、表格都直接套用相应的格式，页面也可以套用页面模版。

platypus包括几个层面：文档模板（DocTemplate）、页面模板（PageTemplate）、页面框架（Frame）、页面元素（flowables）。一个文档可以有多个页面模板，一个页面可以有多个框架，一个框架里可以放很多元素。

flowables，即可流动的元素，这是一个形象的比喻。最常见的页面元素就是段落，同样一段文字，随着框架大小的变化，可以被拆分来适应框架，每行字符不固定，其占据的行数也会发生变化。此外，表格、空白（Spacer）、分页符（PageBreak）、图片（Image）都是flowables。图片无法拆分，当框架太小时，它将移动到下一个框架，所以这些元素和坐标系就没有了联系，我们排版布局时，就不用考虑元素的坐标。只需要选择合适的文档和页面模板，设计不同的框架容器，然后依次放入页面元素，即可生成一个PDF文档。

（1）段落

制作段落需要用platypus子目录中paragraph模块的Paragraph类，其语法如下。

Paragraph(text, style, bulletText=None, caseSensitive=1)

它可以将文字和样式生成PDF文档中的段落。

参数text表示各个段落的文本内容。

>>> txt_0='什么是汽车金融？'
>>> txt_1='''汽车金融是汽车全产业链覆盖的资本流动。狭义的汽车金融隶属于消费金融,广义的汽车金融贯穿全产业链。汽车金融的概念最早源于美国，狭义的汽车金融，更多地关注汽车销售环节，为下游客户提供融资性金融服务,隶属于消费金融。广义的汽车金融，是贯穿汽车的生产、流通、销售、使用、回收等环节中的资金流动，提高资本利用率和资金周转率。'''
>>> txt_2='''我国汽车消费金融业萌芽于商业银行贷款，后经政策放宽，形成汽车金融公司、汽车融资租赁公司、互联网汽车金融公司等多元主体并存的局面。'''
>>> txt_3='''中国汽车消费金融渗透率与海外成熟市场差距很大。汽车金融的渗透率，指通过贷款、融资等金融方式购买的车辆数量与汽车销量之比。中国汽车消费金融渗透率一直处于较低水平。'''

参数style表示段落样式。调用lib子目录中styles模块的getSampleStyleSheet函数。

>>> from reportlab.lib.styles import getSampleStyleSheet
>>> s=getSampleStyleSheet()
>>> s
<reportlab.lib.styles.StyleSheet1 object at 0x0000000002BBDDD8>

返回的是样式表StyleSheet1对象，它里面有一些基本的样式可供我们直接使用。用dir函数查看对象的属性和方法，主要包括：add、byAlias、byName、get、has_key、list。

使用list方法输出全部样式的样式设置。

>>> s.list()

其中，Normal、Title样式的主要默认属性说明见表8-1。

表8-1

属性	说明	Normal	Title
name	样式名称	Normal	Title
parent	父对象	None	<'Normal'>
alignment	文字对齐	0	1
allowOrphans	页底段落最小行数	0	0
allowWidows	页顶段落最小行数	1	1
backColor	背景颜色	None	None
borderColor	边框颜色	None	None
borderPadding	内容与边距的距离	0	0
borderRadius	圆角的边框	None	None
borderWidth	边框宽度	0	0
firstLineIndent	首行缩进	0	0
fontName	字体名称	Helvetica	Helvetica-Bold
fontSize	字体大小	10	18
leading	行距	12	22
leftIndent	左缩进	0	0
rightIndent	右缩进	0	0
spaceAfter	段后间隔	0	6
spaceBefore	段前间隔	0	0
textColor	文字颜色	Color(0,0,0,1)	Color(0,0,0,1)
wordWrap	单词中换行	None	None

可以修改样式的默认属性值。

>>> from reportlab.pdfbase.ttfonts import TTFont
>>> from reportlab.pdfbase import pdfmetrics
>>> pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))
>>> s['Title'].fontName,s['Title'].fontSize='微软雅黑' ,30
>>> s['Title'].spaceAfter,s['Normal'].spaceBefore=30,10
>>> s['Normal'].fontName,s['Normal'].fontSize='微软雅黑',20
>>> s['Normal'].leading=30
>>> s['Normal'].firstLineIndent=40

下面生成段落。

由于platypus子目录中的__init__.py中有语句“from .paragraph import *”，所以可以直接调用Paragraph类。

>>> from reportlab.platypus import Paragraph

代入文本和样式参数，生成第1个段落对象。

>>> p_0=Paragraph(txt_0,s['Title'])
>>> type(p_0)
<class 'reportlab.platypus.paragraph.Paragraph'>
>>> p_1=Paragraph(txt_1,s['Normal'])
>>> p_2=Paragraph(txt_2,s['Normal'])
>>> p_3=Paragraph(txt_3,s['Normal'])

使用platypus目录中doctemplate模块的SimpleDocTemplate类。

>>> from reportlab.platypus import SimpleDocTemplate
>>> doc=SimpleDocTemplate(r'H:\\示例\\第8章\\mydoc.pdf',pagesize=(1200,800))
>>> doc
<reportlab.platypus.doctemplate.SimpleDocTemplate object at 0x0000000004A6DDD8>

使用SimpleDocTemplate对象的build方法，它可以将页面元素放入文档，生成最终的PDF文档。

build(self,flowables,onFirstPage=_doNothing, onLaterPages=_doNothing, canvasmaker=canvas.Canvas)

build方法必要的参数是页面元素，段落就是一种页面元素，但是要将其转为列表，才能作为build方法的参数。

>>> story_text=[p_0,p_1,p_2,p_3]
>>> type(story_text)
<class 'list'>

代入参数，生成文件。

>>> doc.build(story_text)

打开生成的PDF文档，效果如图8-8所示。

除了修改样式，我们还可以使用add(style, alias=None)方法添加样式。

>>> from reportlab.lib.styles import ParagraphStyle
>>> s_par=ParagraphStyle(name='A1',fontName='微软雅黑',fontSize=40,firstLineIndent=0)
>>> s_par
<ParagraphStyle 'A1'>
>>> s.add(s_par)
>>> p=Paragraph('微软雅黑40号字体',s['A1'])

图8-8

（2）表格

一般来说，PDF文档中的表格和图表都是通过Excel表格生成，再以图片的形式插入PDF文档中，但是这种图像在放大以后就会变得很模糊，下面尝试直接在PDF文档中绘制表格和图表。

和段落一样，表格也是一种页面元素。

下面需要用platypus子目录中tables模块的Table类制作表格，其语法如下。

Table(data,colWidths=None,rowHeights=None,style=None,repeatRows=0,repeatCols=0,splitByRow=1,emptyTableAction=None,ident=None,hAlign=None,vAlign=None,normalizedData=0,cellStyles=None,rowSplitRange=None, spaceBefore=None,spaceAfter=None,longTableOptimize=None,minRowHeights=None)

数据源data是必须指定的，它是一个二维数组，和要显示的表的每一行、每一列对应。其余的都是可选参数，常用的包括前3个。参数colWidths是一个列表，表示各列的宽度，例如col_widths=[100,50, 50]表示第1列宽100，第2、3列宽50；参数rowHeights表示行高，其设置方法与列宽类似，如果不设置这两个参数，列宽和行高就会变成自适应；参数style表示表格的样式，具体使用TableStyle对象来逐个项目逐个单元格地设置。

首先，构造表格数据参数。

>>> data=[['姓名','一季度','二季度','三季度','四季度'],
...['小赵',100,110,125,135], ['小钱',110,114,126,123],
...['小孙',120,115,127,141],['小李',130,117,128,165],
...['小王',120,127,122,125]]

其次，构造表格列宽、行高参数。

>>> col_widths, row_heights=[80,100,100,100,100],[60,50,50,50,50,50]

然后，构造表格样式参数。调用platypus子目录中Table模块的TableStyle类。

>>> from reportlab.platypus import TableStyle
>>> from reportlab.lib import colors
>>> from reportlab.pdfbase.ttfonts import TTFont
>>> from reportlab.pdfbase import pdfmetrics
>>> pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))
>>> table_style=TableStyle([
...         ('FONT', (0, 0), (0, -1), '微软雅黑', 30),
...         ('FONT', (0, 0), (-1, 0), '微软雅黑', 30),
...         ('FONT', (1, 1), (-1, -1), '微软雅黑', 15),
...         ('ALIGN', (0, 0), (-1, -1), 'CENTER'),
...         ('VALIGN', (0, 0), (-1, -1), 'MIDDLE'),
...         ('GRID', (0,0), (-1,-1), 0.5, colors.black),
...         ('INNERGRID', (0,0), (-1,-1), 0.25, colors.black),
...         ('BOX', (0,0), (-1,-1), 0.25, colors.black),
...         ('BACKGROUND',(0,0),(-1,-1),colors.white)])

设置表格样式的语法比较特殊，它使用“属性，左上角，右下角，属性值”，表示对某个单元格区域设置属性。0表示第一行或者第一列，−1表示最后一行或最后一列。例如(0, 0)表示左上角单元格，(−1, −1)表示右下角单元格，围起来的区域就是整个表格。

有了全部参数，下面使用Table类实例化一个表格。

>>> from reportlab.platypus import Table
>>> 
table=Table(data,colWidths=col_widths,rowHeights=row_heights,style=table_style)
>>> type(table)
<class 'reportlab.platypus.tables.Table'>

给表格增加一个标题。

>>> tabletitle='''<para alignment=center fontName='微软雅黑' fontSize=20 spaceAfter=30>表1： 销售情况表</para>'''
>>> from reportlab.lib.styles import getSampleStyleSheet
>>> styles=getSampleStyleSheet()
>>> from reportlab.platypus import Paragraph

一起放入列表。

>>> story_table=[Paragraph(tabletitle,styles['Normal']),table]

调用SimpleDocTemplate类的build方法，生成PDF文档。

>>> from reportlab.platypus import SimpleDocTemplate
>>> doc=SimpleDocTemplate(r'H:\\示例\\第8章\\mydoc_table.pdf',pagesize=(1200,800))
>>> doc.build(story_table)

打开生成的PDF文档，效果如图8-9所示。

（3）图表

在PDF文档中添加各种图形，需要用到graphics子目录中的各个模块。下面尝试直接在PDF文档中绘制图表。

调用shapes模块的Drawing类。

>>> from reportlab.graphics.shapes import Drawing

实例化Drawing类，指定绘图区的宽、高。

>>> d=Drawing(100, 100)
>>> d
<reportlab.graphics.shapes.Drawing object at 0x00000000051A2518>

获得一个绘图区Drawing对象，用dir函数查看对象的属性和方法，主要包括：add、asDrawing、asGroup、asString、background、contents、copy、draw、drawOn、dumpProperties、expandUserNodes、getBounds、getContents、getKeepWithNext、getProperties、getSpaceAfter、getSpaceBefore、hAlign、height、identity、insert、isIndexing、minWidth、renderScale、resized、rotate、save、scale、setProperties、shift', 'skew、split、splitOn、transform、translate、vAlign、verify、width、wrap、wrapOn。

图8-9

有了绘图区，下一步就是绘制条形图。

绘制条形图需要使用barcharts模块中的VerticalBarChart类。

>>> from reportlab.graphics.charts.barcharts import VerticalBarChart
>>> bar=VerticalBarChart()
>>> bar
<reportlab.graphics.charts.barcharts.VerticalBarChart object at 0x00000000051A23C8>

获得一个垂直条形图VerticalBarChart对象，用dir函数查看对象的属性和方法，主要包括：background、barLabelArray、barLabelFormat、barLabels、barSpacing、barWidth、bars、calcBarPositions、categoryAxis、categoryNALabel、data、debug、demo、draw、dumpProperties、fillColor、getBounds、getProperties、getSeriesName、getSeriesOrder、groupSpacing、height、makeBackground、makeBars、makeSwatchSample、naLabel、provideNode、reversePlotOrder、setProperties、strokeColor、strokeWidth、useAbsolute、valueAxis、verify、width、x、y、zIndexOverrides。

下面设置对象的各种属性。

>>> bar.x,bar.y,bar.height,bar.width,bar.valueAxis.valueMin=50,-150,280,500,0
>>> bar.categoryAxis.categoryNames=['2012','2013','2014','2015','2016']
>>> bar.data=[[16, 17, 18, 24, 25]]
>>> bar.bars[0].fillColor,bar.barLabels.nudge=colors.black,18
>>> bar.barLabelFormat,bar.valueAxis.labels.fontSize='%0.0f',20
>>> bar.categoryAxis.labels.fontSize,bar.barLabels.fontSize=20,30

通过Drawing对象的add方法将条形图放入绘图区。

>>> d.add(bar)

下面在绘图区中添加一个标题。

>>> from reportlab.graphics.charts.textlabels import Label
>>> title=Label()
>>> title.setText('图1： 汽车金融公司数量')
>>> title.fontSize,title.fontName,title.dx,title.dy=20,'微软雅黑',260,160
>>> d.add(title)

将绘图区放入列表，为了防止太靠近顶端，在绘图区上方添加空格。

>>> from reportlab.platypus import Spacer
>>> story_chart=[Spacer(1,75),d]

调用SimpleDocTemplate类的build方法，生成PDF文档。

>>> from reportlab.platypus import SimpleDocTemplate
>>> doc=SimpleDocTemplate(r'H:\\示例\\第8章\\mydoc_chart.pdf',pagesize=(1200,800))
>>> doc.build(story_chart)

打开生成的PDF文档，效果如图8-10所示。

图8-10

本例中的图表是矢量化的图表，即使放大也不会变模糊。

绘图区的保存方式有多种。

>>> from reportlab.pdfgen import canvas
>>> my_canvas=canvas.Canvas(r'H:\\示例\\第8章\\mydoc_chart.pdf', pagesize=(1200,800))
>>> d.drawOn(my_canvas, 100, 100)
>>> my_canvas.save()

或者以下方式。

>>> d.save(formats=['pdf'],fnRoot=r'H:\\示例\\第8章\\mydoc_chart')

或者以下方式。

>>> from reportlab.graphics import renderPDF
>>> renderPDF.drawToFile(d,r'H:\\示例\\第8章\\mydoc_chart.pdf',autoSize=0)

3．页面布局设计

单个的段落、表格、图表都容易实现，但有时候我们需要将其混排在一起。前面提到的段落、表格、图表都属于Flowable对象，其位置和坐标没关系，是可以变化的，那么如何才能准确地排版呢？那就需要把它们放置在固定的区域内。使用框架可以将复杂的PDF页面分为不同的区域，用来放置文字、表格、图表等内容。

导入框架类Frame。

>>> from reportlab.platypus import Frame

查看Frame类的帮助信息。

>>> help(Frame)

在帮助文档中可以查到Frame类的实例化参数。

class Frame(builtins.object)
Frame(x1, y1, width,height, leftPadding=6, bottomPadding=6, rightPadding=6, topPadding=6, id=None, showBoundary=0)

Frame的外观示意图如图8-11所示。

图8-11

Frame主要用于界定了画布上可以放元素的区域。我们看到Frame的左下角的坐标为（x1，y1），该坐标相对于使用时的画布；尺寸为width×height；Padding是指定边距，扣除边距剩下的就是可供绘图的空间；参数id表示识别符；参数showBoundary表示边界线。

下面将页面分为3个区域，分别放入文字、图表、表格。

>>> f1=Frame(0, 0, 600, 400, showBoundary=1, id='f1')
>>> f2=Frame(600, 0, 600, 400, showBoundary=1, id='f2')
>>> f3=Frame(0, 400, 1200, 400, showBoundary=1, id='f3')
>>> f3
<reportlab.platypus.frames.Frame object at 0x0000000004F86208>

用dir函数查看Frame对象的方法和属性，主要包括：add、addFromList、add_generated_content、drawBoundary、id、showBoundary、split。

可以通过设置showBoundary=0不显示框架的线条，这样既可以对齐内容，又不会显得页面太乱，即使是复杂的版式也显得井井有条。

有了框架，我们就再也不用担心画布上的元素无法对齐了。下面创建一个画布。

>>> from reportlab.pdfgen.canvas import Canvas
>>> c=Canvas(r'H:\\示例\\第8章\\mydoc_Frame.pdf')
>>> c.setPageSize((1200,800))

使用Frame对象的addFromList(drawlist, canv)方法，可以将元素列表（包含flowables的list）按照框架规定的位置放到画布上面。story_chart、story_table、story_text的制作过程前面已经介绍过，此处不再赘述。

>>> f1.addFromList(story_chart,c)
>>> f2.addFromList(story_table,c)
>>> f3.addFromList(story_text,c)
>>> c.save()

打开生成的PDF文档，效果如图8-12所示。

图8-12

有时候我们需要在每一页都添加固定的内容，如公司Logo、页码等信息，这时就要用到页眉和页脚。页眉和页脚应当是自动化生成的，在前面调用doForm方法的案例中，我们插入的logo不是页眉，因为下一页的logo还要手动插入，而无法自动生成。

前面我们用到的build方法，还有两个参数onFirstPage和onLaterPages，用于指定在首页的操作和在后面所有页的操作。

我们看一个例子。

from reportlab.platypus import SimpleDocTemplate, Paragraph,PageBreak, Spacer
from reportlab.lib.styles import getSampleStyleSheet
from reportlab.pdfbase.ttfonts import TTFont
from reportlab.pdfbase import pdfmetrics
pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))
def header_footer(c, doc):
    c.drawImage(r'H:\\示例\\第8章\\logo.png',1200-190,800-72,190,72)
    c.setFont('微软雅黑',20)
    c.drawString(50, 60, '因 / 为 / 专 / 注 / 所 / 以 / 专 / 业')
    c.setLineWidth(3)
    c.line(0, 50,1200 ,50 )
    c.line(0, 800-75,1200 ,800-75 )
    c.setFont('微软雅黑',20)
    c.drawString(50, 30, '本产品保密并受到版权法保护')
    c.drawRightString(1150, 30, 'Confidential and Protected by Copyright Laws')
    page_num=c.getPageNumber()
    c.setFont('微软雅黑',30)
    text='第 %s页' % page_num
    c.drawRightString(580,20, text)
    c.setFont('微软雅黑',50)
    c.rotate(30)
    c.setFillAlpha(0.2)
    c.drawString(600, 0, '版权所有 南山金融研究')
    c.rotate(-30)
myPDF=SimpleDocTemplate(r'H:\\示例\\第8章\\mydoc.pdf',pagesize=(1200,800))
story=[]
list=['2020年汽车金融专题研究报告','2020年消费金融专题研究报告',         
      '2020年融资租赁专题研究报告','2020年汽车销售专题研究报告']
styles=getSampleStyleSheet()
styles['Normal'].fontName='微软雅黑' 
styles['Normal'].fontSize=40
for item in list:
    story.append(Spacer(1,200))
    story.append(Paragraph(item, styles['Normal']))
    story.append(PageBreak())
myPDF.build(story, onFirstPage=header_footer, onLaterPages=header_footer)

函数header_footer定义了制作页眉和页脚的操作，build方法的参数传入了函数名header_footer，即onFirstPage=header_footer、onLaterPages=header_footer，表示每一页都会自动完成添加页眉和页脚的操作。

打开生成的PDF文档，效果如图8-13所示。

图8-13

本例还实现了在新建文件中添加水印的效果，给已有的文件添加水印，将用其他库来实现。当然，这种水印也很容易去除。还可以将PDF文档的页面转换成图片，然后在图片上加水印，最后将加完水印的图片组合生成PDF文档，这样的水印就难以去除了。

本文截选自《学Python 不加班轻松实现办公自动化》

这是一本关于如何利用Python提高日常办公效率的书，书中凝聚了作者多年的实践经验和独特思考，旨在帮助读者准确、高效地完成大量高重复度的工作。

《学Python，不加班：轻松实现办公自动化》汇集了日常办公和处理文档时常见的问题，通过实例的演示与讲解，帮助读者灵活有效地使用Python处理工作中遇到的问题。全书共11章，涵盖Python的各种应用场景，具体包括文件管理自动化，网络信息自动获取，TXT、XLS／XLSX、DOC／DOCX、PPT、PDF、图片文件的自动化处理，模拟鼠标、键盘操控本地软件，自动化运行管理等。本书力图淡化编程中的抽象概念，贴合工作场景，注重实战效果，通过对Python技术的巧妙讲解，帮助读者成为高效率的办公室“超人”。

《学Python，不加班：轻松实现办公自动化》适合任何想要学习Python编程的读者，尤其适合缺乏编程经验的初学者。同时本书提供所有案例的源代码文件，方便读者边学边练，爱上Python编程。

以上是关于学Python，用Python自动创建PDF文档，实现办公自动化的主要内容，如果未能解决你的问题，请参考以下文章

学python如何办公自动化？学这些就够了

python自动化之PDF

办公自动化：用 Python 玩转 PDF 真的很香

办公自动化：Python-win32com自动将word文档转换成pdf格式！

python 用循环创建多个文件

4办公自动化Python实现Word转PDF

学Python，用Python自动创建PDF文档，实现办公自动化

8.2.1 用ReportLab库创建PDF文档

1．创建简单的PDF文档

2．添加段落、表格与图表

3．页面布局设计

8.2.1　用ReportLab库创建PDF文档