学Python,用Python自动创建PDF文档,实现办公自动化

Posted 人邮异步社区

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学Python,用Python自动创建PDF文档,实现办公自动化相关的知识,希望对你有一定的参考价值。

我们经常将DOC/DOCX、PPT文档另存或者转换为PDF文档。但是这个转换过程不可控,结果不一定能够达到我们的版式需求,因此本节介绍如何使用库从零开始制作PDF文档。

8.2.1 用ReportLab库创建PDF文档

ReportLab是一个用于创建PDF文档的Python库,其功能非常强大,安装方法也非常简单,直接用pip命令安装即可。

1.创建简单的PDF文档

下面我们看一下8.1节示例中的PDF文档是如何自动创建的。

首先从reportlab包的pdfgen目录下导入canvas模块。

>>> from reportlab.pdfgen import canvas

canvas是画布的意思,制作PDF文档好比在空白的画布上作画。

canvas模块有个Canvas类,是创建PDF文档的入口。通过help函数可以查询它的用法。

>>> help(canvas.Canvas)
...
def__init__(self,filename,pagesize=None,bottomup=1,pageCompression=None,invariant=None,verbosity=0, \\  
|encrypt=None,cropMarks=None,pdfVersion=None,enforceColorSpace=None,initialFontName=None, \\  
initialFontSize=None,initialLeading=None,cropBox=None,artBox=None,trimBox=None,bleedBox=None,lang=None,):
...

初始化方法可以传入的值很多,必须传入的是待创建的PDF文档的文件名(filename)。

>>> c=canvas.Canvas('H:\\示例\\第8章\\HelloWorld.pdf')
>>> c
<reportlab.pdfgen.canvas.Canvas object at 0x00000000025674E0>

方法返回的是
reportlab.pdfgen.canvas.Canvas类的一个实例对象,赋值给变量c,后面用c指代该实例对象。

用dir函数查看对象的属性和方法,主要包括:absolutePosition、acroForm、addLiteral、addOutlineEntry、addPageLabel、addPostScriptCommand、arc、beginForm、beginPath、beginText、bezier、bookmarkHorizontal、
bookmarkHorizontalAbsolute、bookmarkPage、bottomup、circle、clipPath、cross、delCatalogEntry、delViewerPreference、doForm、drawAlignedString、drawBoundary、drawCentredString、drawImage、drawInlineImage、drawPath、drawRightString、drawString、drawText、ellipse、endForm、freeTextAnnotation、getAvailableFonts、getCatalogEntry、getCurrentPageContent、getPageNumber、getViewerPreference、getpdfdata、grid、hasForm、highlightAnnotation、imageCaching、init_graphics_state、inkAnnotation、inkAnnotation0、line、linearGradient、lines、linkAbsolute、linkRect、linkURL、listLoadedFonts0、pageHasData、pop_state_stack、push_state_stack、radialGradient、rect、resetTransforms、restoreState、rotate、roundRect、save、saveState、scale、setArtBox、setAuthor、setBleedBox、setCatalogEntry、setCreator、setCropBox、setDash、setDateFormatter、setEncrypt、setFillAlpha、setFillColor、setFillColorCMYK、setFillColorRGB、setFillGray、setFillOverprint、setFont、setFontSize、setKeywords、setLineCap、setLineJoin、setLineWidth、setMiterLimit、setOutlineNames0、setOverprintMask、setPageCallBack、setPageCompression、setPageDuration、setPageRotation、setPageSize、setPageTransition、setProducer、setStrokeAlpha、setStrokeColor、setStrokeColorCMYK、setStrokeColorRGB、setStrokeGray、setStrokeOverprint、setSubject、setTitle、setTrimBox、setViewerPreference、shade、showFullScreen0、showOutline、showPage、skew、state_stack、stringWidth、textAnnotation、textAnnotation0、transform、translate、wedge。

通过这些方法,我们可以在画布上绘制复杂的PDF文档。

使用setPageSize方法设置页面大小。

>>> c.setPageSize((1200,800))

页面大小也可以在初始化Canvas对象的时候,通过代入.pagesize进行设置。

使用setFont方法设置字体。

>>> c.setFont('Helvetica',200)

设置后,我们可以看到属性值发生了变化。

>>> c._pagesize, c._fontname,c._fontsize
((1200, 800), 'Helvetica', 200)

使用drawString方法在画布上书写,参数包括起点坐标和文本内容。PDF文档中的每个元素都和位置相关,所以绘制元素时必须指定坐标。画布上的每个点都可以用坐标(x,y)表示,原点(0,0)在左下角,向右移动增加x值,向上移动增加y值。

>>> c.drawString(50, 400, 'Hello,World!')

画布画完后,使用showPage方法关闭当前页并翻页,继续绘制下一页。

>>> c.showPage()

本例只有一页,直接保存文件,结束任务。

>>> c.save()

用PDF阅读器或者文本编辑器打开PDF文档,可以看到和8.1.1节的PDF文档是一样的。

我们可以解析PDF文档。

>>> import re
>>> from reportlab.lib.utils import import_zlib as z_pdf
>>> from reportlab.lib.rl_accel import asciiBase85Decode as abd_pdf
>>> pdf=open('H:\\示例\\第8章\\HelloWorld.pdf', 'rb').read()
>>> stream=re.compile(b'.*?FlateDecode.*?stream(.*?)endstream', re.S)
>>> [z_pdf().decompress(abd_pdf(s.strip(b'\\r\\n'))) for s in re.findall(stream,pdf)]
 [b'1 0 0 1 0 0 cm  BT /F1 12 Tf 14.4 TL ET\\nBT /F1 200 Tf 240 TL ET\\nBT 1 0 0 1 50 400 Tm (Hello,World!) Tj T* ET\\n \\n']

作画之前还可以设置画笔的状态,例如颜色、线条的宽度(_lineWidth)、写字用的字体(_fontname、_fontsize)等。前面我们设置了英文字体,由于reportlab包不带中文字体,需要通过官方渠道下载字体文件(下面用到微软雅黑msyh.ttf),放到reportlab安装包下面的font文件夹中,如图8-5所示。

要注意的是,字体使用之前还需要注册。

>>> from reportlab.pdfbase.ttfonts import TTFont
>>> from reportlab.pdfbase import pdfmetrics
>>> pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))

图8-5

对页面大小的修改在翻页以后仍然有效,但是字体的设置只在本页有效。

>>> c.setPageSize((1200,800))
>>> c.setFont('Helvetica',200)
>>> c.showPage()
>>> c._pagesize, c._fontname,c._fontsize
((1200, 800), 'Helvetica', 12)

也就是说,每次翻页,字体都恢复到最初状态。最初的字体状态是由类实例化时传入的数值控制的。

>>> c._initialFontName,c._initialFontSize
('Helvetica', 12)

类实例化时调用了init_graphics_state方法,初始化了画笔状态,包括字体、颜色、字符间距、线条宽度等。showPage方法调用了_startPage方法,后者又调用了init_graphics_state方法,最终将字体恢复到最初状态(_initialFontName、_initialFontSize)。

如果我们需要在同一页面多次设置画笔状态,可以使用saveState和restoreState方法保存和还原画笔状态。

下面以字体设置为例。

>>> c.setFont('Courier',100)
>>> c.saveState()
>>> c._pagesize, c._fontname,c._fontsize
((1200, 800), 'Courier', 100)
>>> c.setFont('Helvetica',300)

使用restoreState方法可以将画笔恢复到上次使用saveState方法保存的状态。

>>> c.restoreState()
>>> c._pagesize, c._fontname,c._fontsize
((1200, 800), 'Courier', 100)

案例:制作精美的封面

下面我们多次设置画笔状态,书写汉字,并绘制线条和图形。

   from reportlab.pdfgen import canvas
   from reportlab.lib.pagesizes import landscape, letter
   from reportlab.pdfbase.ttfonts import TTFont
   from reportlab.pdfbase import pdfmetrics
   from reportlab.lib.colors import pink, black, red, blue, green
⓿ pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))
   c=canvas.Canvas(r'H:\\示例\\第8章\\report.pdf')
❶ c.setPageSize((1200,800))
   c.drawImage(r'H:\\示例\\第8章\\background.png',0,500,1200,300)
   c.drawImage(r'H:\\示例\\第8章\\logo.png',0,800-72,190,72)
❷ c.setFont('微软雅黑',50)
   c.drawCentredString(600, 400,'2020年汽车金融专题研究报告')
   c.setFont('微软雅黑',30)
   c.drawCentredString(600, 300, '南山研究院 分析师 金融哥')
   c.setFont('微软雅黑',20)
   c.drawString(50, 120, '因 / 为 / 专 / 注 / 所 / 以 / 专 / 业')
   c.setFont('微软雅黑',30)
   c.drawRightString(1150, 120, '2020年3月')
❸ c.setLineWidth(10)
   c.line(0, 100,1200 ,100 )
   c.setFont('微软雅黑',15)
   c.drawString(50, 80, '本产品保密并受到版权法保护')
   c.drawRightString(1150, 80, 'Confidential and Protected by Copyright Laws')
❹ c.setFillColor(red)
   c.rect(800, 500, 1200, 20, stroke=0, fill=1)
❺ c.setFillGray(0.75)
   c.setFillAlpha(0.3)
   c.rect(0, 500, 800, 20, stroke=0, fill=1)
   c.showPage()
   c.save()

语句⓿注册中文字体微软雅黑;语句❶设置画布大小;语句❷设置书写要用到的字体;语句❸设置画笔线条宽度;语句❹设置图形填充色;语句❺设置矩形的灰度。还用了drawImage方法添加图片,用rect方法绘制矩形,图片和矩形的参数均要指定起始坐标、宽度和高度,另外图片还要指定文件路径。打开生成的PDF文档,效果如图8-6所示。

图8-6

如果一个PDF文档有多页,每页都有固定的元素,每页都重复绘制的话,代码量就比较大,因此可以将固定部分的制作代码放入循环。

使用Canvas类的doForm、beginForm、endForm方法也可以达到同样的效果。

   from reportlab.pdfgen import canvas
   from reportlab.pdfbase.ttfonts import TTFont
   from reportlab.pdfbase import pdfmetrics
   pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))
   c=canvas.Canvas(r'H:\\示例\\第8章\\mydoc_form.pdf')
   c.setPageSize((1200,800))
⓿ c.beginForm('LOGO')
   c.drawImage(r'H:\\示例\\第8章\\logo.png',0,800-72,190,72)
❶ c.endForm()
   list=['2020年汽车金融专题研究报告','2020年消费金融专题研究报告',         
   '2020年融资租赁专题研究报告','2020年汽车销售专题研究报告']
   for item in list:
❷     c.doForm('LOGO')
       c.setFont('微软雅黑',80)
       c.drawCentredString(600, 400,item)
       c.showPage()
   c.save()

语句⓿创建form,并将其命名为LOGO;语句❶结束并保持form;语句⓿和❶之间的代码绘制封面的固定内容,通过循环和语句❷,完成文字的书写。打开生成的PDF文档,效果如图8-7所示。

图8-7

在以上例子中,我们用drawString、line、rect方法可以书写不同类型的内容。但是这种“画图”的方式非常低端,始终离不开坐标,如果我们要写入一大段文字,则需要计算每一行能放多少字,并不断调整坐标。由于所有的文字都是图画点,也就没有“自动换行”的功能。

pdfgen目录里面的模块还有很多,都只能进行比较底层的操作。如果要制作更复杂的内容,就要用到页面布局(platypus)。

2.添加段落、表格与图表

要想提升效率,就要减少重复劳动,多用模板和样式。在reportlab包中,platypus目录里的模块就是用来实现各种样式、版式的。platypus是“Page Layout and Typography Using Scripts”的缩写,它致力于把文档的样式和内容分开,段落、表格都直接套用相应的格式,页面也可以套用页面模版。

platypus包括几个层面:文档模板(DocTemplate)、页面模板(PageTemplate)、页面框架(Frame)、页面元素(flowables)。一个文档可以有多个页面模板,一个页面可以有多个框架,一个框架里可以放很多元素。

flowables,即可流动的元素,这是一个形象的比喻。最常见的页面元素就是段落,同样一段文字,随着框架大小的变化,可以被拆分来适应框架,每行字符不固定,其占据的行数也会发生变化。此外,表格、空白(Spacer)、分页符(PageBreak)、图片(Image)都是flowables。图片无法拆分,当框架太小时,它将移动到下一个框架,所以这些元素和坐标系就没有了联系,我们排版布局时,就不用考虑元素的坐标。只需要选择合适的文档和页面模板,设计不同的框架容器,然后依次放入页面元素,即可生成一个PDF文档。

(1)段落

制作段落需要用platypus子目录中paragraph模块的Paragraph类,其语法如下。

Paragraph(text, style, bulletText=None, caseSensitive=1)

它可以将文字和样式生成PDF文档中的段落。

参数text表示各个段落的文本内容。

>>> txt_0='什么是汽车金融?'
>>> txt_1='''汽车金融是汽车全产业链覆盖的资本流动。狭义的汽车金融隶属于消费金融,广义的汽车金融贯穿全产业链。汽车金融的概念最早源于美国,狭义的汽车金融,更多地关注汽车销售环节,为下游客户提供融资性金融服务,隶属于消费金融。广义的汽车金融,是贯穿汽车的生产、流通、销售、使用、回收等环节中的资金流动,提高资本利用率和资金周转率。'''
>>> txt_2='''我国汽车消费金融业萌芽于商业银行贷款,后经政策放宽,形成汽车金融公司、汽车融资租赁公司、互联网汽车金融公司等多元主体并存的局面。'''
>>> txt_3='''中国汽车消费金融渗透率与海外成熟市场差距很大。汽车金融的渗透率,指通过贷款、融资等金融方式购买的车辆数量与汽车销量之比。中国汽车消费金融渗透率一直处于较低水平。'''

参数style表示段落样式。调用lib子目录中styles模块的getSampleStyleSheet函数。

>>> from reportlab.lib.styles import getSampleStyleSheet
>>> s=getSampleStyleSheet()
>>> s
<reportlab.lib.styles.StyleSheet1 object at 0x0000000002BBDDD8>

返回的是样式表StyleSheet1对象,它里面有一些基本的样式可供我们直接使用。用dir函数查看对象的属性和方法,主要包括:add、byAlias、byName、get、has_key、list。

使用list方法输出全部样式的样式设置。

>>> s.list()

其中,Normal、Title样式的主要默认属性说明见表8-1。

表8-1

属性

说明

Normal

Title

name

样式名称

Normal

Title

parent

父对象

None

<'Normal'>

alignment

文字对齐

0

1

allowOrphans

页底段落最小行数

0

0

allowWidows

页顶段落最小行数

1

1

backColor

背景颜色

None

None

borderColor

边框颜色

None

None

borderPadding

内容与边距的距离

0

0

borderRadius

圆角的边框

None

None

borderWidth

边框宽度

0

0

firstLineIndent

首行缩进

0

0

fontName

字体名称

Helvetica

Helvetica-Bold

fontSize

字体大小

10

18

leading

行距

12

22

leftIndent

左缩进

0

0

rightIndent

右缩进

0

0

spaceAfter

段后间隔

0

6

spaceBefore

段前间隔

0

0

textColor

文字颜色

Color(0,0,0,1)

Color(0,0,0,1)

wordWrap

单词中换行

None

None

可以修改样式的默认属性值。

>>> from reportlab.pdfbase.ttfonts import TTFont
>>> from reportlab.pdfbase import pdfmetrics
>>> pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))
>>> s['Title'].fontName,s['Title'].fontSize='微软雅黑' ,30
>>> s['Title'].spaceAfter,s['Normal'].spaceBefore=30,10
>>> s['Normal'].fontName,s['Normal'].fontSize='微软雅黑',20
>>> s['Normal'].leading=30
>>> s['Normal'].firstLineIndent=40

下面生成段落。

由于platypus子目录中的__init__.py中有语句“from .paragraph import *”,所以可以直接调用Paragraph类。

>>> from reportlab.platypus import Paragraph

代入文本和样式参数,生成第1个段落对象。

>>> p_0=Paragraph(txt_0,s['Title'])
>>> type(p_0)
<class 'reportlab.platypus.paragraph.Paragraph'>
>>> p_1=Paragraph(txt_1,s['Normal'])
>>> p_2=Paragraph(txt_2,s['Normal'])
>>> p_3=Paragraph(txt_3,s['Normal'])

使用platypus目录中doctemplate模块的SimpleDocTemplate类。

>>> from reportlab.platypus import SimpleDocTemplate
>>> doc=SimpleDocTemplate(r'H:\\示例\\第8章\\mydoc.pdf',pagesize=(1200,800))
>>> doc
<reportlab.platypus.doctemplate.SimpleDocTemplate object at 0x0000000004A6DDD8>

使用SimpleDocTemplate对象的build方法,它可以将页面元素放入文档,生成最终的PDF文档。

build(self,flowables,onFirstPage=_doNothing, onLaterPages=_doNothing, canvasmaker=canvas.Canvas)

build方法必要的参数是页面元素,段落就是一种页面元素,但是要将其转为列表,才能作为build方法的参数。

>>> story_text=[p_0,p_1,p_2,p_3]
>>> type(story_text)
<class 'list'>

代入参数,生成文件。

>>> doc.build(story_text)

打开生成的PDF文档,效果如图8-8所示。

除了修改样式,我们还可以使用add(style, alias=None)方法添加样式。

>>> from reportlab.lib.styles import ParagraphStyle
>>> s_par=ParagraphStyle(name='A1',fontName='微软雅黑',fontSize=40,firstLineIndent=0)
>>> s_par
<ParagraphStyle 'A1'>
>>> s.add(s_par)
>>> p=Paragraph('微软雅黑40号字体',s['A1'])

图8-8

(2)表格

一般来说,PDF文档中的表格和图表都是通过Excel表格生成,再以图片的形式插入PDF文档中,但是这种图像在放大以后就会变得很模糊,下面尝试直接在PDF文档中绘制表格和图表。

和段落一样,表格也是一种页面元素。

下面需要用platypus子目录中tables模块的Table类制作表格,其语法如下。

Table(data,colWidths=None,rowHeights=None,style=None,repeatRows=0,repeatCols=0,splitByRow=1,emptyTableAction=None,ident=None,hAlign=None,vAlign=None,normalizedData=0,cellStyles=None,rowSplitRange=None, spaceBefore=None,spaceAfter=None,longTableOptimize=None,minRowHeights=None)

数据源data是必须指定的,它是一个二维数组,和要显示的表的每一行、每一列对应。其余的都是可选参数,常用的包括前3个。参数colWidths是一个列表,表示各列的宽度,例如col_widths=[100,50, 50]表示第1列宽100,第2、3列宽50;参数rowHeights表示行高,其设置方法与列宽类似,如果不设置这两个参数,列宽和行高就会变成自适应;参数style表示表格的样式,具体使用TableStyle对象来逐个项目逐个单元格地设置。

首先,构造表格数据参数。

>>> data=[['姓名','一季度','二季度','三季度','四季度'],
...['小赵',100,110,125,135], ['小钱',110,114,126,123],
...['小孙',120,115,127,141],['小李',130,117,128,165],
...['小王',120,127,122,125]]

其次,构造表格列宽、行高参数。

>>> col_widths, row_heights=[80,100,100,100,100],[60,50,50,50,50,50]

然后,构造表格样式参数。调用platypus子目录中Table模块的TableStyle类。

>>> from reportlab.platypus import TableStyle
>>> from reportlab.lib import colors
>>> from reportlab.pdfbase.ttfonts import TTFont
>>> from reportlab.pdfbase import pdfmetrics
>>> pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))
>>> table_style=TableStyle([
...         ('FONT', (0, 0), (0, -1), '微软雅黑', 30),
...         ('FONT', (0, 0), (-1, 0), '微软雅黑', 30),
...         ('FONT', (1, 1), (-1, -1), '微软雅黑', 15),
...         ('ALIGN', (0, 0), (-1, -1), 'CENTER'),
...         ('VALIGN', (0, 0), (-1, -1), 'MIDDLE'),
...         ('GRID', (0,0), (-1,-1), 0.5, colors.black),
...         ('INNERGRID', (0,0), (-1,-1), 0.25, colors.black),
...         ('BOX', (0,0), (-1,-1), 0.25, colors.black),
...         ('BACKGROUND',(0,0),(-1,-1),colors.white)])

设置表格样式的语法比较特殊,它使用“属性,左上角,右下角,属性值”,表示对某个单元格区域设置属性。0表示第一行或者第一列,−1表示最后一行或最后一列。例如(0, 0)表示左上角单元格,(−1, −1)表示右下角单元格,围起来的区域就是整个表格。

有了全部参数,下面使用Table类实例化一个表格。

>>> from reportlab.platypus import Table
>>> 
table=Table(data,colWidths=col_widths,rowHeights=row_heights,style=table_style)
>>> type(table)
<class 'reportlab.platypus.tables.Table'>

给表格增加一个标题。

>>> tabletitle='''<para alignment=center fontName='微软雅黑' fontSize=20 spaceAfter=30>表1: 销售情况表</para>'''
>>> from reportlab.lib.styles import getSampleStyleSheet
>>> styles=getSampleStyleSheet()
>>> from reportlab.platypus import Paragraph

一起放入列表。

>>> story_table=[Paragraph(tabletitle,styles['Normal']),table]

调用SimpleDocTemplate类的build方法,生成PDF文档。

>>> from reportlab.platypus import SimpleDocTemplate
>>> doc=SimpleDocTemplate(r'H:\\示例\\第8章\\mydoc_table.pdf',pagesize=(1200,800))
>>> doc.build(story_table)

打开生成的PDF文档,效果如图8-9所示。

(3)图表

在PDF文档中添加各种图形,需要用到graphics子目录中的各个模块。下面尝试直接在PDF文档中绘制图表。

调用shapes模块的Drawing类。

>>> from reportlab.graphics.shapes import Drawing

实例化Drawing类,指定绘图区的宽、高。

>>> d=Drawing(100, 100)
>>> d
<reportlab.graphics.shapes.Drawing object at 0x00000000051A2518>

获得一个绘图区Drawing对象,用dir函数查看对象的属性和方法,主要包括:add、asDrawing、asGroup、asString、background、contents、copy、draw、drawOn、dumpProperties、expandUserNodes、getBounds、getContents、getKeepWithNext、getProperties、getSpaceAfter、getSpaceBefore、hAlign、height、identity、insert、isIndexing、minWidth、renderScale、resized、rotate、save、scale、setProperties、shift', 'skew、split、splitOn、transform、translate、vAlign、verify、width、wrap、wrapOn。

图8-9

有了绘图区,下一步就是绘制条形图。

绘制条形图需要使用barcharts模块中的VerticalBarChart类。

>>> from reportlab.graphics.charts.barcharts import VerticalBarChart
>>> bar=VerticalBarChart()
>>> bar
<reportlab.graphics.charts.barcharts.VerticalBarChart object at 0x00000000051A23C8>

获得一个垂直条形图VerticalBarChart对象,用dir函数查看对象的属性和方法,主要包括:background、barLabelArray、barLabelFormat、barLabels、barSpacing、barWidth、bars、calcBarPositions、categoryAxis、categoryNALabel、data、debug、demo、draw、dumpProperties、fillColor、getBounds、getProperties、getSeriesName、getSeriesOrder、groupSpacing、height、makeBackground、makeBars、makeSwatchSample、naLabel、provideNode、reversePlotOrder、setProperties、strokeColor、strokeWidth、useAbsolute、valueAxis、verify、width、x、y、zIndexOverrides。

下面设置对象的各种属性。

>>> bar.x,bar.y,bar.height,bar.width,bar.valueAxis.valueMin=50,-150,280,500,0
>>> bar.categoryAxis.categoryNames=['2012','2013','2014','2015','2016']
>>> bar.data=[[16, 17, 18, 24, 25]]
>>> bar.bars[0].fillColor,bar.barLabels.nudge=colors.black,18
>>> bar.barLabelFormat,bar.valueAxis.labels.fontSize='%0.0f',20
>>> bar.categoryAxis.labels.fontSize,bar.barLabels.fontSize=20,30

通过Drawing对象的add方法将条形图放入绘图区。

>>> d.add(bar)

下面在绘图区中添加一个标题。

>>> from reportlab.graphics.charts.textlabels import Label
>>> title=Label()
>>> title.setText('图1: 汽车金融公司数量')
>>> title.fontSize,title.fontName,title.dx,title.dy=20,'微软雅黑',260,160
>>> d.add(title)

将绘图区放入列表,为了防止太靠近顶端,在绘图区上方添加空格。

>>> from reportlab.platypus import Spacer
>>> story_chart=[Spacer(1,75),d]

调用SimpleDocTemplate类的build方法,生成PDF文档。

>>> from reportlab.platypus import SimpleDocTemplate
>>> doc=SimpleDocTemplate(r'H:\\示例\\第8章\\mydoc_chart.pdf',pagesize=(1200,800))
>>> doc.build(story_chart)

打开生成的PDF文档,效果如图8-10所示。

图8-10

本例中的图表是矢量化的图表,即使放大也不会变模糊。

绘图区的保存方式有多种。

>>> from reportlab.pdfgen import canvas
>>> my_canvas=canvas.Canvas(r'H:\\示例\\第8章\\mydoc_chart.pdf', pagesize=(1200,800))
>>> d.drawOn(my_canvas, 100, 100)
>>> my_canvas.save()

或者以下方式。

>>> d.save(formats=['pdf'],fnRoot=r'H:\\示例\\第8章\\mydoc_chart')

或者以下方式。

>>> from reportlab.graphics import renderPDF
>>> renderPDF.drawToFile(d,r'H:\\示例\\第8章\\mydoc_chart.pdf',autoSize=0)

3.页面布局设计

单个的段落、表格、图表都容易实现,但有时候我们需要将其混排在一起。前面提到的段落、表格、图表都属于Flowable对象,其位置和坐标没关系,是可以变化的,那么如何才能准确地排版呢?那就需要把它们放置在固定的区域内。使用框架可以将复杂的PDF页面分为不同的区域,用来放置文字、表格、图表等内容。

导入框架类Frame。

>>> from reportlab.platypus import Frame

查看Frame类的帮助信息。

>>> help(Frame)

在帮助文档中可以查到Frame类的实例化参数。

class Frame(builtins.object)
Frame(x1, y1, width,height, leftPadding=6, bottomPadding=6, rightPadding=6, topPadding=6, id=None, showBoundary=0)

Frame的外观示意图如图8-11所示。

图8-11

Frame主要用于界定了画布上可以放元素的区域。我们看到Frame的左下角的坐标为(x1,y1),该坐标相对于使用时的画布;尺寸为width×height;Padding是指定边距,扣除边距剩下的就是可供绘图的空间;参数id表示识别符;参数showBoundary表示边界线。

下面将页面分为3个区域,分别放入文字、图表、表格。

>>> f1=Frame(0, 0, 600, 400, showBoundary=1, id='f1')
>>> f2=Frame(600, 0, 600, 400, showBoundary=1, id='f2')
>>> f3=Frame(0, 400, 1200, 400, showBoundary=1, id='f3')
>>> f3
<reportlab.platypus.frames.Frame object at 0x0000000004F86208>

用dir函数查看Frame对象的方法和属性,主要包括:add、addFromList、add_generated_content、drawBoundary、id、showBoundary、split。

可以通过设置showBoundary=0不显示框架的线条,这样既可以对齐内容,又不会显得页面太乱,即使是复杂的版式也显得井井有条。

有了框架,我们就再也不用担心画布上的元素无法对齐了。下面创建一个画布。

>>> from reportlab.pdfgen.canvas import Canvas
>>> c=Canvas(r'H:\\示例\\第8章\\mydoc_Frame.pdf')
>>> c.setPageSize((1200,800))

使用Frame对象的addFromList(drawlist, canv)方法,可以将元素列表(包含flowables的list)按照框架规定的位置放到画布上面。story_chart、story_table、story_text的制作过程前面已经介绍过,此处不再赘述。

>>> f1.addFromList(story_chart,c)
>>> f2.addFromList(story_table,c)
>>> f3.addFromList(story_text,c)
>>> c.save()

打开生成的PDF文档,效果如图8-12所示。

图8-12

有时候我们需要在每一页都添加固定的内容,如公司Logo、页码等信息,这时就要用到页眉和页脚。页眉和页脚应当是自动化生成的,在前面调用doForm方法的案例中,我们插入的logo不是页眉,因为下一页的logo还要手动插入,而无法自动生成。

前面我们用到的build方法,还有两个参数onFirstPage和onLaterPages,用于指定在首页的操作和在后面所有页的操作。

我们看一个例子。

from reportlab.platypus import SimpleDocTemplate, Paragraph,PageBreak, Spacer
from reportlab.lib.styles import getSampleStyleSheet
from reportlab.pdfbase.ttfonts import TTFont
from reportlab.pdfbase import pdfmetrics
pdfmetrics.registerFont(TTFont('微软雅黑', 'msyh.ttf'))
def header_footer(c, doc):
    c.drawImage(r'H:\\示例\\第8章\\logo.png',1200-190,800-72,190,72)
    c.setFont('微软雅黑',20)
    c.drawString(50, 60, '因 / 为 / 专 / 注 / 所 / 以 / 专 / 业')
    c.setLineWidth(3)
    c.line(0, 50,1200 ,50 )
    c.line(0, 800-75,1200 ,800-75 )
    c.setFont('微软雅黑',20)
    c.drawString(50, 30, '本产品保密并受到版权法保护')
    c.drawRightString(1150, 30, 'Confidential and Protected by Copyright Laws')
    page_num=c.getPageNumber()
    c.setFont('微软雅黑',30)
    text='第 %s页' % page_num
    c.drawRightString(580,20, text)
    c.setFont('微软雅黑',50)
    c.rotate(30)
    c.setFillAlpha(0.2)
    c.drawString(600, 0, '版权所有 南山金融研究')
    c.rotate(-30)
myPDF=SimpleDocTemplate(r'H:\\示例\\第8章\\mydoc.pdf',pagesize=(1200,800))
story=[]
list=['2020年汽车金融专题研究报告','2020年消费金融专题研究报告',         
      '2020年融资租赁专题研究报告','2020年汽车销售专题研究报告']
styles=getSampleStyleSheet()
styles['Normal'].fontName='微软雅黑' 
styles['Normal'].fontSize=40
for item in list:
    story.append(Spacer(1,200))
    story.append(Paragraph(item, styles['Normal']))
    story.append(PageBreak())
myPDF.build(story, onFirstPage=header_footer, onLaterPages=header_footer)

函数header_footer定义了制作页眉和页脚的操作,build方法的参数传入了函数名header_footer,即onFirstPage=header_footer、onLaterPages=header_footer,表示每一页都会自动完成添加页眉和页脚的操作。

打开生成的PDF文档,效果如图8-13所示。

图8-13

本例还实现了在新建文件中添加水印的效果,给已有的文件添加水印,将用其他库来实现。当然,这种水印也很容易去除。还可以将PDF文档的页面转换成图片,然后在图片上加水印,最后将加完水印的图片组合生成PDF文档,这样的水印就难以去除了。

本文截选自《学Python 不加班 轻松实现办公自动化

这是一本关于如何利用Python提高日常办公效率的书,书中凝聚了作者多年的实践经验和独特思考,旨在帮助读者准确、高效地完成大量高重复度的工作。

《学Python,不加班:轻松实现办公自动化》汇集了日常办公和处理文档时常见的问题,通过实例的演示与讲解,帮助读者灵活有效地使用Python处理工作中遇到的问题。全书共11章,涵盖Python的各种应用场景,具体包括文件管理自动化,网络信息自动获取,TXT、XLS/XLSX、DOC/DOCX、PPT、PDF、图片文件的自动化处理,模拟鼠标、键盘操控本地软件,自动化运行管理等。本书力图淡化编程中的抽象概念,贴合工作场景,注重实战效果,通过对Python技术的巧妙讲解,帮助读者成为高效率的办公室“超人”。

《学Python,不加班:轻松实现办公自动化》适合任何想要学习Python编程的读者,尤其适合缺乏编程经验的初学者。同时本书提供所有案例的源代码文件,方便读者边学边练,爱上Python编程。

以上是关于学Python,用Python自动创建PDF文档,实现办公自动化的主要内容,如果未能解决你的问题,请参考以下文章

学python如何办公自动化?学这些就够了

python自动化之PDF

办公自动化:用 Python 玩转 PDF 真的很香

办公自动化:Python-win32com自动将word文档转换成pdf格式!

python 用循环创建多个文件

4办公自动化Python实现Word转PDF