微信读书这样排版，看过的人都很难忘！

Posted 2022-08-07 腾讯云开发者

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了微信读书这样排版，看过的人都很难忘！相关的知识，希望对你有一定的参考价值。

欢迎大家前往腾讯云+社区，获取更多腾讯海量技术实践干货哦~

本文由刘笑江发表于云+社区专栏

在微信读书 App 中，排版引擎负责解析 EPUB 或 TXT 格式的书籍源文件，将排版后的书籍内容如文字、图像、注解等元素渲染至屏幕上，是最常用、最复杂的组件之一。

而开发同学对排版引擎的日常修改，可能影响了海量书籍的排版结果。对排版引擎代码变更的测试，往往耗时多、难度大、容易漏测。本文介绍了为解决测试的难题，如何逐步将人工测试步骤自动化，最终构建了一套微信读书排版引擎自动化测试流程，以确保微信读书排版引擎的质量。

一.背景

1.排版引擎日常修改

为了获得极致的阅读体验，产品同学经常会提出细致的排版需求，交给开发同学修改。而排版引擎的修改，往往牵一发动全身，可能导致书城上万本书籍排版结果受影响。

举个例子，有个需求是增加正文段落的 margin：

再举个极端的例子，有个需求要把章节标题往右移动1个像素：

那么，如何确保微信读书的排版质量？最开始，我们用人工测试的方法来确保质量。

2.人工测试方法

当开发按需求修改排版引擎、自测后，会把代码提交到 svn，然后交给测试同学进行测试。

测试同学使用持续集成工具编译打包，得到排版引擎修改后的 App 安装包；然后在两台设备安装排版引擎修改前、后两个版本的 App，同时打开需要测试的书籍，翻页，对比，通过肉眼观察排版差异是否符合预期。

人工测试方法比较耗时，需要打开每本书，一页一页地翻页、对比，而且无法覆盖很多书籍，存在漏测的风险。

另外，通过人眼检查两台设备上的排版结果有没有差异，是很困难的任务，一是容易疲惫导致判断失误，二是对细致的排版变更（如第二个例子）很难判断是否符合预期。

为什么需要自动化测试？

前面提到，人工测试费时耗力，且容易漏测。

此外，排版需求的特点是细节多、变更快，且修改影响范围大，全网书籍上万本，无法一一验证。一旦出错，直接影响口碑。这些因素都增加了人工测试的工作量和压力。

除了精细化的排版需求会对排版引擎代码做修改，在日常的维护中，也会重构排版引擎、修改排版引擎相关但不影响排版结果的代码。每次重构、修改后，也会交给测试同学验证此次修改对排版结果没有影响。由于人工测试比较耗时、无法一一验证，每次重构排版引擎代码压力很大，轻易不敢改动。

还有一种情况，是在开发其他需求、修复缺陷时，意外地导致排版结果受影响。这种错误一旦发布到现网，后果很严重。

所以，把人工测试流程自动化十分有必要。自动化以后，可以大大减少人工测试的时间，同时方便开发同学自测。开发同学对排版引擎也可以大胆重构、持续改进代码质量。最终，达到确保排版引擎质量的目的。

二.如何自动化测试？

首先，我们要分析一下，在人工测试中，主要有哪些步骤？每个步骤是否能自动化？

在人工测试中，对每次变更的测试，有步骤如下：

需要把变更前、变更后的 App 包安装到两台设备
打开 App，登录，把要测试的书购买、加入到书架
打开要测试的书，设置排版偏好，翻页，用眼睛查看屏幕上的排版结果，对比屏幕中的排版结果是否有差异
如果有差异，根据需求判断差异是否符合预期

其中步骤 1、2 利用自动化测试工具是比较容易完成的。步骤 3 借助算法能够使其自动化，会在后面详细展开。步骤 4 自动化的难度比较大，可能需要借助非常高阶的人工智能完成，我们把这个步骤交给测试和开发同学。

那么，如何完成步骤 3 的自动化，让机器做人类的事情呢？我们把它再细分成三个步骤：

1. 获取排版结果的数据表示

首先，需要找到一种机器能读懂的数据表示，这种数据表示要既能够表示排版的结果、反映代码的修改，也能够通过算法来对比，对比的结果要便于可视化的展示，方便开发、测试同学判断差异是否符合预期。

我们的选择有：

NSAttributedString，是从 EPUB、TXT 处理后得到的中间数据，包括文字和排版样式。这种数据结构比较抽象，没有一种很好的差异计算方法、和差异结果可视化方法。
阅读器屏幕截图，位图格式，借助各种成熟的数字图像处理算法，容易计算差异

考虑到 2 容易计算差异，可视化输出效果较好，我们选取阅读器屏幕截图作为数据表示。

2. 对比图像差异

选择了图像作为排版结果的数据表示，那么如何对比图像差异呢？

首先，我们要选取图像特征，然后才能对比图片差异。图像的特征，从视觉认知概念上，有低、中、高级特征：

低级特征：如像素域、频率域、ImageHash
中级特征：如 sobel 边缘特征
高级特征：抽象视觉概念，比如从 CNN 算法训练得到的标签，如车、枪、球

这里我们希望每个像素的差异都能检测到，所以选取像灰度化处理过的图像矩阵作为特征。

有了特征后，我们需要定义差异，就是两个灰度图像矩阵的距离函数，如：

L0，表示两个灰度图像矩阵之间，不一致的像素点的个数
L1，曼哈顿距离或棋盘距离，不一致像素点差值的绝对值之和
L2，不一致像素点差值的平方和

我们关心有多少像素点不一致，所以我们这里取 L0距离，即两个图像有多少个像素点不一样，作为差异衡量的指标。

当距离大于10时，我们认为这一页的排版结果有差异，把它可视化输出，给开发或者测试同学作为参考。

3. 可视化输出

检测到差异后，我们把两个图像矩阵灰度化后相减，得到一个新的矩阵，把它归一化得到差异图像，如右图所示：

三.通过 scheme 生成排版结果

人工测试步骤 2、3 的书籍购买、加入书架、打开书籍、翻页、截图等任务，可以利用 Instrument UI Automation 自动测试脚本来模拟人工点击来完成任务。

但是考虑到 Automation 模拟翻页、截图速度慢，且 UI 变更频繁导致 Automation 脚本后续维护麻烦等问题，所以我们通过提供一个测试 scheme 接口来完成这个任务。

在 App 设置彩蛋的『执行 Scheme 页面』中，输入 scheme 并执行后，App 会在后台对指定书籍购买、加入书架、排版、生成排版结果截图，并把结果保存在本地磁盘。用户也可以选择 AirDrop 到 Mac 上。

运行scheme

scheme 格式如下：

weread://typeset?books=三体,乔布斯传,失控,1984,乌兰拖拉机简史&indent=1&fontSize=2&font=2&theme=3&folder=f1223
  输出排版结果到目录/Libary/[vid]/[folder]/[bookId].zip
  @param books 需要排版的书单
  @param indent 0首行不缩进 1首行缩进，默认0
  @param fontSize  1,2,3,4,5,6,7 字体大小，默认4
  @param font 字体  1系统字体 2 3 4 为对应选项字体，默认1
  @param bgcolor 背景颜色 1白 2黄 3绿色 4夜间，默认1
  @param folder 输出文件夹名，默认"cropImage"