pdf转word出现很多换行符将一整行切断
Posted taoyuanming
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pdf转word出现很多换行符将一整行切断相关的知识,希望对你有一定的参考价值。
一般手工判断是否是一行,主要依据是行尾是否由“句号+换行符”组成, 而pdf转换成word多出的换行符,通常不带句号
因此,使用以下三步搞定:
1)使用文档中未出现过的特殊字符(如“&&&&&&”)替换文章中的“句号+换行符”
2)使用空格替换文章中多余的换行符
3)使用“句号+换行符” 替换 特殊字符(如“&&&&&&”)
注意:
1) ^p匹配换行符
2)文中截图中 “. ”匹配的是英文状态下的句号,如果是中文句号结尾,则应写成 “。”
3)特殊字符的选择原则是:文章中未出现过
以上是关于pdf转word出现很多换行符将一整行切断的主要内容,如果未能解决你的问题,请参考以下文章
PHPWord解决Word转PDF可能出现的空白页问题 | 插入换行符分页符定义文档网络时对齐网格