html 纯文本PDF与pdf.js

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了html 纯文本PDF与pdf.js相关的知识,希望对你有一定的参考价值。

<!doctype html>
<html>
<head>
	<script src="http://ajax.googleapis.com/ajax/libs/jquery/1.10.2/jquery.min.js"></script>
	<script src="http://mozilla.github.io/pdf.js/build/pdf.js"></script>
	<script>

		function pdfToPlainText(pdfData) {
			PDFJS.disableWorker = true;
			var pdf = PDFJS.getDocument(pdfData);
			pdf.then(getPages);
		}

		function getPages(pdf) {
			for (var i = 0; i < pdf.numPages; i++) {
				pdf.getPage(i + 1).then(getPageText);
			}
		}

		function getPageText(page) {
			page.getTextContent().then(function(textContent) {
				textContent.forEach(function(o) {
					$("#pdf").append(o.str + '</br>');
				});
			});
		}

	</script>
</head>
<body onload="pdfToPlainText('TestDocument.pdf')">
	<h1>Plain Text PDF with pdf.js</h1>
	</br>
	<div id="pdf"></div>
</body>
</html>

以上是关于html 纯文本PDF与pdf.js的主要内容,如果未能解决你的问题,请参考以下文章

PDF.js实现个性化PDF渲染(文本复制)

PDF.js实现个性化PDF渲染(文本复制)

pdf.js jspdf 和pdfobject 哪个好

使用 PHP 从纯文本和 HTML 文本的混合创建 PDF [重复]

使用PDF.JS插件在HTML中预览PDF文件

pdf流文件转图片