将网页内容转化为PDF的三种方法
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了将网页内容转化为PDF的三种方法相关的知识,希望对你有一定的参考价值。
参考技术A大家知道,有一些网页是有时间限制的,过段时间就找不到它们的链接了。这时候如果想把它们存下来那么可以使用PDF的功能,把它们存成文档,以备后来的察看。我在下面根据大家系统软件版本的情况,以及各自的使用习惯,给出三种简单的 方法 ,有需要的朋友可以来看看哦。
将网页内容转化为PDF方法一:word实现法
1这里推荐使用的word版本为word2007或者2010版本。word2003的效果可能跟原来的网页会有差别
2首先,我们拖拽鼠标,选择网页中我能需要保存成文档的内容。右击选择复制
3打开一个新建的word文档命名为“百度一下,你就知道”。右击鼠标,选择保留原格式粘贴
4点击保存按钮。点击文件,打印。在打印机位置选择PDF。点击打印
5在新弹出页面选择保存路径,点击保存即可
6当然,除了第四个步骤这种方法以外,我们也可以右击word文档,选择转化为PDF。我们下了来讲第二种方法
将网页内容转化为PDF方法二:网页转化法
1在打开的网页中,一次点击文件,另存为。总之找到可以保存网页的命令按钮,点击保存网页
2在弹出保存菜单中选择保存类型为“网页,仅html”选项,点击保存。
3好了,现在找到我们的网页文件,右击选择转化为Adobe PDF 即可。O(∩_∩)O哈哈~
将网页内容转化为PDF方法三:直接PDF法
如果你现在打开的网页不是使用IE浏览器的话,复制网页地址到IE浏览器打开。我们以百度首页为例
由于现在的IE制作的比较简约,一些工具比如PDF我们都看不到它们了。所以在窗口最上方的空白处右击,把PDF按钮调出来
然后在弹出的窗口IE会问是否允许加载,点击启用
然后我们发现在浏览器右上角出现了两个PDF按钮图标
点击转换按钮,马上我们的页面就转化为PDF格式文档可以保存了。如果点击【选择】按钮的话,我们需要拖拽鼠标选择需要转化的对象或元素,再点击转换按钮完成转换
来看看我们最后转化完成的文档。后一个图是PDF文档的效果
将网页内容转化为PDF的三种方法相关 文章 :
★ 怎么在网页上将word转成pdf
★ 电脑如何将网页保存为PDF格式
★ word2010转为pdf的两种方法
★ 将word2003转换成pdf格式的方法步骤图
★ 将word转成pdf的两种方法
★ 360浏览器打印网页输出为pdf文件怎么设置
★ 在线将word转化为pdf的两种方法
★ word转成pdf的两种方法
★ word2010中如何转换pdf
var _hmt = _hmt || []; (function() var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?fff14745aca9358ff875ff9aca1296b3"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); )();java将doc文件转换为pdf文件的三种方法
http://feifei.im/archives/93
——————————————————————————————————————————————
项目要用到doc转pdf的功能,一番google之后总结出了三种方法(免费方案),于是一一试了一下,做个总结记录,下次要用直接查,省的忘了……
方法1.poi读取doc + itext生成pdf (实现最方便,效果最差,跨平台)
方法2.jodconverter + openOffice (一般格式实现效果还行,复杂格式容易有错位,跨平台)
方法3.jacob + msOfficeWord + SaveAsPDFandXPS (完美保持原doc格式,效率最慢,只能在windows环境下进行)
方法1:使用jdoctopdf来实现,这是一个封装好的包,可以把doc转换成pdf,html,xml等格式,调用很方便
地址:http://www.maxstocker.com/jdoctopdf/downloads.php
需要自己导入poi包与itext包,需要注意的是itext要导入itext-2.1.5版本,新版本由于包名不同,会出错
也可以自己根据网上的其他教程根据需要自己写方法来实现。
用jdoctopdf的实现方法如下:
public void doc2pdf(String docFileName) throws Exception{
String path = this.getSession().getServletContext().getRealPath("/")+"attachment/";
Parser p = new DocParser();// create a new parser instance
FileInputStream fis = new FileInputStream(path+"/doc/"+ docFileName + ".doc");// creating InputStream for use with parser
DocumentElement mydoc = p.parse(fis,true,false);// parse document from input stream
DocWriter w = new PDFWriter();// create PDF writer
w.writeDocument(mydoc,new FileOutputStream(path+"/pdf/"+docFileName + ".pdf"));// write document as pdf using writer
w = new XHTMLWriter();
w.writeDocument(mydoc,new FileOutputStream(path+"/pdf/"+docFileName + ".html"));// write document as xhtml
}
public String materialUpload(){
try {
doc2pdf("ttt");
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return SUCCESS;
}
方法1转化后pdf截图:(itext转中文需要额外配置,所以。。。一片空白,格式也错位了)
方法2:使用jodconverter来调用openOffice的服务来转换,openOffice有个各个平台的版本,所以这种方法跟方法1一样都是跨平台的。
jodconverter的下载地址:http://www.artofsolving.com/opensource/jodconverter
首先要安装openOffice,下载地址:http://www.openoffice.org/download/index.html
安装完后要启动openOffice的服务,具体启动方法请自行google,
mac下的启动方法为终端输入
/Applications/OpenOffice.org.app/Contents/MacOS/soffice "-accept=socket,host=localhost,port=8100;urp;StarOffice.ServiceManager" -nologo -headless
准备工作完成后在项目里导入下载下来的包,然后加个方法就OK:
public void createPdf(String docFileName) throws IOException{
String path = this.getSession().getServletContext().getRealPath("/")+"attachment/";
File inputFile = new File(path+"/doc/"+ docFileName + ".doc");
File outputFile = new File(path+"/pdf/"+docFileName + ".pdf");
// connect to an OpenOffice.org instance running on port 8100
OpenOfficeConnection connection = new SocketOpenOfficeConnection(8100);
connection.connect();
// convert
DocumentConverter converter = new OpenOfficeDocumentConverter(connection);
converter.convert(inputFile, outputFile);
// close the connection
connection.disconnect();
}
方法3:效果最好的一种方法,但是需要window环境,而且速度是最慢的需要安装msofficeWord以及SaveAsPDFandXPS.exe(word的一个插件,用来把word转化为pdf)
Office版本是2007,因为SaveAsPDFandXPS是微软为office2007及以上版本开发的插件
SaveAsPDFandXPS下载地址:http://www.microsoft.com/zh-cn/download/details.aspx?id=7
jacob 包下载地址:http://sourceforge.net/projects/jacob-project/
我下的是jacob-1.17-M2.zip
下载下来的jacob里的jar包导入到项目里,
jacob的dll文件放到到你的jdk/jre/bin下面(不放会报错:java.lang.NoClassDefFoundError: Could not initialize class com.jacob.com.Dispatch)
网上还有一种是把dll放在放在以下代码输出的路径里的任意一个路径目录
System.getProperty("java.library.path");
这个我没试过,应该也是可以的
然后添加方法:
static final int wdFormatPDF = 17;// PDF 格式
public void wordToPDF(String docFileName){
System.out.println("启动Word...");
long start = System.currentTimeMillis();
ActiveXComponent app = null;
Dispatch doc = null;
try {
app = new ActiveXComponent("Word.Application");
app.setProperty("Visible", new Variant(false));
Dispatch docs = app.getProperty("Documents").toDispatch();
String path = this.getSession().getServletContext().getRealPath("/")+"attachment/";
String sfileName = path+"/doc/"+ docFileName + ".doc";
String toFileName = path+"/pdf/"+ docFileName + ".pdf";
doc = Dispatch.call(docs, "Open" , sfileName).toDispatch();
System.out.println("打开文档..." + sfileName);
System.out.println("转换文档到PDF..." + toFileName);
File tofile = new File(toFileName);
if (tofile.exists()) {
tofile.delete();
}
Dispatch.call(doc,
"SaveAs",
toFileName, // FileName
wdFormatPDF);
long end = System.currentTimeMillis();
System.out.println("转换完成..用时:" + (end - start) + "ms.");
} catch (Exception e) {
System.out.println("========Error:文档转换失败:" + e.getMessage());
} finally {
Dispatch.call(doc,"Close",false);
System.out.println("关闭文档");
if (app != null)
app.invoke("Quit", new Variant[] {});
}
//如果没有这句话,winword.exe进程将不会关闭
ComThread.Release();
}
需要注意的是,如果没有安装SaveAsPDFandXPS.exe的话会提示
========Error:文档转换失败:Invoke of: SaveAs
Source: Microsoft Word
Description:
以上是关于将网页内容转化为PDF的三种方法的主要内容,如果未能解决你的问题,请参考以下文章