Python脚本利用openoffice将office文档转为html或者pdf。

Posted reg183

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python脚本利用openoffice将office文档转为html或者pdf。相关的知识,希望对你有一定的参考价值。


准备工作:

一.软件环境:

jdk-7u9-linux-i586.tar.gz #openoffice安装需要有jdk支持 版本号你随便定

Apache_OpenOffice_4.1.1_Linux_x86_install-rpm_en-US.tar #openoffice软件请到官网下载,我的是最新版本

二.安装部署

1.查看是否安装了JDK

rpm -qa | grep java

如有显示说明已经安装了

那就删除掉

rmp -e java

2.拷贝jdk-7u9-linux-i586.tar.gz到数据库服务器的/web/下

mv jdk-7u9-linux-i586.tar.gz /home/wwwroot/

解压

tar -zxvf jdk-7u9-linux-i586.tar.gz

3.修改环境变量

vim /etc/profile

添加下面的代码

export JAVA_HOME=/www/web/jdk1.7.0_09
export CLASSPATH=.:JAVA_HOME/lib/tools.jar
export PATH=JAVA_HOME/bin

保存退出

4.重新加载环境变量

source /etc/profile

5.验证是否成功

java -version

如果出现下面三行
java version “1.7.0_09”
Java™ SE Runtime Environment (build 1.7.0_09-b05)
Java HotSpot™ Client VM (build 23.5-b02, mixed mode)

或者新建Test.java

class Test

public static void main(String[] args)

System.out.println(“Hello World!”);


保存

javac Test.java
java Test

运行结果如下

Hello World!

以上说明jdk没问题了。

6.安装openoffice

tar -zxvf Apache_OpenOffice_4.1.1_Linux_x86_install-rpm_en-US.tar.gz

进入里面RPMS去

ls查看

desktop-integration openoffice-en-US-calc-4.1.1-9775.i586.rpm
openoffice-4.1.1-9775.i586.rpm openoffice-en-US-draw-4.1.1-9775.i586.rpm
openoffice-base-4.1.1-9775.i586.rpm openoffice-en-US-help-4.1.1-9775.i586.rpm
openoffice-brand-base-4.1.1-9775.i586.rpm openoffice-en-US-impress-4.1.1-9775.i586.rpm
openoffice-brand-calc-4.1.1-9775.i586.rpm openoffice-en-US-math-4.1.1-9775.i586.rpm
openoffice-brand-draw-4.1.1-9775.i586.rpm openoffice-en-US-res-4.1.1-9775.i586.rpm
openoffice-brand-en-US-4.1.1-9775.i586.rpm openoffice-en-US-writer-4.1.1-9775.i586.rpm
openoffice-brand-impress-4.1.1-9775.i586.rpm openoffice-gnome-integration-4.1.1-9775.i586.rpm
openoffice-brand-math-4.1.1-9775.i586.rpm openoffice-graphicfilter-4.1.1-9775.i586.rpm
openoffice-brand-writer-4.1.1-9775.i586.rpm openoffice-images-4.1.1-9775.i586.rpm
openoffice-calc-4.1.1-9775.i586.rpm openoffice-impress-4.1.1-9775.i586.rpm
openoffice-core01-4.1.1-9775.i586.rpm openoffice-javafilter-4.1.1-9775.i586.rpm
openoffice-core02-4.1.1-9775.i586.rpm openoffice-math-4.1.1-9775.i586.rpm
openoffice-core03-4.1.1-9775.i586.rpm openoffice-ogltrans-4.1.1-9775.i586.rpm
openoffice-core04-4.1.1-9775.i586.rpm openoffice-onlineupdate-4.1.1-9775.i586.rpm
openoffice-core05-4.1.1-9775.i586.rpm openoffice-ooofonts-4.1.1-9775.i586.rpm
openoffice-core06-4.1.1-9775.i586.rpm openoffice-ooolinguistic-4.1.1-9775.i586.rpm
openoffice-core07-4.1.1-9775.i586.rpm openoffice-pyuno-4.1.1-9775.i586.rpm
openoffice-draw-4.1.1-9775.i586.rpm openoffice-ure-4.1.1-9775.i586.rpm
openoffice-en-US-4.1.1-9775.i586.rpm openoffice-writer-4.1.1-9775.i586.rpm
openoffice-en-US-base-4.1.1-9775.i586.rpm openoffice-xsltfilter-4.1.1-9775.i586.rpm

然后rpm -ivh *.rpm

很快就安装完成了

7.启动openoffice

cd /opt/openoffice4/program/

我装的是openoffice4,你自己看清楚,使用命令启动

./soffice -headless -accept=“socket,host=127.0.0.1,port=8100;urp;” -nofirststartwizard &

如果出现下面
[1] 1784

再查看一下进程

[root@www program]# netstat -tnlp
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name
tcp 0 0 0.0.0.0:21 0.0.0.0:* LISTEN 1560/pure-ftpd (SER
tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN 1083/sshd
tcp 0 0 127.0.0.1:631 0.0.0.0:* LISTEN 1027/cupsd
tcp 0 0 127.0.0.1:25 0.0.0.0:* LISTEN 1543/sendmail
tcp 0 0 127.0.0.1:8100 0.0.0.0:* LISTEN 1814/soffice.bin
tcp 0 0 0.0.0.0:3306 0.0.0.0:* LISTEN 1494/mysqld
tcp 0 0 127.0.0.1:11211 0.0.0.0:* LISTEN 1576/memcached
tcp 0 0 127.0.0.1:6379 0.0.0.0:* LISTEN 1523/redis-server 1
tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 1067/nginx
tcp 0 0 :::21 ::

以上是关于Python脚本利用openoffice将office文档转为html或者pdf。的主要内容,如果未能解决你的问题,请参考以下文章

保证金 Openoffice python

解决openoffice进程异常退出的办法:

使用 OpenOffice4 时 CPU 利用率 100%

百度文库的实现——java利用openoffice,word转pdf

使用openoffice uno模块用python编写的excel表中的冻结窗格

在 Linux 中编写 Openoffice 脚本