Python脚本利用openoffice将office文档转为html或者pdf。
Posted reg183
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python脚本利用openoffice将office文档转为html或者pdf。相关的知识,希望对你有一定的参考价值。
准备工作:
一.软件环境:
jdk-7u9-linux-i586.tar.gz #openoffice安装需要有jdk支持 版本号你随便定
Apache_OpenOffice_4.1.1_Linux_x86_install-rpm_en-US.tar #openoffice软件请到官网下载,我的是最新版本
二.安装部署
1.查看是否安装了JDK
rpm -qa | grep java
如有显示说明已经安装了
那就删除掉
rmp -e java
2.拷贝jdk-7u9-linux-i586.tar.gz到数据库服务器的/web/下
mv jdk-7u9-linux-i586.tar.gz /home/wwwroot/
解压
tar -zxvf jdk-7u9-linux-i586.tar.gz
3.修改环境变量
vim /etc/profile
添加下面的代码
export JAVA_HOME=/www/web/jdk1.7.0_09
export CLASSPATH=.:JAVA_HOME/lib/tools.jar
export PATH=JAVA_HOME/bin
保存退出
4.重新加载环境变量
source /etc/profile
5.验证是否成功
java -version
如果出现下面三行
java version “1.7.0_09”
Java™ SE Runtime Environment (build 1.7.0_09-b05)
Java HotSpot™ Client VM (build 23.5-b02, mixed mode)
或者新建Test.java
class Test
public static void main(String[] args)
System.out.println(“Hello World!”);
保存
javac Test.java
java Test
运行结果如下
Hello World!
以上说明jdk没问题了。
6.安装openoffice
tar -zxvf Apache_OpenOffice_4.1.1_Linux_x86_install-rpm_en-US.tar.gz
进入里面RPMS去
ls查看
desktop-integration openoffice-en-US-calc-4.1.1-9775.i586.rpm
openoffice-4.1.1-9775.i586.rpm openoffice-en-US-draw-4.1.1-9775.i586.rpm
openoffice-base-4.1.1-9775.i586.rpm openoffice-en-US-help-4.1.1-9775.i586.rpm
openoffice-brand-base-4.1.1-9775.i586.rpm openoffice-en-US-impress-4.1.1-9775.i586.rpm
openoffice-brand-calc-4.1.1-9775.i586.rpm openoffice-en-US-math-4.1.1-9775.i586.rpm
openoffice-brand-draw-4.1.1-9775.i586.rpm openoffice-en-US-res-4.1.1-9775.i586.rpm
openoffice-brand-en-US-4.1.1-9775.i586.rpm openoffice-en-US-writer-4.1.1-9775.i586.rpm
openoffice-brand-impress-4.1.1-9775.i586.rpm openoffice-gnome-integration-4.1.1-9775.i586.rpm
openoffice-brand-math-4.1.1-9775.i586.rpm openoffice-graphicfilter-4.1.1-9775.i586.rpm
openoffice-brand-writer-4.1.1-9775.i586.rpm openoffice-images-4.1.1-9775.i586.rpm
openoffice-calc-4.1.1-9775.i586.rpm openoffice-impress-4.1.1-9775.i586.rpm
openoffice-core01-4.1.1-9775.i586.rpm openoffice-javafilter-4.1.1-9775.i586.rpm
openoffice-core02-4.1.1-9775.i586.rpm openoffice-math-4.1.1-9775.i586.rpm
openoffice-core03-4.1.1-9775.i586.rpm openoffice-ogltrans-4.1.1-9775.i586.rpm
openoffice-core04-4.1.1-9775.i586.rpm openoffice-onlineupdate-4.1.1-9775.i586.rpm
openoffice-core05-4.1.1-9775.i586.rpm openoffice-ooofonts-4.1.1-9775.i586.rpm
openoffice-core06-4.1.1-9775.i586.rpm openoffice-ooolinguistic-4.1.1-9775.i586.rpm
openoffice-core07-4.1.1-9775.i586.rpm openoffice-pyuno-4.1.1-9775.i586.rpm
openoffice-draw-4.1.1-9775.i586.rpm openoffice-ure-4.1.1-9775.i586.rpm
openoffice-en-US-4.1.1-9775.i586.rpm openoffice-writer-4.1.1-9775.i586.rpm
openoffice-en-US-base-4.1.1-9775.i586.rpm openoffice-xsltfilter-4.1.1-9775.i586.rpm
然后rpm -ivh *.rpm
很快就安装完成了
7.启动openoffice
cd /opt/openoffice4/program/
我装的是openoffice4,你自己看清楚,使用命令启动
./soffice -headless -accept=“socket,host=127.0.0.1,port=8100;urp;” -nofirststartwizard &
如果出现下面
[1] 1784
再查看一下进程
[root@www program]# netstat -tnlp
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name
tcp 0 0 0.0.0.0:21 0.0.0.0:* LISTEN 1560/pure-ftpd (SER
tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN 1083/sshd
tcp 0 0 127.0.0.1:631 0.0.0.0:* LISTEN 1027/cupsd
tcp 0 0 127.0.0.1:25 0.0.0.0:* LISTEN 1543/sendmail
tcp 0 0 127.0.0.1:8100 0.0.0.0:* LISTEN 1814/soffice.bin
tcp 0 0 0.0.0.0:3306 0.0.0.0:* LISTEN 1494/mysqld
tcp 0 0 127.0.0.1:11211 0.0.0.0:* LISTEN 1576/memcached
tcp 0 0 127.0.0.1:6379 0.0.0.0:* LISTEN 1523/redis-server 1
tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 1067/nginx
tcp 0 0 :::21 ::
以上是关于Python脚本利用openoffice将office文档转为html或者pdf。的主要内容,如果未能解决你的问题,请参考以下文章
百度文库的实现——java利用openoffice,word转pdf