【背景】
需求: 打印word文件
模块: python-docx
【问题】
传递xxx.doc文件给python脚本,执行后,控制台没有内容输出
经查询后了解到,大致理由: doc是早一代的word文件,封闭格式,office或wps是采用反破译去解析出来,但也不保证完美解析
python没有做解析doc文件的模块
【解决】(目前只找到这一种)
利用 Linux下的antiword命令进行解析
使用: [ antiword + doc_file]
安装antiword:
1. 解压安装包
2. 进入文件夹
3. 执行make && make install