将 docx 转换为 mediawiki 并保留 [[Image:]]
Posted
技术标签:
【中文标题】将 docx 转换为 mediawiki 并保留 [[Image:]]【英文标题】:Convert docx to mediawiki and preserve [[Image:]] 【发布时间】:2015-02-11 15:23:00 【问题描述】:目前,我正在尝试将 docx 移动到 mediawiki 文件并在 [[Image:]] 标签中保留正确的文件名。出于某种原因,正确的图像文件被吞噬了(即,通常它是media/image4.jpg
,但它只是空的)。
我已经尝试提取 docx 并查看 docx/word/_rels/document.xml.rels
,但我不知道如何找出复制的图像。我做了一个简单的脚本来做一些查找/替换,但在一个文件中我有 130 个 [[Image:]] 标签和只有 105 个图像。
因此,我希望 MediaWiki 过滤器在执行此操作时输出正确的图像名称:
soffice --headless --convert-to txt:MediaWiki myfile.docx
我在 ubuntu 14.10 上。
这可能吗?
【问题讨论】:
为什么不能直接将图片嵌入到文档文件中? (我个人也会使用像 OpenDocument odt 这样的正确文档格式。) 因为这是一项公司任务,将大量旧文档转换为 mediawiki 格式。它们必须按原样处理并正确转换,我最终做到了(见我的回答)。 啊。从问题和答案来看,都不清楚您正在将文档转换为 wikitext 页面。 @Nemo 我曾怀疑“从 docx 转换为 mediawiki”在那里会很清楚地描述。 【参考方案1】:这似乎是不可能的,但我已经写了一个解决方法,发现 here 可以解决它。总而言之,我转换文件并手动管理图像的上传/链接。
【讨论】:
以上是关于将 docx 转换为 mediawiki 并保留 [[Image:]]的主要内容,如果未能解决你的问题,请参考以下文章
将文本转换为 .docx 文档文件并打开共享对话框,Swift 2
Java - 将 doc/docx 文件转换为 chm 文件