如何将 word 文件转换为 markdown 文件

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何将 word 文件转换为 markdown 文件相关的知识,希望对你有一定的参考价值。

参考技术A 它由9个连续步骤组成:
1.
使用Microsoft
Word
2012导出到html。我们使用Automator在OS
X上自动执行此操作。欢迎其他平台的解决方案!
2.
提取我们要使用的图像类型。保持原始质量,除非是专有的.emz文件。在这一步,我们还修复了一些数学。
3.
使用标签将HTML转换为XML。
4.
将OOML(专有Word格式)转换为MathML方程,使用Microsoft自己的转换XSLT和该XSLT的自定义版本。使用萨克森8。
5.
修复一些中间的空白和数学。
6.
使用Tidy转换回HTML。也剥了很多东西。
7.
中间定位来解决Tidy和Pandoc的缺点。
8.
使用Pandoc转换为Markdown。
9.
清理和最后修复Markdown。
但是应该注意,您需要购买Microsoft
Word才能工作。希望这可以作为一个更可靠的转换Word文档的起点!
参考技术B 它由9个连续步骤组成:
1.
使用microsoft
word
2012导出到html。我们使用automator在os
x上自动执行此操作。欢迎其他平台的解决方案!
2.
提取我们要使用的图像类型。保持原始质量,除非是专有的.emz文件。在这一步,我们还修复了一些数学。
3.
使用标签将html转换为xml。
4.
将ooml(专有word格式)转换为mathml方程,使用microsoft自己的转换xslt和该xslt的自定义版本。使用萨克森8。
5.
修复一些中间的空白和数学。
6.
使用tidy转换回html。也剥了很多东西。
7.
中间定位来解决tidy和pandoc的缺点。
8.
使用pandoc转换为markdown。
9.
清理和最后修复markdown。
但是应该注意,您需要购买microsoft
word才能工作。希望这可以作为一个更可靠的转换word文档的起点!

如何将word转换成markdown

首先尝试word-to-markdown
我用google搜到的第一个就是这个了,当然要试试。
坑:极度安全的Mac自带Ruby
要玩gem,首先当然是上(Fan)套(Qiang)咯。连上vpn,然后:
$ gem install word-to-markdown

你以为这么一句话就能搞定了吗,那可真就太天真了。撞到最后一个premailer开始报对gem文件夹没有权限的错误,查了查,其实就是Mac版自带ruby版本的问题,不允许随便装东西,即便有sudo也不让。
网上的解决方案是开机安住CMD+R,把Integrity Protection禁用,然后进系统装不能装的gem,然后再回去把它启用。这方案麻烦不说,其实还是在系统的gem库里加了也许就只会用那么一两次的不该加的东西,各种不安嘛,这方案明显不符合我的审美。
ok,那就rbenv走起吧
求助万能的谷哥,提供了两种选择,rbenv或者rvm,看了一下,貌似rbenv更加的handoff,而且提供Homebrew安装,那就选它了。
$ brew update
$ brew install rbenv

然后官方说是要运行rbenv init,运行一下说把下面这行加到.zshrc里去
eval "$(rbenv init -)"

然后重启一下Terminal,
# 看看装了些啥版本,system就是系统自带的了
$ rbenv versions
# 然后看看当前的版本
$ rbenv version
# 看看能装哪些版本
$ rbenv install list

最后随便选了个2.3.0(其实也不是随便选的,我这人就爱最新版,但2.4.0还在dev,就选这个次新版了)
$ rbenv install 2.3.0
$ rbenv global 2.3.0

这样就把ruby命令替换成rbenv管理的版本了,各种gem install也不会报什么权限错误啊操作不允许之类的了。
速度重装word-to-markdown
$ gem install word-to-markdown

这次安装过程果然顺利,装完运行:
$ w2m 1.docx

我勒个去,转换结果直接输出到命令行了,而且也貌似并没有提供什么参数来指定输出文件,官方的意思就是:我输出到stdout了,剩下的你自己玩吧。
那就redirect一下吧
$ w2m 1.docx > 1.md

so easy嘛,顺便说说这个redicrect,有这么几种用法:
system_profiler > file.txt

> take the output of system_profiler and save it to the file file.txt
&> The & tells the shell to redirect the standard output and standard error to the file.
2> If you want to just output standard error
>> appending to the existing file
参考技术A 理论上是支持的.以前的一种方法是onenote写完后导出成word,word有什么txt2wiki之类的插件,可以反向转换成wiki或者markdown. 现在其实用onenote的,快捷键熟的话,比markdown方便太多(最直接是表格, markdown只有去死的心了). 参考技术B 用word-to-markdown之后进一步手动编辑整理完善表格。
如果没什么特别要求,只是想把word转成markdown看看,然后看着更方便的话,pandoc对table的转换更具有可读性,对一些不支持table语法转换的markdown编辑器来说也更友好一些。本回答被提问者采纳

以上是关于如何将 word 文件转换为 markdown 文件的主要内容,如果未能解决你的问题,请参考以下文章

如何把 Markdown 文件转化为 PDF

如何把 Markdown 文件转化为 PDF

如何将word转换成markdown

将word文档转换为markdown(.md)文件

如何把 Markdown 文件转化为 PDF

如何把 Markdown 文件转化为 PDF