将html转为markdown格式的难点在哪,有啥解决思路
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了将html转为markdown格式的难点在哪,有啥解决思路相关的知识,希望对你有一定的参考价值。
参考技术A 据我所知,html是表现网页的,Markdown是给文字排版的。如果你要把HTML转成Markdown,首先要把很多无法对应的HTML标签过滤掉,然后再把HTML标签替换成Markdown标签。同时,你应注意,HTML有很多版本,语法不太相同。而且还有样式表的问题,转换后恐怕无法保留网页的一些显示效果。
转 - markdown简明语法
Markdown是一种极简的『标记语言』,将文本转为HTML,通常为我大码农所用。其不追求大而全,简洁至上,正所谓不求最贵,只求最好!
本文介绍Markdown基本语法,内容很少,一行语法一行示例,学会后可轻松写出高大上的文档,再也不需要各种编辑器去调文章格式。另外,网上有各平台下的Markdown工具可用,也有在线的,我直接使用sublime搞定,Markdown本来就是为了追求简洁,弄个工具岂不多此一举。
强调
星号与下划线都可以,单是斜体,双是粗体,符号可跨行,符号可加空格 **一个人来到田纳西** __毫无疑问__ *我做的馅饼 是全天下* _最好吃的_
一个人来到田纳西
毫无疑问
我做的馅饼
是全天下
最好吃的
分割线
三个或更多-_*,必须单独一行,可含空格 ---
引用
翻译成html就是<blockquote></blockquote>,符号后的空格可不要 > 引用
引用
内层符号前的空格必须要 >引用 >>引用中的引用
引用
引用中的引用
标题:Setext方式
三个或更多 大标题 === 小标题 ---
大标题
小标题
标题:Atx方式
# 一级标题 ## 二级标题 ### 三级标题 #### 四级标题 ##### 五级标题 ###### 六级标题
一级标题
二级标题
三级标题
四级标题
五级标题
六级标题
无序列表
符号之后的空格不能少,-+*效果一样,但不能混合使用,因混合是嵌套列表,内容可超长 - 无序列表 - 无序列表 - 无序列表 - 无序列表:我很长。我也很长!那比一比啊?比就比!我有这么长,你有我长吗?我有这么这么长!好吧,你赢了!
- 无序列表
- 无序列表
- 无序列表
- 无序列表:我很长。我也很长!那比一比啊?比就比!我有这么长,你有我长吗?我有这么这么长!好吧,你赢了!
符号之后的空格不能少,-+*效果一样,但不能混合使用,因混合是嵌套列表 + 无序列表 + 无序列表 + 无序列表
- 无序列表
- 无序列表
- 无序列表
符号之后的空格不能少,-+*效果一样,但不能混合使用,因混合是嵌套列表 * 无序列表 * 无序列表 * 无序列表
- 无序列表
- 无序列表
- 无序列表
有序列表
数字不能省略但可无序,点号之后的空格不能少 1. 有序列表 2. 有序列表 3. 有序列表 8. 有序列表
- 有序列表
- 有序列表
- 有序列表
- 有序列表
嵌套列表
-+*可循环使用,但符号之后的空格不能少,符号之前的空格也不能少 - 嵌套列表 + 嵌套列表 + 嵌套列表 - 嵌套列表 * 嵌套列表 - 嵌套列表
- 嵌套列表
- 嵌套列表
- 嵌套列表
- 嵌套列表
- 嵌套列表
- 嵌套列表
- 嵌套列表
文字超链:Inline方式
Tooltips可省略 [不如](http://bruce-sha.github.io "不如的博客")
图片超链
多个感叹号,Tooltips可省略,要设置大小只能借助HTML标记 ![GitHub Mark](http://github.global.ssl.fastly.net/images/modules/logos_page/GitHub-Mark.png "GitHub Mark")
GitHub Mark
索引超链:Reference方式
索引,1 2可以是任意字符 [不如][1] ![GitHub Octocat][2] [1]:http://bruce-sha.github.io [2]:http://github.global.ssl.fastly.net/images/modules/logos_page/Octocat.png
GitHub Octocat
自动链接
尖括号 <http://ibruce.info> <[email protected]>
代码:行内代码
在第一行后指定编程语言,也可以不指定 <!--?0-->
val s = "hello Markdown" println( s )
代码:段落代码
每行文字前加4个空格或者1个Tab val s = "hello Markdown" println( s )
val s = "hello Markdown" println( s )
代码:hexo
可指定编程语言,『』代表左右大括号 『% codeblock [title] [lang:language] [url] [link text] %』 code snippet 『% endcodeblock %』
注释
用html的注释,好像只有这样? <!-- 注释 -->
转义字符
用html的注释,好像只有这样? Markdown中的转义字符为\,转义的有: \\ 反斜杠 \` 反引号 \* 星号 \_ 下划线 \{\} 大括号 \[\] 中括号 \(\) 小括号 \# 井号 \+ 加号 \- 减号 \. 英文句号 \! 感叹号
其它
文本中可直接用html标签,但是要前后加上空行。
one more thing:表格
Markdown的扩展语法,hexo不支持 || *Year* || *Temperature (low)* || *Temperature (high)* || || 1900 || -10 || 25 || || 1910 || -15 || 30 || || 1920 || -10 || 32 ||
注意事项
原文地址:http://ibruce.info/2013/11/26/markdown/
以上是关于将html转为markdown格式的难点在哪,有啥解决思路的主要内容,如果未能解决你的问题,请参考以下文章