解析多个HTML标签Bash [重复]

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了解析多个HTML标签Bash [重复]相关的知识,希望对你有一定的参考价值。

我该如何解析以下的html代码?

我已经找到了解析“AAA,BBB”的方法但是对我来说无法解析“1. CCC”和“DDD”

输出应如下所示:AAA,BBB,CCC,DDD

<td style="background:#edeaea;height:30px;padding-top:10px;" align="center" valign="top">
<a href="design-future">
<img src="../habsr/images2/viels_k/cool.jpg" alt="AAA, BBB" title="cool" style="width:105px;">
1. CCC<br><b><font color="#ff0000">DDD</font></b>
答案

grepsed的混合可以工作:

我将您的文本复制/粘贴到名为blah的文件中。

$ grep -o -E "\<[A-Z]{3}\>" blah | xargs | sed 's/ /, /g'

// output
AAA, BBB, CCC, DDD

关于grep的解释: -o从grep输出(AAA,BBB等)捕获匹配 -E为正则表达式 "\<[A-Z]{3}\>"在字边界上有3个字母的A-Z匹配 到xargs的管道从grep输出中获取一行(用空格分隔)

sed的最后一个管道只是将空格转换为逗号空间以实现所需的输出。

以上是关于解析多个HTML标签Bash [重复]的主要内容,如果未能解决你的问题,请参考以下文章

如何在多个页面使用同一个HTML片段

如何创建片段以重复变量编号中的代码行

如何解析包含多个标签的html节点?

Python中verbaim标签使用详解

head标签怎么给多个html引用

android使用片段从相机或画廊获取照片[重复]