如何提取显示一个html文档所有的标签,id值,class值?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何提取显示一个html文档所有的标签,id值,class值?相关的知识,希望对你有一定的参考价值。

比如一个html文档
1、要把所有的标签提取显示出来:如存在html head title div等标签
2、提取显示id名:如main nav1^5
3、提取显示class名:如nav1
可以写一段javascript代码插入网页中,也可以是一个小程序,只要能够达到要求即可

请各位高手帮忙写一下吧,我也写了一个javascript代码但是总有些不尽人意的地方,有劳大家了
——————————————————————————————————————————————————————————————————

用jquery的一种解决方法:例子如下:
test.html:(注意,这里任何html页面都可以用,我只是在这里面加了个div
<div id='gettag'></div>,用来显示信息。jquery.js可以在jquery上下载到,改下名字就可以,地址:http://code.google.com/p/jqueryjs/downloads/detail?name=jquery-1.2.min.js)
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" />
<title id='kkk'>jQuery Starterkit</title>

<script src="jquery.js" type="text/javascript"></script>
<script src="custom.js" type="text/javascript"></script>
</head>
<body>
<h1>jQuery Starterkit</h1>
<h2>This page contains code to test the examples. Most of it is only relevant for a example.</h2>
<div id='gettag'></div>
<a id="first" href="#" >Some link</a>
<div class="stuff">

<a name="top" href="#bottom">Go to bottom</a>

<div class="buttons">
<button>First button</button>
<button>Second button</button>
</div>

<ol id="orderedlist">
<li>First element</li>
<li>Second element</li>
<li>Third element</li>
</ol>

<ol id="orderedlist2">
<li>First element, second list</li>
<li>Second element, second list</li>
<li>Third element, second list</li>
<li>Li with child ul
<ul>
<li>Child One</li>
<li>child two</li>
</ul>
</li>
</ol>
<label for='text1'>test</label><input type="text" name='text1'>
<div id="rating">Container</div>

<a id="reset" href="#">Reset!</a>

<form id="form">
Form 1
<input value="XXX" />
<input />
</form>

<form>
Form 2
<input value="YYY" />
<input />
</form>

<form>
Form 3
<input type="checkbox" />
<input type="checkbox" checked="checked" />
</form>

</tbody>
</table>
<a name="bottom" href="#top">Go to top</a>
</div>

</body>
</html>

custom.js
//获取html的tag
$(document).ready(function()
var arr_tag=Array();
var arr_id=Array();
var arr_class=Array();

var str='';
$('*').each(function(i)
arr_tag[i]=$(this).get(0).tagName;
arr_id[i]=($(this).attr('id')? $(this).attr('id'): 'non');
arr_class[i]=($(this).attr('class')? $(this).attr('class'): 'non');
str +="</br>"+arr_tag[i]+" id='"+arr_id[i]+"' class='"+arr_class[i]+"'";
);
$('#gettag').html(str);
);
参考技术A 似乎答过一次了
用document.body.childNodes,如

var rs=document.body.childNodes;
for()

//遍历对象,可以取得对象
o=rs[i];
alert(o.className+o.id);


详细参见
http://www.jiangzhiqin.com/tools/Dom.htm
参考技术B D27CDB6E-AE6D-11cf-96B8-444553540000是类ShockwaveFlash的GUID
表名它是什麼类型的

<object classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=7,0,19,0" width="32" height="32">
<param name="movie" value="player.swf"/>
<param name="quality" value="high" />
</object>
classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000"起什么作用?
希望能回答的详细点,谢谢
参考技术C 就一个循环 正则式 匹配.
我试试.
参考技术D 你可以用jquery啊,$('*')获得所有元素。 第5个回答  2009-01-19 简单说复杂

ID3标签提取

【中文标题】ID3标签提取【英文标题】:ID3 tag extraction 【发布时间】:2010-09-01 18:34:08 【问题描述】:

如何从windows和android环境下的mp3文件中提取ID3标签中嵌入的信息?

【问题讨论】:

我的回答最终正确吗?如果可以,请您批准吗? 【参考方案1】:

查看id3lib 获取 c/c++ 库,查看 jid3lib 获取 Java 库,Android 需要这些库。

对于 .NET 开发,我建议使用 TagLib#。要引用和使用 TagLib# 库,您需要在 Visual Studio 的包管理器控制台中运行以下命令。

PM> Install-Package taglib

taglib-sharp 的 NuGet 发行版可以在 http://nuget.org/packages/taglib 找到。官方源代码库位于https://github.com/mono/taglib-sharp。

【讨论】:

以上是关于如何提取显示一个html文档所有的标签,id值,class值?的主要内容,如果未能解决你的问题,请参考以下文章

使用xpath提取页面所有a标签的href属性值

如何从脚本标签中提取字符串数据,其中脚本没有任何 id?

如何通过匹配字符串在Python中提取父html标签

XCTest Objective C Xcode8.1如何提取任何按钮或导航栏的标签/值/名称

jquery如何获取子标签的ID值

如何将 HTML 标签的属性值放入列表中?