iOS 解析HTML数据

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了iOS 解析HTML数据相关的知识,希望对你有一定的参考价值。

  因为项目需要,今天特地查阅了 一些对html解析的文章,文章不算少,只是有的内容不是很全面,不太够用,在此将他们补充到一起。

一、首先 先在项目中导入TFHpple  链接:https://github.com/zgGitHub/TFHpple

  1、添加libxml2.tbd库

  2、添加一些路径 在TAGER中的Build Setting中 找到 Hesder Search Paths 输入两个路径 一个是libxml2.tbd库在你的项目中的路径;另一个是 $(SDKROOT)/usr/include/libxml2

  comment+b 查看是否运行正常

二、1、导入三个头文件 

    

#import "XPathQuery.h"

    #import "TFHpple.h"

    #import "TFHppleElement.h"

 

  2、首先将网页的html转换成oc能够认识的NSString数据;

    (1)如果你的HTML页面是保存在项目中的,用如下方法:

      

NSString *dataString = [NSString stringWithContentsOfFile:[[NSBundle       mainBundle]pathForResource:@"瀑布流" ofType:@"html"] encoding:NSUTF8StringEncoding error:nil];

 

    (2)如果是从网络上请求的 用这个方法:

     

 NSString *dataString = [NSString stringWithContentsOfURL:[NSURL URLWithString:@"http://www.lomowo.com/posts/47632"] encoding:NSUTF8StringEncoding error:nil];

 

  3、如果不想整篇幅的取值 ,可以截取自己想要的内容

   

NSRange rang1=[dataString rangeOfString:@"<div class=\\"content\\">"];

      NSMutableString *imageStr2=[[NSMutableString alloc]initWithString:[dataString substringFromIndex:rang1.location+rang1.length]];

    

      NSRange rang2=[imageStr2 rangeOfString:@"<div class=\\"clear\\">"];

      NSMutableString *imageStr3=[[NSMutableString alloc]initWithString:[imageStr2 substringToIndex:rang2.location]];

    

      NSLog(@"%@",imageStr3);

  imageStr3:

技术分享

 

    

  4、将dataString转换成NSData,给TFHpple类用

 NSData *data=[imageStr3 dataUsingEncoding:NSUTF8StringEncoding];

  5、根据标签<p>找到自己想要的代码块

 TFHpple *xpathParser = [[TFHpple alloc]initWithHTMLData:data];
    // 根据标签进行筛选 获取所有标签是<p>的代码块
     NSArray *elements  = [xpathParser searchWithXPathQuery:@"//p"];
    NSMutableArray *contArray = [[NSMutableArray alloc]init];

  6、获取想要的标签内容

//开始整理数据
    for (TFHppleElement *elsement in elements) {
        if ([elsement content] != nil) {

            if (![[elsement objectForKey:@"style"]isEqualToString:@"text-align"]) {//筛选属性是里有style 并且值是text-align的标签
                
                //打印出该节点的所有内容  包括标签
                NSLog(@"%@",elsement.raw);
                //打印出该节点的所有内容   不包括标签
                NSLog(@"%@",elsement.text);
            }
        }
    }

  得到的结果:

技术分享

 

  7、获取想要的标签属性

  //开始整理数据
    for (TFHppleElement *elsement in elements) {
        if ([elsement content] != nil) {
            
            //将这段代码转换成字典  key是标签内的属性  value是属性对应的值
            //得到的是标签属性  不能得到标签内容
            NSDictionary *elementContent =[elsement attributes];
            NSLog(@"-----------%@",elementContent);
            
            if (elementContent != nil) {
                [contArray addObject:[elementContent objectForKey:@"style"]];
            }
           
        }
    }

  得到的结果:

技术分享

 

以上是关于iOS 解析HTML数据的主要内容,如果未能解决你的问题,请参考以下文章

iOS开发CGRectGetMidX. CGRectGetMidY.CGRectGetMinY. CGRectGetMaxY. CGRectGetMinX. CGRectGetMaxX的使用(代码片段

如何使用 Swift 使用此代码片段为 iOS 应用程序初始化 SDK?

iOS开发CGRectGetMidX. CGRectGetMidY.CGRectGetMinY. CGRectGetMaxY. CGRectGetMinX. CGRectGetMaxX的使用(代码片段

PHP代码-psysh调试代码片段工具

ios - Heroku 和 MongoDb 上的自定义解析服务器错误 3080:JSON 文本没有以数组或对象开头,并且允许未设置片段的选项

Android 逆向使用 Python 解析 ELF 文件 ( Capstone 反汇编 ELF 文件中的机器码数据 | 创建反汇编解析器实例对象 | 设置汇编解析器显示细节 )(代码片段