IOS使用正则表达式去掉html中的标签元素,获得纯文本

Posted 开心刘哈哈

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了IOS使用正则表达式去掉html中的标签元素,获得纯文本相关的知识,希望对你有一定的参考价值。

ios使用正则表达式去掉html中的标签元素,获得纯文本

 
content是根据网址获得的网页源码字符串
NSRegularExpression *regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"<[^>]*>|\n"
                                                                                    options:0
                                                                                      error:nil];
     
    content=[regularExpretion stringByReplacingMatchesInString:content options:NSMatchingReportProgress range:NSMakeRange(0, content.length) withTemplate:@"-"];//替换所有html和换行匹配元素为"-"
     
    regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"-{1,}" options:0 error:nil] ;
    content=[regularExpretion stringByReplacingMatchesInString:content options:NSMatchingReportProgress range:NSMakeRange(0, content.length) withTemplate:@"-"];//把多个"-"匹配为一个"-"
     
    //根据"-"分割到数组
    NSArray *arr=[NSArray array];
    content=[NSString stringWithString:content];
    arr =  [content componentsSeparatedByString:@"-"];
    NSMutableArray *marr=[NSMutableArray arrayWithArray:arr];
    [marr removeObject:@""];
    return  marr;
 
 
 
 
 

以上是关于IOS使用正则表达式去掉html中的标签元素,获得纯文本的主要内容,如果未能解决你的问题,请参考以下文章

如何用正则表达式去掉html标签

如何用正则表达式去掉html标签

php正则,去掉除html标签外的所有空格/换行符等特殊字符?注:html标签内可能会有属性

java 去掉html标签(Java中去掉网页HTML标记的方法 )--正则表达式

php 正则匹配HTML标签以外的匹配词 并且不匹配A标签中的匹配词

java去掉字段中的html标签