IOS使用正则表达式去掉html中的标签元素,获得纯文本
Posted 开心刘哈哈
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了IOS使用正则表达式去掉html中的标签元素,获得纯文本相关的知识,希望对你有一定的参考价值。
ios使用正则表达式去掉html中的标签元素,获得纯文本
content是根据网址获得的网页源码字符串
NSRegularExpression
*regularExpretion=[
NSRegularExpression
regularExpressionWithPattern
:
@"<[^>]*>|\n"
options
:
0
error
:nil
];
content=[regularExpretion
stringByReplacingMatchesInString
:content
options
:
NSMatchingReportProgress
range
:NSMakeRange(
0
, content
.length
)
withTemplate
:
@"-"
];
//替换所有html和换行匹配元素为"-"
regularExpretion=[
NSRegularExpression
regularExpressionWithPattern
:
@"-{1,}"
options
:
0
error
:nil
] ;
content=[regularExpretion
stringByReplacingMatchesInString
:content
options
:
NSMatchingReportProgress
range
:NSMakeRange(
0
, content
.length
)
withTemplate
:
@"-"
];
//把多个"-"匹配为一个"-"
//根据"-"分割到数组
NSArray
*arr=[
NSArray
array
];
content=[
NSString
stringWithString
:content];
arr = [content
componentsSeparatedByString
:
@"-"
];
NSMutableArray
*marr=[
NSMutableArray
arrayWithArray
:arr];
[marr
removeObject
:
@""
];
return
marr;
以上是关于IOS使用正则表达式去掉html中的标签元素,获得纯文本的主要内容,如果未能解决你的问题,请参考以下文章
php正则,去掉除html标签外的所有空格/换行符等特殊字符?注:html标签内可能会有属性
java 去掉html标签(Java中去掉网页HTML标记的方法 )--正则表达式