正则表达式巧妙实现字符串去重

Posted 十九万里

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式巧妙实现字符串去重相关的知识,希望对你有一定的参考价值。

今天上午看到新浪的一个面试题:

将字符串 "adsfjjbkk"处理,就是连一起重复的字符删除,变成“adsfjbk”,写出实现代码。
当然了,实现思路有很多。但是如果你用正则实现出来的话,估计会给你加分不少。下面我实现如下:
对于去除简单的相邻重复的情况,我们可以用正则实现如下:

var str = “adsfjjbkk”;
// \\1匹配第一个子串
// 只去除连续重复
console.log(str.replace(/(.)(\\1)+/g,function($1,$2,$3){
return $2;
}));// adsfjbk

但是,如果现在需求变了,要求只保留重复字符串的第一次出现的串,如对于字符串"adaaasfjjjbkk"去重后需为:
“adsfjbk”

我们该如何实现呢?

注意到\\1是匹配第一个子表达式(正则中第一个括号内的值),replace()方法中的回调函数的参数第一个为匹配的整个子串,而从第二个开始一次为匹配的第一个、第二个…子表达式匹配的值。只要稍微变更一下,就能得出结果。

代码实现如下:

var str = “adaaasfjjjbkk”;
// 只保留第一次出现的重复串
console.error(str.replace(/(.).*(\\1)/g,function($1,$2,$3){
// 第一个参数匹配整个匹配值,从第二个开始是匹配的子串
$1 = $2+$1.substring(1).replace(new RegExp($2,‘g’),’’);
return $1;
}));

如果结合js里的hash来实现,其实也很简单。类似于统计一个数组里每个字符或字符串出现的次数一样,实现如下:

var str = “adaaasfjjjbkk”;
var helper = {},
res = ‘’;
for(var i=0,sub;sub=str.charAt(i);i++){
if(helper[sub]){
helper[sub] = ++helper[sub];
continue;
}
helper[sub] = 1;
res += sub;
}
console.info(res);

但是始终你会感觉到,用正则实现就是爽!

以上是关于正则表达式巧妙实现字符串去重的主要内容,如果未能解决你的问题,请参考以下文章

Python中正则表达式的巧妙使用

Python中正则表达式的巧妙使用

吃通javascript正则表达式

(4.3)数组对象及类数组对象,set的用法,正则表达式的常用方法,蓝桥杯备赛-(生成数组数组去重实现模板字符串的解析新课上线啦)

oracle10g中,如何查询正则表达式匹配指定字符串的匹配个数?

5.2.1 正则表达式语法与子模式扩展语法