干货 | IPv6正则表达式攻略
Posted 中兴开发者社区
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了干货 | IPv6正则表达式攻略相关的知识,希望对你有一定的参考价值。
每天读一篇一线开发者原创好文
【摘要】
多个市场要求无线4G网管全面支持IPv6,在开发过程中,遇到大量需要做IPv6校验的地方,本文通过正则表达式解决IPv6校验的问题,来介绍正则表达式最基本的用法,帮助大家入门,打消对正则表达式的心理恐惧。
【关键词】
IPv6,正则表达式
1 背景
在学习正则表达式时,有一个美式笑话:
“Some people, when confronted with a problem, think “I know, I’ll use regular expressions.” Now they have two problems.”
当你意识到一个问题可以用正则表达式来解决时,你就有两个问题了,因为正则表达式本身就是一个big problem。2012年6月6日,全球范围内的IPv6网络正式启动,IPv6的应用已经是大势所趋。本文通过正则表达式解决IPv6校验的问题,来介绍正则表达式最基本的用法,帮助大家入门。
2 实践情况
2.1 正则表达式特殊字符说明
正则字符包括保留字(. ^ $ * + ? { } [ ] ( ) \ | )和其它字符,下面列出最常用的正则表达式特殊字符的详细含义:
下边列举了由字符 '\' 和另一个字符组成的特殊含义。注意,'\' + 元字符的组合可以解除元字符的特殊功能
2.2 正则表达式特殊字符的4个角色
为方便记忆,可以按字符的功能,分为4个角色:
2.3 常用正则表达式
2.4 正则表达式在高级语言中的应用
以python中的re模块和java中的java.util.regex为例,做一个对比,展示正则表达式在高级语言中的一些常用用法。
2.5 IPv4表示法
250-255:三位数,百位是2,十位是5,个位是0~5,用正则表达式可以写成:25[0-5]
200-249:三位数,百位是2,十位是0~4,个位是0~9,用正则表达式可以写成:2[0-4]\d
0-199:这个可以继续分拆:
l 0-9: 一位数,个位是0~9,用正则表达式可以写成:\d
l 10-99: 二位数,十位是1~9,个位是0~9,用正则表达式可以写成:[1-9]\d
l 100-199:三位数,百位是1,十位是0~9,个位是0~9,用正则表达式可以写成:1\d{2}
于是0-99的正则表达式可以合写为[1-9]?\d,那么0-199用正则表达式就可以写成(1\d{2})|([1-9]?\d),这样0~255的正则表达式就可以写成(25[0-5]|2[0-4]\d|((1\d{2})|([1-9]?\d)))
2.6 IPv6表示法
标准十六进制表示法(包括前导0省略) | 纯数字格式: | ([0-9A-Fa-f]{1,4}:){7}([0-9A-Fa-f]{1,4}|:) |
2001:0008:0009:0023:0008:0800:8888:9999 | ||
纯字母格式: | ||
ABCD:ABCD:ABCD:ABCD:ABCD:ABCD:ABCD:ABCD | ||
数字和字母混合格式: | ||
ABCD:EF01:2345:6789:ABCD:EF01:2345:6789 | ||
格式中前面带0: | ||
2001:0DB8:0000:0023:0008:0800:200C:417A | ||
格式中前面每一位为0: | ||
0001:0DB8:0000:0023:0008:0800:000C:017A | ||
全0: | ||
0000:0000:0000:0000:0000:0000:0000:0000 | ||
多位0在中间:如fec0:1:0:0:0:0:0:1234 | ||
多位0在前面:如0:0:0:0:0:1234:fec0:1 | ||
多位0在最后:如1234:fec0:1:0:0:0:0:0 | ||
全0: 0:0:0:0:0:0:0:0 | ||
全0: 0:000:0:0:0:0:0:0 | ||
全0: 0:00:0:0:0:0:0:0 | ||
全0:0:0000:0:0:0:0:0:0 | ||
前导0省略位置遍历 | ||
1个位置前导0省略: | ||
ABCD:EF01:2345:6789:ABCD:EF01:2345:1 | ||
ABCD:EF01:2345:6789:ABCD:EF01:2:9999 | ||
ABCD:EF01:2345:6789:ABCD:2:EF01:9999 | ||
ABCD:EF01:2345:6789:2:ABCD:EF01:9999 | ||
ABCD:EF01:2345:2:6789:ABCD:EF01:9999 | ||
ABCD:EF01:2:2345:6789:ABCD:EF01:9999 | ||
ABCD:2:EF01:2345:6789:ABCD:EF01:9999 | ||
2:ABCD:EF01:2345:6789:ABCD:EF01:9999 | ||
其他前导0省略情况: | ||
89:DB8:0:23:8:800:C:417 | ||
89:DB8:0:23:8:800:0C:417 | ||
89:DB8:0:23:8:800:00C:417 | ||
89:DB8:0:23:8:800:000C:417 | ||
2001:DB8:0:23:8:800:000C:417A | ||
0位压缩表示法 | ABCD:EF01:2345:6789:ABCD:EF01:8.8.8.9 | (([0-9A-Fa-f]{1,4}:){6}(((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:[0-9A-Fa-f]{1,4}|:)) |
(左起有6个位置用标准16进制表示) | ABCD:EF01:2345:6789:ABCD:EF01::EF01 | |
ABCD:EF01:2345:6789:ABCD:EF01:: | ||
0位压缩表示法 | ABCD:EF01:2345:6789:ABCD::8.8.8.9 | (([0-9A-Fa-f]{1,4}:){5}(:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|((:[0-9A-Fa-f]{1,4}){1,2})|:)) |
(左起有5个位置用标准16进制表示) | ABCD:EF01:2345:6789:ABCD::EF01 | |
ABCD:EF01:2345:6789:ABCD::EF01:EF01 | ||
ABCD:EF01:2345:6789:ABCD:: | ||
0位压缩表示法 | ABCD:EF01:2345:6789::EF01:8.8.8.9 | (([0-9A-Fa-f]{1,4}:){4}(((:[0-9A-Fa-f]{1,4})?:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9A-Fa-f]{1,4}){1,3})|:)) |
(左起有4个位置用标准16进制表示) | ABCD:EF01:2345:6789::8.8.8.9 | |
ABCD:EF01:2345:6789::EF01 | ||
ABCD:EF01:2345:6789::EF01:EF01 | ||
ABCD:EF01:2345:6789::EF01:EF01:EF01 | ||
ABCD:EF01:2345:6789:: | ||
0位压缩表示法 | ABCD:EF01:2345::8.8.8.9 | (([0-9A-Fa-f]{1,4}:){3}(((:[0-9A-Fa-f]{1,4}){0,2}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9A-Fa-f]{1,4}){1,4})|:)) |
(左起有3个位置用标准16进制表示) | ABCD:EF01:2345::EF01:8.8.8.9 | |
ABCD:EF01:2345::EF01:EF01:8.8.8.9 | ||
ABCD:EF01:2345::EF01 | ||
ABCD:EF01:2345::EF01:EF01 | ||
ABCD:EF01:2345::EF01:EF01:EF01 | ||
ABCD:EF01:2345::EF01:EF01:EF01:EF01 | ||
ABCD:EF01:2345:: | ||
0位压缩表示法 | ABCD:EF01::8.8.8.9 | (([0-9A-Fa-f]{1,4}:){2}(((:[0-9A-Fa-f]{1,4}){0,3}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9A-Fa-f]{1,4}){1,5})|:)) |
(左起有2个位置用标准16进制表示) | ABCD:EF01::EF01:8.8.8.9 | |
ABCD:EF01::EF01:EF01:8.8.8.9 | ||
ABCD:EF01::EF01:EF01:EF01:8.8.8.9 | ||
ABCD:EF01::EF01 | ||
ABCD:EF01::EF01:EF01 | ||
ABCD:EF01::EF01:EF01:EF01 | ||
ABCD:EF01::EF01:EF01:EF01:EF01 | ||
ABCD:EF01::EF01:EF01:EF01:EF01:EF01 | ||
ABCD:EF01:: | ||
0位压缩表示法 | ABCD::8.8.8.9 | (([0-9A-Fa-f]{1,4}:){1}(((:[0-9A-Fa-f]{1,4}){0,4}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9A-Fa-f]{1,4}){1,6})|:)) |
(左起有1个位置用标准16进制表示) | ABCD::EF01:8.8.8.9 | |
ABCD::EF01:EF01:8.8.8.9 | ||
ABCD::EF01:EF01:EF01:8.8.8.9 | ||
ABCD::EF01:EF01:EF01:EF01:8.8.8.9 | ||
ABCD::EF01 | ||
ABCD::EF01:EF01 | ||
ABCD::EF01:EF01:EF01 | ||
ABCD::EF01:EF01:EF01:EF01 | ||
ABCD::EF01:EF01:EF01:EF01:EF01 | ||
ABCD::EF01:EF01:EF01:EF01:EF01:EF01 | ||
ABCD:: | ||
0位压缩表示法 | ::8.8.8.9 | (:(((:[0-9A-Fa-f]{1,4}){0,5}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|((:[0-9A-Fa-f]{1,4}){1,7})|:)) |
(左起开始压缩) | ::EF01:8.8.8.9 | |
::EF01:EF01:8.8.8.9 | ||
::EF01:EF01:EF01:8.8.8.9 | ||
::EF01:EF01:EF01:EF01:8.8.8.9 | ||
::EF01:EF01:EF01:EF01:EF01:8.8.8.9 | ||
::EF01 | ||
::EF01:EF01 | ||
::EF01:EF01:EF01 | ||
::EF01:EF01:EF01:EF01 | ||
::EF01:EF01:EF01:EF01:EF01 | ||
::EF01:EF01:EF01:EF01:EF01:EF01 | ||
::EF01:EF01:EF01:EF01:EF01:EF01:EF01 | ||
:: |
3 效果评价
对于日常开发中只接触IPv4,并没有深入研究过正则表达式的开发者,面对IPv6和正则表达式,容易产生畏惧心理,觉得是两座难以翻越的大山。本文通过一些表格整理对IPv6的表示方法,以及正则表达式的特殊符号进行了分类和说明,带领大家快速入门IPv6和正则表达式。
4 推广建议
本文所述IPv6正则表达式已经过测试,可以直接拿到各个高级语言中应用。
5 参考资料
无。
以上是关于干货 | IPv6正则表达式攻略的主要内容,如果未能解决你的问题,请参考以下文章