外来字符的电子邮件验证

Posted

技术标签:

【中文标题】外来字符的电子邮件验证【英文标题】:Email validation for exotic characters 【发布时间】:2016-07-08 05:23:27 【问题描述】:

似乎 Grails 中的电子邮件验证只是应用了simple regex。虽然它会验证大多数电子邮件,但某些特殊但经过授权的字符会使验证失败。

例如使用了德语 ß 字符 in some email addresses,但不会通过 grail 验证:

package com.stuff.user.AppUser

import grails.test.mixin.Mock
import spock.lang.Specification

/**
 * Created by hschoonjans on 21/03/2016.
 */
@Mock(AppUser)
class AppUserSpec extends Specification 

    def "It doesn't validate an email with an eszett"() 
        given:
        AppUser user = new AppUser(email: "helainß@hotmail.com")

        expect:
        !user.validate(["email"])
    

使用自定义正则表达式进行验证,授权 ß 将是微不足道的,但如果用户尝试在其邮件地址中使用另一个奇异但有效的字符怎么办?

为了避免这个问题,我想知道有哪些 Java/Groovy/Grails 通用电子邮件地址验证器。一个类/正则表达式,可以验证任何有效的电子邮件地址,比当前的 Grails 电子邮件验证更智能。

【问题讨论】:

【参考方案1】:

我之前在自己的 Grails 项目中曾多次遇到过这种情况,并且使用这个 RegEx 取得了相当大的成功:

/^((([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`\|~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+(\.([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`\|~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+)*)|((\x22)((((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(([\x01-\x08\x0b\x0c\x0e-\x1f\x7f]|\x21|[\x23-\x5b]|[\x5d-\x7e]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(\\([\x01-\x09\x0b\x0c\x0d-\x7f]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF]))))*(((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(\x22)))@((([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.)+(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.?$/i

【讨论】:

嘿@Joshua!你能提供更多关于你的正则表达式是什么或这个正则表达式的来源的信息吗?我想确保它不能匹配无效的 url,并更多地了解它接受的电子邮件地址范围...... 嗯,这是对 RFC822 (ietf.org/rfc/rfc0822.txt?number=822) 的最大努力,它在过去 18 年中在我工作的公司中有机地发展起来。它尝试为国际客户处理扩展的 ASCII 字符,多年来我们没有收到过有效电子邮件地址被拒绝的投诉。我建议您使用一些示例数据对其进行测试,并验证结果是否符合您的期望。把整个事情分成一部分并解释它几乎需要一本迷你书;) 非常感谢,我会尽快找到一个生成器来从正则表达式中获取字符串,它会让我了解它可以处理的电子邮件类型 :)

以上是关于外来字符的电子邮件验证的主要内容,如果未能解决你的问题,请参考以下文章

针对无效字符验证电子邮件地址

在 iOS 的电子邮件中验证域中的字符数?

从字符串生成 6 位数字(用于电子邮件验证)

Grails:验证包含分隔的电子邮件地址列表的字符串

在 JSON 中存储电子邮件验证正则表达式字符串

不使用正则表达式的 Java 电子邮件验证