Java 解决Emoji表情过滤问题

Posted shenhaha

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java 解决Emoji表情过滤问题相关的知识,希望对你有一定的参考价值。

 

Emoji表情从三方数据中获取没有过滤,导致存入DB的时候报错。

原因:

UTF-8编码有可能是两个、三个、四个字节。Emoji表情是4个字节,而mysql的utf8编码最多3个字节,所以数据插不进去。

 

 

方法1.将已经建好的表也转换成utf8mb4

 

2,写个工具类:过滤掉emoji表情符号


public class EmojiFilter {


private static boolean isEmojiCharacter(char codePoint) {
return (codePoint == 0x0) || (codePoint == 0x9) || (codePoint == 0xA)
|| (codePoint == 0xD)
|| ((codePoint >= 0x20) && (codePoint <= 0xD7FF))
|| ((codePoint >= 0xE000) && (codePoint <= 0xFFFD))
|| ((codePoint >= 0x10000) && (codePoint <= 0x10FFFF));
}

/**
* 过滤emoji 或者 其他非文字类型的字符
*
* @param source
* @return
*/
public static String filterEmoji(String source) {
if (StringUtils.isBlank(source)) {
return source;
}
StringBuilder buf = null;
int len = source.length();
for (int i = 0; i < len; i++) {
char codePoint = source.charAt(i);
if (isEmojiCharacter(codePoint)) {
if (buf == null) {
buf = new StringBuilder(source.length());
}
buf.append(codePoint);
}
}
if (buf == null) {
return source;
} else {
if (buf.length() == len) {
buf = null;
return source;
} else {
return buf.toString();
}
}
}

3,使用别人封装的一个类,专门解决emoji问题的。这个在git上有开源的代码。在pom工程中引入(最方便)

<dependency>
<groupId>com.vdurmont</groupId>
<artifactId>emoji-java</artifactId>
<version>4.0.0</version>
</dependency>

 

 

如果帮助到你,给点鼓励点个推荐吧亲

以上是关于Java 解决Emoji表情过滤问题的主要内容,如果未能解决你的问题,请参考以下文章

python 怎么过滤 emoji 表情符号

求php过滤ios的Emoji表情的方法,如果字符串中包含Emoji表情就删除。

JAVA过滤emoji表情包

python 怎么过滤 emoji 表情符号

java处理数据库不支持的emoji表情符

python emoji 表情过滤