JAVA中汉字转拼音的方法

Posted 技术宅de小坑

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了JAVA中汉字转拼音的方法相关的知识,希望对你有一定的参考价值。

  JAVA中汉字转拼音的方法并不复杂,可以使用pinyin4j包来实现。

 

一、下载pinyin4j的架包,并导入项目中,如下:

如果是maven项目,maven依赖如下:

1 <dependency>
2     <groupId>com.belerweb</groupId>
3     <artifactId>pinyin4j</artifactId>
4     <version>2.5.0</version>
5 </dependency>

 

二、汉字转拼音方法,附上代码例子,如下:

 1 public class PinyinUtil {
 2 
 3     public static void main(String[] args) throws Exception {
 4         System.out.println(getPinyin("haha你笑起来真好看", " "));
 5         System.out.println(getPinyinInitials("你笑起来真好看"));
 6     }
 7 
 8     /**
 9      * 将汉字转换为全拼
10      *
11      * @param text 文本
12      * @param separator 分隔符
13      * @return {@link String}
14      */
15     public static String getPinyin(String text, String separator) {
16         char[] chars = text.toCharArray();
17         HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
18         // 设置大小写
19         format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
20         // 设置声调表示方法
21         format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
22         // 设置字母u表示方法
23         format.setVCharType(HanyuPinyinVCharType.WITH_V);
24         String[] s;
25         String rs = StringUtils.EMPTY;
26         try {
27             StringBuilder sb = new StringBuilder();
28             for (int i = 0; i < chars.length; i++) {
29                 // 判断是否为汉字字符
30                 if (String.valueOf(chars[i]).matches("[\\\\u4E00-\\\\u9FA5]+")) {
31                     s = PinyinHelper.toHanyuPinyinStringArray(chars[i], format);
32                     if (s != null) {
33                         sb.append(s[0]).append(separator);
34                         continue;
35                     }
36                 }
37                 sb.append(String.valueOf(chars[i]));
38                 if ((i + 1 >= chars.length) || String.valueOf(chars[i + 1]).matches("[\\\\u4E00-\\\\u9FA5]+")) {
39                     sb.append(separator);
40                 }
41             }
42             rs = sb.substring(0, sb.length() - 1);
43         } catch (BadHanyuPinyinOutputFormatCombination e) {
44             e.printStackTrace();
45         }
46         return rs;
47     }
48 
49     /**
50      * 获取汉字首字母
51      *
52      * @param text 文本
53      * @return {@link String}
54      */
55     public static String getPinyinInitials(String text) {
56         StringBuilder sb = new StringBuilder();
57         for (int i = 0; i < text.length(); i++) {
58             char ch = text.charAt(i);
59             String[] s = PinyinHelper.toHanyuPinyinStringArray(ch);
60             if (s != null) {
61                 sb.append(s[0].charAt(0));
62             } else {
63                 sb.append(ch);
64             }
65         }
66         return sb.toString();
67     }
68 }

其中,拼音格式参数说明:

HanyuPinyinCaseType 设置拼音的大小写 LOWERCASE 小写
UPPERCASE 大写
HanyuPinyinToneType 设置拼音的音调 WITH_TONE_NUMBER 用数字表示音调。如:wo3
WITHOUT_TONE 不表示音调。如:wo
WITH_TONE_MARK 用符号表示音调。如:wŏ
HanyuPinyinVCharType 设置拼音的表示方法 WITH_U_AND_COLON 用字母u和冒号表示。如:lu:
WITH_V 用字母v表示。如:lv
WITH_U_UNICODE 用Unicode编码表示。如:lü

 

PS:这里有一个注意的点,就是音调和表示方法是配合使用的,所以用符号表示音调的时候,只能使用Unicode编码的方法显示,如果设置其他两种表示方式会报错。

格式效果:

     表示方法
WITH_U_AND_COLON WITH_V WITH_U_UNICODE
声调 WITH_TONE_NUMBER lu3 lv lü3
WITHOUT_TONE lu lv3
WITH_TONE_MARK Exception Exception

 

三、使用效果如下:

文本:haha你笑起来真好看

全拼:haha ni xiao qi lai zhen hao kan

首字母:nxqlzhk

 

 

 

 

以上是关于JAVA中汉字转拼音的方法的主要内容,如果未能解决你的问题,请参考以下文章

java怎么根据汉字获取字的拼音首字母

Java汉字转拼音(解决方案)

Java汉字转拼音(解决方案)

Java汉字转拼音(解决方案)

java汉字转拼音工具类

汉字转拼音的Java类库——JPinyin