笔记关于汉字注音 汉字转拼音,首拼

Posted WebEnh

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了笔记关于汉字注音 汉字转拼音,首拼相关的知识,希望对你有一定的参考价值。

最近想做一个快速搜索的功能,例如QQ通讯录通过数字键速查联系人

首先要把联系人姓名转化为拼音,然后再进行匹配

  1、利用微软提供的拼音库,计算出汉字的拼音的方法,此方法支持多音字符

  下载 Visual Studio International Pack类库,该类库扩展了.NET Framework对全球化软件开发的支持 

下载地址:http://www.microsoft.com/downloads/details.aspx?FamilyID=44cac7f0-633b-477d-aed2-99aee642fc10&DisplayLang=zh-cn

  解压得到CHSPinYinConv.msi(拼音类库) 和 CHSPinYinConv.msi(简繁体类),安装(记住安装路径)

  在项目中添加引用,把ChnCharInfo.dll 引入进来

  添加命名空间,具体用法看VS的提示,这里只是演示

       using Microsoft.International.Converters.PinYinConverter;
复制代码
        private string ToPinyin(string hanzi)
        {
            char[] ch = hanzi.ToArray();
            string pinyinStr = "";
            foreach (char c in ch)
            {
                if (ChineseChar.IsValidChar(c))
                {
                    ChineseChar chineseChar = new ChineseChar(c);
                    ReadOnlyCollection<string> pinyin = chineseChar.Pinyins;
                    pinyinStr += (pinyin[0].Substring(0, pinyin[0].Length - 1));
                }
                else
                {
                    pinyinStr += c.ToString();
                }
            }
            return pinyinStr.ToLower();
        }
复制代码

 

   2、第二种注音的方法(不支持多音字符)

  这种方法是根据中文的编码方式计算出来的,具体的编码的话大家自行查阅,这里讲类的定义

public class ChineseCharUtil
    {
        #region private
        static Hashtable ht = null;
        static Hashtable Ht
        {
            get
            {
                if (ht == null)
                {
                    ht = new Hashtable();
                    ht.Add(-20319, "a");
                    ht.Add(-20317, "ai"); ht.Add(-20304, "an"); ht.Add(-20295, "ang");
                    ht.Add(-20292, "ao"); ht.Add(-20283, "ba"); ht.Add(-20265, "bai");
                    ht.Add(-20257, "ban"); ht.Add(-20242, "bang"); ht.Add(-20230, "bao");
                    ht.Add(-20051, "bei"); ht.Add(-20036, "ben"); ht.Add(-20032, "beng");
                    ht.Add(-20026, "bi"); ht.Add(-20002, "bian"); ht.Add(-19990, "biao");
                    ht.Add(-19986, "bie"); ht.Add(-19982, "bin"); ht.Add(-19976, "bing");
                    ht.Add(-19805, "bo"); ht.Add(-19784, "bu"); ht.Add(-19775, "ca");
                    ht.Add(-19774, "cai"); ht.Add(-19763, "can"); ht.Add(-19756, "cang");
                    ht.Add(-19751, "cao"); ht.Add(-19746, "ce"); ht.Add(-19741, "ceng");
                    ht.Add(-19739, "cha"); ht.Add(-19728, "chai"); ht.Add(-19725, "chan");
                    ht.Add(-19715, "chang"); ht.Add(-19540, "chao"); ht.Add(-19531, "che");
                    ht.Add(-19525, "chen"); ht.Add(-19515, "cheng"); ht.Add(-19500, "chi");
                    ht.Add(-19484, "chong"); ht.Add(-19479, "chou"); ht.Add(-19467, "chu");
                    ht.Add(-19289, "chuai"); ht.Add(-19288, "chuan"); ht.Add(-19281, "chuang");
                    ht.Add(-19275, "chui"); ht.Add(-19270, "chun"); ht.Add(-19263, "chuo");
                    ht.Add(-19261, "ci"); ht.Add(-19249, "cong"); ht.Add(-19243, "cou");
                    ht.Add(-19242, "cu"); ht.Add(-19238, "cuan"); ht.Add(-19235, "cui");
                    ht.Add(-19227, "cun"); ht.Add(-19224, "cuo"); ht.Add(-19218, "da");
                    ht.Add(-19212, "dai"); ht.Add(-19038, "dan"); ht.Add(-19023, "dang");
                    ht.Add(-19018, "dao"); ht.Add(-19006, "de"); ht.Add(-19003, "deng");
                    ht.Add(-18996, "di"); ht.Add(-18977, "dian"); ht.Add(-18961, "diao");
                    ht.Add(-18952, "die"); ht.Add(-18783, "ding"); ht.Add(-18774, "diu");
                    ht.Add(-18773, "dong"); ht.Add(-18763, "dou"); ht.Add(-18756, "du");
                    ht.Add(-18741, "duan"); ht.Add(-18735, "dui"); ht.Add(-18731, "dun");
                    ht.Add(-18722, "duo"); ht.Add(-18710, "e"); ht.Add(-18697, "en");
                    ht.Add(-18696, "er"); ht.Add(-18526, "fa"); ht.Add(-18518, "fan");
                    ht.Add(-18501, "fang"); ht.Add(-18490, "fei"); ht.Add(-18478, "fen");
                    ht.Add(-18463, "feng"); ht.Add(-18448, "fo"); ht.Add(-18447, "fou");
                    ht.Add(-18446, "fu"); ht.Add(-18239, "ga"); ht.Add(-18237, "gai");
                    ht.Add(-18231, "gan"); ht.Add(-18220, "gang"); ht.Add(-18211, "gao");
                    ht.Add(-18201, "ge"); ht.Add(-18184, "gei"); ht.Add(-18183, "gen");
                    ht.Add(-18181, "geng"); ht.Add(-18012, "gong"); ht.Add(-17997, "gou");
                    ht.Add(-17988, "gu"); ht.Add(-17970, "gua"); ht.Add(-17964, "guai");
                    ht.Add(-17961, "guan"); ht.Add(-17950, "guang"); ht.Add(-17947, "gui");
                    ht.Add(-17931, "gun"); ht.Add(-17928, "guo"); ht.Add(-17922, "ha");
                    ht.Add(-17759, "hai"); ht.Add(-17752, "han"); ht.Add(-17733, "hang");
                    ht.Add(-17730, "hao"); ht.Add(-17721, "he"); ht.Add(-17703, "hei");
                    ht.Add(-17701, "hen"); ht.Add(-17697, "heng"); ht.Add(-17692, "hong");
                    ht.Add(-17683, "hou"); ht.Add(-17676, "hu"); ht.Add(-17496, "hua");
                    ht.Add(-17487, "huai"); ht.Add(-17482, "huan"); ht.Add(-17468, "huang");
                    ht.Add(-17454, "hui"); ht.Add(-17433, "hun"); ht.Add(-17427, "huo");
                    ht.Add(-17417, "ji"); ht.Add(-17202, "jia"); ht.Add(-17185, "jian");
                    ht.Add(-16983, "jiang"); ht.Add(-16970, "jiao"); ht.Add(-16942, "jie");
                    ht.Add(-16915, "jin"); ht.Add(-16733, "jing"); ht.Add(-16708, "jiong");
                    ht.Add(-16706, "jiu"); ht.Add(-16689, "ju"); ht.Add(-16664, "juan");
                    ht.Add(-16657, "jue"); ht.Add(-16647, "jun"); ht.Add(-16474, "ka");
                    ht.Add(-16470, "kai"); ht.Add(-16465, "kan"); ht.Add(-16459, "kang");
                    ht.Add(-16452, "kao"); ht.Add(-16448, "ke"); ht.Add(-16433, "ken");
                    ht.Add(-16429, "keng"); ht.Add(-16427, "kong"); ht.Add(-16423, "kou");
                    ht.Add(-16419, "ku"); ht.Add(-16412, "kua"); ht.Add(-16407, "kuai");
                    ht.Add(-16403, "kuan"); ht.Add(-16401, "kuang"); ht.Add(-16393, "kui");
                    ht.Add(-16220, "kun"); ht.Add(-16216, "kuo"); ht.Add(-16212, "la");
                    ht.Add(-16205, "lai"); ht.Add(-16202, "lan"); ht.Add(-16187, "lang");
                    ht.Add(-16180, "lao"); ht.Add(-16171, "le"); ht.Add(-16169, "lei");
                    ht.Add(-16158, "leng"); ht.Add(-16155, "li"); ht.Add(-15959, "lia");
                    ht.Add(-15958, "lian"); ht.Add(-15944, "liang"); ht.Add(-15933, "liao");
                    ht.Add(-15920, "lie"); ht.Add(-15915, "lin"); ht.Add(-15903, "ling");
                    ht.Add(-15889, "liu"); ht.Add(-15878, "long"); ht.Add(-15707, "lou");
                    ht.Add(-15701, "lu"); ht.Add(-15681, "lv"); ht.Add(-15667, "luan");
                    ht.Add(-15661, "lue"); ht.Add(-15659, "lun"); ht.Add(-15652, "luo");
                    ht.Add(-15640, "ma"); ht.Add(-15631, "mai"); ht.Add(-15625, "man");
                    ht.Add(-15454, "mang"); ht.Add(-15448, "mao"); ht.Add(-15436, "me");
                    ht.Add(-15435, "mei"); ht.Add(-15419, "men"); ht.Add(-15416, "meng");
                    ht.Add(-15408, "mi"); ht.Add(-15394, "mian"); ht.Add(-15385, "miao");
                    ht.Add(-15377, "mie"); ht.Add(-15375, "min"); ht.Add(-15369, "ming");
                    ht.Add(-15363, "miu"); ht.Add(-15362, "mo"); ht.Add(-15183, "mou");
                    ht.Add(-15180, "mu"); ht.Add(-15165, "na"); ht.Add(-15158, "nai");
                    ht.Add(-15153, "nan"); ht.Add(-15150, "nang"); ht.Add(-15149, "nao");
                    ht.Add(-15144, "ne"); ht.Add(-15143, "nei"); ht.Add(-15141, "nen");
                    ht.Add(-15140, "neng"); ht.Add(-15139, "ni"); ht.Add(-15128, "nian");
                    ht.Add(-15121, "niang"); ht.Add(-15119, "niao"); ht.Add(-15117, "nie");
                    ht.Add(-15110, "nin"); ht.Add(-15109, "ning"); ht.Add(-14941, "niu");
                    ht.Add(-14937, "nong"); ht.Add(-14933, "nu"); ht.Add(-14930, "nv");
                    ht.Add(-14929, "nuan"); ht.Add(-14928, "nue"); ht.Add(-14926, "nuo");
                    ht.Add(-14922, "o"); ht.Add(-14921, "ou"); ht.Add(-14914, "pa");
                    ht.Add(-14908, "pai"); ht.Add(-14902, "pan"); ht.Add(-14894, "pang");
                    ht.Add(-14889, "pao"); ht.Add(-14882, "pei"); ht.Add(-14873, "pen");
                    ht.Add(-14871, "peng"); ht.Add(-14857, "pi"); ht.Add(-14678, "pian");
                    ht.Add(-14674, "piao"); ht.Add(-14670, "pie"); ht.Add(-14668, "pin");
                    ht.Add(-14663, "ping"); ht.Add(-14654, "po"); ht.Add(-14645, "pu");
                    ht.Add(-14630, "qi"); ht.Add(-14594, "qia"); ht.Add(-14429, "qian");
                    ht.Add(-14407, "qiang"); ht.Add(-14399, "qiao"); ht.Add(-14384, "qie");
                    ht.Add(-14379, "qin"); ht.Add(-14368, "qing"); ht.Add(-14355, "qiong");
                    ht.Add(-14353, "qiu"); ht.Add(-14345, "qu"); ht.Add(-14170, "quan");
                    ht.Add(-14159, "que"); ht.Add(-14151, "qun"); ht.Add(-14149, "ran");
                    ht.Add(-14145, "rang"); ht.Add(-14140, "rao"); ht.Add(-14137, "re");
                    ht.Add(-14135, "ren"); ht.Add(-14125, "reng"); ht.Add(-14123, "ri");
                    ht.Add(-14122, "rong"); ht.Add(-14112, "rou"); ht.Add(-以上是关于笔记关于汉字注音 汉字转拼音,首拼的主要内容,如果未能解决你的问题,请参考以下文章

C#汉字转拼音(支持多音字)

C#汉字转拼音(支持多音字)

如何自动给汉字加拼音

pypinyin显示音调数字

超简单 Python 汉字拼音转换工具

超简单 Python 汉字拼音转换工具