怎样判断一个字符是否汉字呢??

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎样判断一个字符是否汉字呢??相关的知识,希望对你有一定的参考价值。

我要读取一个文本文件,限制到richedit里边,但是我只想显示一部分,怎样判断截取断点部分是不是完整汉字呢?如果不是完整汉字的话,后面的会是乱码的,所以我需要景区的判断。

看你用什么编译,c++ 的string 有重写过 是有个接口直接判断中英文 具体原理是:

汉字是占2个字节,字母和数字是1个字节,而且汉字的2个字节的ASCII码都大于128,字母和数字的字节都小于128

都变成Unicode编码,就简单了,编码大于0x00ff的都不是ASC码。

简单点的,根据它的ASCII值来进行判断。
找到GB,GBK的编码范围,只要在中间的即是汉字,前提条件,是在中文系统中运行的这个软件,如果在其他双字节字符的系统中运行,肯定要出错:)。

提供一段伪代码

AnsiString s = "我爱中国,I love china";
WideString ws;
ws=s;
AnsiString temps;
for (int i=1;i<=ws.Length();i++)

temps = WideString(ws[i]);
if(temps.Length()>=2)
ShowMessage("["+temps+"]中文");
else
ShowMessage("["+temps+"]英文");
参考技术A 是不是汉字,那要看你采用的是啥编码,查一下你所使用的文字编码是啥,然后每个字符都有一个相对应的数值,对这数值进行判断就可以了。 有个规律是,大凡是中文,都是双字节的,在u编码中,是以这样的形式出现的:\uxxxx,而非汉字呢,都是单字节的,大都是以这样的形式出现的:\u00xx,这个可以给你参考。 参考技术B 汉字在Unicode中称作CJK 统一表意符号 (CJK Unified Ideographs),包括U+3400-U+4DBF/U+4E00-U+9FFF/U+20000-U+3FFFD,参见百度百科【统一码】。 参考技术C if (preg_match("/^.*[".chr(0xa1)."-".chr(0xff)."]+.*$/", $_line))
continue;

Delphi 判断是不是汉字

参考技术A 单字节字符:mbSingleByte  双字节字符首字节:mbLeadByte

//判断字符串第500位是不是汉字如果是截取的时候+1位或者-1位

uses SysUtils;

if ByteType(stt,500)=mbLeadByte then 

xxx;

以上是关于怎样判断一个字符是否汉字呢??的主要内容,如果未能解决你的问题,请参考以下文章

c语言中怎样判断一行中是不是有汉字

Delphi 判断是不是汉字

PHP判断数字,汉字和英文

求sql语句,怎样查询一个表中都是汉字的记录

Delphi判断字符串中是否包含汉字,并返回汉字位置

Delphi判断字符串中是否包含汉字,并返回汉字位置