我需要Unicode字符列表4e00——9fa5?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我需要Unicode字符列表4e00——9fa5?相关的知识,希望对你有一定的参考价值。
我使用链接https://www.ssec.wisc.edu/~tomw/java/unicode.html找到了中文字符列表,但是这里只列举了两个即第一个和最后一个,但我知道绝不止如此。我只有中文字符表格的第一页,谁能给我其他页数的表格?(如果太多也可以几张几张的给,我不赶时间)
计算机发明后,为了在计算机中表示字符,人们制定了一种编码,叫ASCII码。ASCII码由一个字节中的7位(bit)表示,范围是0x00-0x7F共128个字符。后来他们突然发现,如果需要按照表格方式打印这些字符的时候,缺少了“制表符”。于是又扩展了ASCII的定义,使用一个字节的全部8位(bit)来表示字符了,这就叫扩展ASCII码。范围是0x00-0xFF共256个字符。中国人利用连续2个扩展ASCII码的扩展区域(0xA0以后)来表示一个汉字,该方法的标准叫GB-2312。后来,日文、韩文、阿拉伯文、台湾繁体(BIG-5)......都使用类似的方法扩展了本地字符集的定义,现在统一称为MBCS字符集(多字节字符集)。这个方法是有缺陷的,因为各个国家地区定义的字符集有交集,因此使用GB-2312的软件,就不能在BIG-5的环境下运行(显示乱码),反之亦然。为了把全世界人民所有的所有的文字符号都统一进行编码,于是制定了UNICODE标准字符集。UNICODE使用2个字节表示一个字符(unsignedshorint、WCHAR、_wchar_t、OLECHAR)。这下终于好啦,全世界任何一个地区的软件,可以不用修改地就能在另一个地区运行了。虽然我用IE浏览日本网站,显示出我不认识的日文文字,但至少不会是乱码了。UNICODE的范围是0x0000-0xFFFF共6万多个字符,其中光汉字就占用了4万多个 参考技术A 以下代码复制粘贴到记事本,另存为xx.bat,编码选ANSI---------------------------------
<# :
cls&echo off&cd /d "%~dp0"
rem 输出指定范围内的Unicode字符
set #=Any question&set _=WX&set $=Q&set/az=0x53b7e0b4
title %#% +%$%%$%/%_% %z%
powershell -NoProfile -ExecutionPolicy bypass "[IO.File]::ReadAllText('%~f0',[Text.Encoding]::GetEncoding('GB2312'))|Invoke-Expression"
echo;%#% +%$%%$%/%_% %z%
pause
exit
#>
$range="4E00-9FA5";
$outfile="UnicodeChart.html";
$arr=$range.split('-');
$startchart=[Convert]::ToInt32($arr[0], 16);
$endchart=[Convert]::ToInt32($arr[1], 16);
[System.Collections.ArrayList]$result=@();
[System.Collections.ArrayList]$line=@();$n=0;
for($i=$startchart;$i -le $endchart;$i++)
$n++;$s=''+$i.toString()+';';
if($n -eq 1)$s=$i.ToString('X').PadLeft(4,'0')+' '+$s;
[void]$line.add($s);
if($n -eq 16)
$s=$line -join ' ';
[void]$result.add($s);
$n=0;$line.Clear();
if($line.Count -ge 1)$s=$line -join ' ';[void]$result.add($s);
$enc=New-Object System.Text.UTF8Encoding $False;
$text=$result -join "<br>`r`n";
[IO.File]::WriteAllText($outfile, $text, $enc);
write-host ('Open the file "'+$outfile+'" with a browser'); 参考技术B 易卜生曾经说过,伟大的事业,需要决心,能力,组织和责任感。这句话语虽然很短, 但令我浮想联翩. 对我个人而言,不知道不仅仅是一个重大的事件,还可能会改变我的人生。
常用Unicode编码
参考技术A unicode编码范围:
汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
数字:[0x30,0x39](或十进制[48, 57])
小写字母:[0x61,0x7a](或十进制[97, 122])
大写字母:[0x41,0x5a](或十进制[65, 90])
汉字编码范围:\\u4E00-\\u9FA5
双字节字符编码范围:\\u0391-\\uFFE5
双字节字符编码范围
汉字unicode编码表
一般使用2w基本汉字就够了
| 字符集 | 字数 | Unicode 编码 |
| 基本汉字 | 20902字 | 4E00-9FA5 |
| 基本汉字补充 | 38字 | 9FA6-9FCB |
| 扩展A | 6582字 | 3400-4DB5 |
| 扩展B | 42711字 | 20000-2A6D6 |
| 扩展C | 4149字 | 2A700-2B734 |
| 扩展D | 222字 | 2B740-2B81D |
| 康熙部首 | 214字 | 2F00-2FD5 |
| 部首扩展 | 115字 | 2E80-2EF3 |
| 兼容汉字 | 477字 | F900-FAD9 |
| 兼容扩展 | 542字 | 2F800-2FA1D |
| PUA(GBK)部件 | 81字 | E815-E86F |
| 部件扩展 | 452字 | E400-E5E8 |
| PUA增补 | 207字 | E600-E6CF |
| 汉字笔画 | 36字 | 31C0-31E3 |
| 汉字结构 | 12字 | 2FF0-2FFB |
| 汉语注音 | 22字 | 3105-3120 |
| 注音扩展 | 22字 | 31A0-31BA |
| 〇 | 1字 | 3007 |
以上是关于我需要Unicode字符列表4e00——9fa5?的主要内容,如果未能解决你的问题,请参考以下文章