2.1/2.2字符的编码方式及显示

Posted huangdengtao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2.1/2.2字符的编码方式及显示相关的知识,希望对你有一定的参考价值。

1.字符集

ASCII码

一字节;包括英文数字这些符号

GB2312编码

汉字为两字节;与ASCII码兼容,后来扩展汉字又有了GBK编码

Unicode编码

包括中,日,韩,英文等格式;有Utf-32,Utf-16,Utf-8三种格式
Utf-32:每个字符都采用4字节(32bit),缺点浪费空间
Utf-16(错一个字符则整个乱码):每个字符的长度为2字节(16bit),常用
Utf-8(容错能力强):每个字符的长度为1~4字节,越常用的字符越短

一般一个文件的开头都会有标志,通过16进制编辑文件便可看到
Utf-8: EF BB BF
Utf-16:FE FE
Utf-32:FF FE
没有前缀的表示ANSI格式(GBK)

2.文件的格式不同,执行的结果也不同

3.如何解决文件格式不同,编码也不同的问题?

eg:
    gcc -finput-charset=GBK -fexec-charset=UTF-8 -o utf-8_2 ansi.c
    告诉gcc编译器该文件是GBK编码,需要转换为UTF-8编码后在编译
    注:
        -finput-charset= ?        // 表示源文件的编码格式,默认UTF-8
        -fexec-charset= ?         // 表示可执行程序里的字以什么方式表示,默认UTF-8

4.点阵显示

说明:

这里字符选用8*16(内核中有),汉字HZK16*16(自己找库)
链接:https://pan.baidu.com/s/1Lp-xL_8qPZt3-q8oXGPVIw 
提取码:1yh5 

linux下默认UTF-8,所以我们需要将输入的UTF-8转换为GBK才能使用HZK这个库

5.关键函数

LCD操作相关
    ioctl(fd_fb, FBIOGET_VSCREENINFO, &var)
        获得LCD的可变信息,x,y分辨率像素位,成功返回0;
    ioctl(fd_fb, FBIOGET_FSCREENINFO, &fix)
        获得LCD的固定信息,缓存地址,每行字节数,成功返回0;
内存映射
    void *mmap(void *addr, size_t length, int prot, int flags,int fd, off_t offset);
        申请一段用户空间的内存区域,并映射到内核空间的某个内存区域
        我们申请一块内存映射到fb0文件,然后应用程序直接向内存写数据即可直接写入fb0文件(显存地址)
        返回值:失败返回-1,并设置errno。成功返回映射的地址。若指定了start,则返回0;
        start:需要映射的内存其实地址,通常填NULL。让系统自动分配映射地址。
        lenght:映射地址的大小,填LCD显存字节数即可
        prot:对映射地址的保护(protect)方式
            PROT_EXEC    映射区域可被执行
            PROT_READ    映射区域可被读取
            PROT_WRITE   映射区域可被写入
            PROT_NONE    映射区域不可访问
        flag:填 MAP_SHARED即可,表示共享此映射地址,对其它进程可见。
        fb:需要将内存映射到那个文件描述符(以后便可通过内存来操作该文件)
        offset:映射偏移值,填0即可
取消内存映射
    int munmap(void *start, size_t lenght);
        返回值:成功返回0;失败返回-1,并设置errno
文件大小查看
    int fstat(int fd, struct stat *buf);

6.ASCII码字库文件使用

在si里搜索font,找到内核有个font_8x16.c文件(位于drivers/video/console)
技术图片

注:这里描点时是从右到左的描

7.HZK16汉字库文件使用

HZK16描述

HZK16是按分区表排列的点阵文件,由于每个汉字是2字节,每个字节的点阵是8*16.
所以HZK16里的每个汉字点阵大小:2*8*16=32字节.

编码解析(以“中”为例)

中的GBK编码为D6 D0
转为分区表(每字节减去A1): 35 2F(区码和位码都是从A1开始的)
所以中的点阵位于:
(35*94+2F)*32~(35*94+2F)*32+31     //94: 每个区占据94个汉字   32:每个汉字点阵为32字节
因为区码是从A1开始的所以35前面的区码中的汉字,加上现在区码中位码表示的汉字即可表示出位置

8.代码解析

#include <sys/mman.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <unistd.h>
#include <linux/fb.h>
#include <fcntl.h>
#include <stdio.h>
#include <string.h>

#define FONTDATAMAX 4096

static const unsigned char fontdata_8x16[FONTDATAMAX] = {
/*    英文编码    */      
};

int fd_fb;
struct fb_var_screeninfo var;   /* Current var */
struct fb_fix_screeninfo fix;   /* Current fix */
int screen_size;
unsigned char *fbmem;
unsigned int line_width;
unsigned int pixel_width;

int fd_hzk16;
struct stat hzk_stat;
unsigned char *hzkmem;



/* color : 0x00RRGGBB */
void lcd_put_pixel(int x, int y, unsigned int color)
{
    unsigned char *pen_8 = fbmem+y*line_width+x*pixel_width;
    unsigned short *pen_16; 
    unsigned int *pen_32;   

    unsigned int red, green, blue;  

    pen_16 = (unsigned short *)pen_8;
    pen_32 = (unsigned int *)pen_8;

    switch (var.bits_per_pixel)
    {
        case 8:
        {
            *pen_8 = color;
            break;
        }
        case 16:
        {
            /* 565 */
            red   = (color >> 16) & 0xff;
            green = (color >> 8) & 0xff;
            blue  = (color >> 0) & 0xff;
            color = ((red >> 3) << 11) | ((green >> 2) << 5) | (blue >> 3);
            *pen_16 = color;
            break;
        }
        case 32:
        {
            *pen_32 = color;
            break;
        }
        default:
        {
            printf("can't surport %dbpp
", var.bits_per_pixel);
            break;
        }
    }
}

void lcd_put_ascii(int x, int y, unsigned char c)
{
    unsigned char *dots = (unsigned char *)&fontdata_8x16[c*16];
    int i, b;
    unsigned char byte;

    for (i = 0; i < 16; i++)
    {
        byte = dots[i];
        for (b = 7; b >= 0; b--)
        {
            if (byte & (1<<b))
            {
                /* show */
                lcd_put_pixel(x+7-b, y+i, 0xffffff); /* 白 */
            }
            else
            {
                /* hide */
                lcd_put_pixel(x+7-b, y+i, 0); /* 黑 */
            }
        }
    }
}

void lcd_put_chinese(int x, int y, unsigned char *str)
{
    unsigned int area  = str[0] - 0xA1;
    unsigned int where = str[1] - 0xA1;
    unsigned char *dots = hzkmem + (area * 94 + where)*32;
    unsigned char byte;

    int i, j, b;
    for (i = 0; i < 16; i++)
        for (j = 0; j < 2; j++)
        {
            byte = dots[i*2 + j];
            for (b = 7; b >=0; b--)
            {
                if (byte & (1<<b))
                {
                    /* show */
                    lcd_put_pixel(x+j*8+7-b, y+i, 0xffffff); /* 白 */
                }
                else
                {
                    /* hide */
                    lcd_put_pixel(x+j*8+7-b, y+i, 0); /* 黑 */
                }
                
            }
        }
    
}

int main(int argc, char **argv)
{
    unsigned char str[] = "中";
    

    fd_fb = open("/dev/fb0", O_RDWR);
    if (fd_fb < 0)
    {
        printf("can't open /dev/fb0
");
        return -1;
    }

    if (ioctl(fd_fb, FBIOGET_VSCREENINFO, &var))
    {
        printf("can't get var
");
        return -1;
    }

    if (ioctl(fd_fb, FBIOGET_FSCREENINFO, &fix))
    {
        printf("can't get fix
");
        return -1;
    }

    line_width  = var.xres * var.bits_per_pixel / 8;
    pixel_width = var.bits_per_pixel / 8;
    screen_size = var.xres * var.yres * var.bits_per_pixel / 8;
    fbmem = (unsigned char *)mmap(NULL , screen_size, PROT_READ | PROT_WRITE, MAP_SHARED, fd_fb, 0);
    if (fbmem == (unsigned char *)-1)
    {
        printf("can't mmap
");
        return -1;
    }

    fd_hzk16 = open("HZK16", O_RDONLY);
    if (fd_hzk16 < 0)
    {
        printf("can't open HZK16
");
        return -1;
    }
    if(fstat(fd_hzk16, &hzk_stat))
    {
        printf("can't get fstat
");
        return -1;
    }
    hzkmem = (unsigned char *)mmap(NULL , hzk_stat.st_size, PROT_READ, MAP_SHARED, fd_hzk16, 0);
    if (hzkmem == (unsigned char *)-1)
    {
        printf("can't mmap for hzk16
");
        return -1;
    }

    /* 清屏: 全部设为黑色 */
    memset(fbmem, 0, screen_size);

    lcd_put_ascii(var.xres/2, var.yres/2, 'A');

    printf("chinese code: %02x %02x
", str[0], str[1]);
    lcd_put_chinese(var.xres/2 + 8,  var.yres/2, str);

    return 0;   
}

以上是关于2.1/2.2字符的编码方式及显示的主要内容,如果未能解决你的问题,请参考以下文章

python---字符编码

在ASCII码字符编码中,啥字符无法显示或打印出来

http请求方式分类及区别

如何以正确的方式编码和解码字符[重复]

bash的配置文件及字符串处

将代码片段插入数据库并在 textarea 中以相同方式显示