C 语言是如何用 16 点阵方法输出汉字的?
到目前为止,我们编写的 C 程序,其用于人机交互的提示或菜单都是英文
的,那么如何在没有汉化的 Turbo C 集成开发环境下编制显示汉字的程序呢?
解决这一编程问题,我们首先必须了解有关汉字编码及字库的知识。根据对汉字使
用频率的研究,可把汉字分成高频字(约 100 个),常用字(约 3000 个),次常用字(约 4000 个),
罕见字(约 8000 个)和死字(约 45000 个),即正常使用的汉字达 15000 个。我国 1981 年公布
了《通讯用汉字字符集(基本集)及其交换码标准》GB2312-80 方案,把高频字、常用字、和
次常用字集合成汉字基本字符集(共 6763 个),在该集中按汉字使用的频度,又将其分为一
级汉字 3755 个(按拼音排序)、二级汉字 3008 个(按部首排序),再加上西文字母、数字、图
形符号等 700 个。
汉字编码:
区位码
国家标准的汉字字符集(GB2312—80)在汉字操作系统中是以汉字库的形式提供的。汉
字库结构作了统一规定,即将字库分成 94 个区,每个区有 94 个汉字(以
位作区别)每一个汉字在汉字库中有确定的区和位编号(用两个字节),这就是所谓的区位码
(区位码的第一个字节表示区号,第二个字节表示位号,因而只要知道了区位码,就可知道
该汉字在字库中的地址,每个汉字在字库中是以点阵字模形式存储的,如一般采用 16×16
点阵形式,每个点用一个二进位表示,存 1 的点,当显示时,可以在屏上显示一个亮点,存
0 的点,则在屏上不显示,这样把存某字的 16×16 点阵信息直接用来在显示器上按上述原
则显示,则将出现对应的汉字。
内码
汉字使用两字节表示,国家制定了统一标准,称为国标码。国标码规定,每个字节使用
后面 7 位,第一位为 0。为了区别于英文的 ASCII 码,国标码在计算机上使用的时候,规定
汉字每个字节第一位设置为 1,以表示该两字节为汉字,称为内码。以“大”字为例子:
国标码 3473H: 0 0 1 1 0 1 0 0 0 1 1 1 0 0 1 1
内码 B4F3H: 1 0 1 1 0 1 0 0 1 1 1 1 0 0 1 1
国标码与内码有一定的转换公式,即 16 进制的区位码,两个字节各加 80H,就成为了
国标码。
汉字字模在字库中存放的位置根据汉字的区位码来确定,内码是汉字在机内的表示。由
于区位码和内码存在固定的转换关系,所以当在支持汉字输入的系统中,键盘输入的汉字内
码即在程序中存在,将其转换为区位码,再从字库中找到对应的汉字字模,然后再用有关的
位操作和循环语句,对每个字节的每一位进行判断,如同过滤一样,如果某位是 1,则按设
置的颜色在屏幕的相应位置画点(用 graphics.h 中的显示象素点的函数 putpixel()),若某位
为 0,则不画点,这样就可按预先设置的颜色在相应位置显示出该汉字来。
内码到区位码的转换
若汉字内码为十六进制数 h2h1l2l1,则区号 qh 相位号 wh 分别为:
qh= h2h1-0xa0;
wh= l2l1-0xa0;
若用十进制表示内码为 dld2,则
qh=dl-l60;
wh=d2-160;
即区位码 qw 为:
qw=100*(d1-160)十(d2-160);
反过来,若已经知道了区位码 qw。则也可求得区号和位号:
qh=qw/100;
wh=qw-100*qh;
因而该汉字在汉字库中离起点的偏移位置(以字节为单位),可计算为:
offset=(94*(qh-1)+(wh-1))* 32;
注意:字库中每 1 区有 94 个字符。
这样,就可以找寻到文件的偏移量,读出一个 char bytes[32]数组。这样 bytes 数组中则
存了要显示汉字的 16×16 点阵字模,然后将字模按行扫描的办法,通过循环用 putpixel()函
数在屏幕设定位置显示出象点,因而组合成一个显示的汉字。
在 C 语言中显示汉字
在许多 C 程序设计中,要用到汉字进行提示或人机交互,而现行的 Turbo C 集成开发环境不是汉化的,如何编制
能显示汉字的 C 程序呢?
下面的方法可以帮你在西文环境下显示汉字。这种方法是调用中文汉字库进行汉字显示。国家标准规定:汉字
库分 94 个区,每个区有 94 个汉字(以位作区别),每个汉字在汉字库中有确定的区和位编号,这就是汉字的区位码。
每个汉字在库中是以点阵字模形式存储的,一般采用 16×16 点阵(32 字节)、24×24 点阵(72 字节),每个点用一
个二进制位(0 或 1)表示,对应在屏幕上显示出来,就是相应的汉字。
由于在中文环境下,输入的是汉字的内码,我们必须将之转换成区位码,算出偏移量,从字库中找到对应的汉
字,将其字模显示即可。
内码转换成区位码方法如下:
qh=c1-0xa0 wh=c2-0xa0
其区位码就是:
qw=qh*0xff+wh
该汉字在字库中离起点的位置是:
offset=(94*(qh-1)+(wh-1))*32L
程序例:
#include 〈graphics.h〉
#include 〈stdio.h〉
#include 〈fcntl.h〉
#include 〈io.h〉
#include 〈stdlib.h〉
#include 〈conio.h〉
#define ROW 1
//纵坐标放大倍数
#define COL 2
//横坐标放大倍数
void main()
{
int x,y;
char *s=″汉字显示程序″;
FILE *fp;
char buffer[32];
//buffer 用来存储一个汉字
register m,n,i,j,k;
unsigned char qh,wh;
unsigned long offset;
int gd=DETECT,gm;
//图形屏幕初始化
initgraph(&gd,&gm,″ ″);
if ((fp=fopen(″hzk16″,″rb″))==NULL)
//打开汉字库,该字库可以在 ucdos 中找到
{ printf(″Can’t open haz16,Please add it″);
getch(); closegraph(); exit(0);
}
x=20; y=100; //显示位置设置
while(*s)
{ qh=*(s)-0xa0; //汉字区位码
wh=*(s+1)-0xa0;
offset=(94*(qh-1)+(wh-1))*32L;
//计算该汉字在字库中偏移量
fseek(fp,offset,SEEK_SET);
fread(buffer,32,1,fp); //取出汉字 32 字节的点阵字模存入 buffer 中(一个汉字)
for (i=0;i〈16;i++)
//将 32 位字节的点阵按位在屏幕上打印出来(1:打印,0:不打印),显示汉字
for(n=0;n〈ROW;n++)
for(j=0;j〈2;j++)
for(k=0;k〈8;k++)
for(m=0;m〈COL;m++)
if (((buffer[i*2+j]〉〉(7-k))&0x1)!=NULL)
putpixel(x+8*j*COL+k*COL+m,y+i*ROW+n,GREEN);
s+=2; //因为一个汉字内码占用两个字节,所以 s 必须加 2
x+=30;
}
getch();
closegraph();
}
上述程序在 Turbo C 2.0 编译系统下运行成功,它可以将汉字放大显示,读者可以将它改成函数用在您的程序中
显示汉字。