Big5Code.txt
上传用户:dyjieshui
上传日期:2021-01-24
资源大小:1427k
文件大小:5k
源码类别:

多国语言处理

开发平台:

Visual C++

  1. (***)
  2.                                 BIG-5 字符集 
  3.  
  4.       BIG-5 码是通行于台湾、香港地区的一个繁体字编码方案,俗称“大五码 
  5.   ”。它并不是一个法定的编码方案,存在着一些瑕疵,业界的评价也不高,但它 
  6.   广泛地被应用于电脑业,尤其是国际互联网中,从而成为一种事实上的行业标 
  7.   准。 
  8.       关于 BIG-5 码的背景,一直未见详细记载,兹据我掌握的资料,介绍如下: 
  9.       1983 年 10 月,台湾国家科学委员会、教育部国语推行委员会、中央标准 
  10.   局、行政院主计处电子资料处理中心共同制定了《通用汉字标准交换码》 
  11.   (Chinese Ideographic Standard Code for Information Interchange,简称 
  12.   CISCII 码),经试用修订,1986 年 8 月 4 日由台湾中央标准局公布为法定标 
  13.   准,标准编号为 CNS 11643。这一标准于 1992 年 5 月 21 日重新修订公布,更 
  14.   名为《中文标准交换码》(Chinese Standard Interchange Code)。1995 年 1 
  15.   月 4 日,台湾中央标准局又公布了 CNS 11643-1《中文标准交换码使用方法》。 
  16.       BIG-5 码是 1984 年台湾资讯工业策进会根据《通用汉字标准交换码》制订 
  17.   的编码方案。至于为何称“BIG-5”,则未闻其详。 
  18.       Big-5 是一个双字节编码方案,其第一字节的值在 16 进制的 A0~FE 之间, 
  19.   第二字节在 40~7E 和 A1~FE 之间。因此,其第一字节的最高位是 1,第二字节 
  20.   的最高位则可能是 1,也可能是 0。 
  21.       Big-5 码的图形符号及汉字,基本与 CNS 11643 标准的第一、第二字面  
  22.   (Plane)一致,它收录 13461 个符号和汉字,包括: 
  23.       1. 符号 408 个,编码位置为 A140~A3FE(实际止于 A3BF,末尾有空白位 
  24.   置)。 
  25.       2. 汉字 13053 个,分为常用字和次常用字两部分,各部分中的汉字按笔划 
  26.   /部首排列。其中: 
  27.       a. 常用字 5401 个,编码位置为 A440~C67E。包括台湾教育部颁布的《常 
  28.   用国字标准字体表》中的全部汉字 4808 个,台湾国中国小教科书常用字 587 个, 
  29.   异体字 6 个。 
  30.       b. 次常用字 7652 个,编码位置为 C940~F9FE(实际止于 F9D5,末尾有空 
  31.   白位置)。包括台湾教育部《次常用国字标准字体表》的全部汉字 6341 个,《罕 
  32.   用国字标准字体表》中使用频率较高的字 1311 个。 
  33.       其余的 A040~A0FE、C6A1~C8FE、FA40~FEFE 为空白区域。一些空白位 
  34.   置,经常被用于用户造字区,而且多存放香港常用字和粤语方言字。 
  35.       现在流行的 BIG-5 码字库,在 F9D6~F9DC 位置大都有 7 个常用字,据说 
  36.   为倚天系统所增。若计此 7 字,则全数为 13060 个汉字,13468 个汉字和符 
  37.   号。此外,一些 BIG-5 码字库,如 Windows 繁体中文版的 True Type 细明体 
  38.   (华康科技提供,2.0 版),在 F9DD~F9FE 位置还有 33 个制表符和 1 个“ 
  39.   ■”符号。 
  40.  
  41.       Big-5 字集发表后,学者陆续发现了一些纰漏,有些纰漏在修订后的 CNS 
  42.   11643 中已得到更正。详细的情况可参见台湾中央大学单维彰先生的个人网站 
  43.   (地址见本页末)。 
  44.  
  45.   注: 
  46.       1. 代码表使用 BIG-5 代码编制。如果你使用外挂的中文平台,需要将当前 
  47.   环境设置成为中文 BIG5 繁体来浏览。一些外挂中文平台无法完全正确显示代码 
  48.   表的内容。 
  49.       2. 如果你使用 Windows 95 简体中文版(或更高的版本)+ 微软公司提供的 
  50.   繁体字支持,则个别字符无法显示或显示错误,如数字“3”、汉字“龙”等等。 
  51.   此外一些上述的空白区域,会显示出非 BIG-5 码原有的字符。 
  52.       3. 如果你使用 Windows 95 中文版(或更高的版本)+ Netsgape Navigator, 
  53.   则在 A040~A07E 位置会显示出非 BIG-5 码原有的符号。 
  54.  
  55.  
  56.   相关资料: 
  57.       1. 台湾国立中央大学数学系 单维彰教授的个人网站。 
  58.          (http://www.math.ncu.edu.tw/~shann) 
  59.       2. 台湾行政院研究发展考核委员会《政府机关资讯处理共通规范使用指引》 
  60.   第三章《正式规范使用指引》第一节第一部分 《中文标准交换码(CSIC)》。 
  61.   (http://www.rdec.gov.tw/secr/ipcs-h1/311.htm) 
  62.       3. 台湾行政院主计处电子处理资料中心“CNS 11643 中文标准交换码”介绍。 
  63.   (http://www.dgbasey.gov.tw/eyimc/switch2/sw2_5/code.html#cns1164) 
  64.       4. 台湾《经济情势暨评论季刊》第一卷第四期(1996 年 2 月) 彭清一文 
  65.   《国家资讯基础及通信国家标准之建立》。 
  66.   (http://www.moea.gov.tw/~ecobook/season/sa314.htm) 
  67.       5. 台湾教育部“国语推行委员会”(http://www.moe.gov.tw/mandr/index.htm) 
  68.   业务介绍 《国字标准字体母稿制作与推广》。 
  69.   (http://www.moe.gov.tw/mandr/business/1-3-6.html) 
  70.       6. 在一些 FTP 站点中,存放有用于 DOS、Windows 3.x 的符合“国字标准 
  71.   字体”的 BIG-5 字库文件。如: 
  72.     moers4.edu.tw/chinese-pub/chinese-sys/kuh 
  73.     ftp.cuhk.edu.hk/.1/chinese/ifcss/software/fonts/big5/misc/kuh 
  74.       ftp.fedu.uec.ac.jp/pub/china/software/ftp.ifcss.org/fonts/big5/misc/kuh 
  75.       ftp.kreonet.re.kr/.3/hangul/mirrors/ccic.ifcss.org/fonts/big5/misc/kuh 
  76.     ftp.lrz-muenchen.de/pub/culture/east-asia/sw/Fonts/C/big5/misc/kuh 
  77. (***)
  78. ================================================================
  79.                        Big5 字符集编码标准
  80. ================================================================
  81. 1.空白
  82.   A040 - A07E : 63 个汉字
  83.   A0A1 - A0FE : 94 个汉字
  84. 2.符号
  85.   A140 - A3FE : ( 63 + 94 ) x 3[ A3 - A1 + 1 ] = 471 个汉字
  86. 3.常用字
  87.   A440 - C5FE : ( 63 + 94 ) x 34[ C5 - A4 + 1 ] = 5338 个汉字
  88.   C640 - C67E : 63 个汉字
  89. 4.空白
  90.   C6A1 - C6FE : 94 个汉字
  91.   C740 - C8FE : ( 63 + 94 ) x 2[ C8 - C7 + 1 ] = 314 个汉字
  92. 5.次常用字
  93.   C940 - F9FE : ( 63 + 94 ) x 49[ F9 - C9 + 1 ] = 7693 个汉字
  94. 6.空白
  95.   FA40 - FEFE : ( 63 + 94 ) x 5[ FE - FA + 1 ] = 785 个汉字
  96. ================================================================
  97. * BIG5字符集中可收集字符总数
  98.   ( 63 + 94 ) x 94[ FE - A0 + 1 ] = 14915
  99. ================================================================