使用的GB 2312字库,是我国第一个简体中文字符集的国家标准,于1980年,由中国国家标准总局发布,1981年5月1日实施。”
“它的准确全称,是叫做《信息交换用汉字编码字符集基本集》,其中规定了6763个汉字,以及682个非汉字图形。”篱
“与西方文字不同,汉字是表意文字,成千上万的不同含义需要成千上万的不同汉字来表示。西方文字主要是拼音文字,通过几十个字母的组合就可以变出成千上万的单词。在计算机里面,西方文字只需要给几十个字母编码就够了,而每一个汉字都要一个编码才行。”
“随着时代的进步和发展,GB2312已经满足不了应用的需要,比如‘镕’字现在是高频率使用字,而 GB 2312却没有为它编码,因而**、新闻、出版、印刷等行业和部门,在使用中感到十分不便。”
“所以说,随着信息技术的发展,GB2312的6763个汉字,已经不能再满足人们使用要求。”
“而对于蜀大中文系,历史系,图书馆这些单位来说,六千多个汉字,更是难以满足信息数字化的需要。”
“最近,国际标准化组织下属编码字符集工作组,研制了一套新的编码字符集标准,叫做ISO/IEC 10646。”
会议室里又是一阵惊呼。
之前说的那些都是实际情况介绍,只要是稍微有点兴趣的人,翻翻资料,都能够说得出来。篱
可是ISO/IEC 10646国际标准则是国际标准化组织刚刚提出来的,而且到现在都只颁布了一部分,这孩子已经接触到前沿信息了。
周至继续说道:“这是一个针对多文种处理的编码字符集标准,目的是对世界上的所有文字统一编码,以实现世界上所有文字在计算机上的统一处理。”
“理论上以此为基础,我们能构建出一个在信息技术工程上通用的多八位编码字符集,搭建出一个多文种的基本编码体系结构。”
会议室里已经有人忍不住举起了手来,打断了周至的发言:“周至同学,你是从哪里知道我们国家正在根据ISO/IEC10646标准,准备搭建多文种基本编码体系结构的?”
“推测啊,”周至说道:“既然GB2312已经不敷使用,自然就需要拓展;正好ISO/IEC 10646国际标准化字符集已经出台,给了汉字内码相当大的拓展空间,因此我们自然就可以根据这个制