互联网上的中文编码主要有三种:一种是“国标码”(GB),主要是大陆和新加坡等使用简体汉字的地区使用;一种是“大五码”(BIG5),主要是台、港、澳等使用繁体汉字的地区使用;第三种是“HZ码”,主要在海外华人和留学生中使用。GB码用两个ASCⅡ码加首位“1”来表示一个汉字(即双字节8位编码),当它在互联网上用“简单邮政传输协议”(SMTP)传输时,要用Uudecode编码后再传输,同样,到达终点后要用Uudecode解码——这样难免会在编码、解码过程中出现乱码现象。HZ码则只使用两个ASCⅡ码来表示一个汉字(即双字节7位编码),但这样容易将中文与英文及符号搞混,于是,它在“汉字群”的前后分别加上“逃出码”(用“~}”表示)和“逃入码”(用“~{”表示),即在“逃出码”和“逃入码”之间的ASCⅡ码表示的是汉字,其余的ASCⅡ码仍然表示英文或符号。这样,整个中文文件在网络上传输时,从表面上看俨然是一个标准的ASCⅡ码文件,既不容易出错,也与绝大多数英文软件兼容。这是HZ码最大的优点。黎广祥提出HZ码的最初设想,并与魏亚桂一起提出了初的“ZW”(“中文”的拼音字头)汉字输入方案,为互联网早期的汉字传输作出了重要贡献。其后,斯坦福大学的李枫峰,参照日文的类似方案,提出了更完善的“HZ码”方案。
但是贡献最大的当属魏亚桂。他八十年代到美国印第安那大学留学,先在生物系学习,后转入计算机系。他的重要贡献表现在三个方面:㈠、和黎广祥一起完善了上述HZ码的设想;㈡、他于1989年8~11月间开发出了输入和显示HZ码的汉字处理软件ZWDOS第一版(后有升级版本);㈢、他在美国印第安那大学的系统管理员Steve Mosier先生的帮助下,于1992年6月28日在Usenet上建立了一个新闻组Alt.Chinese.Text,即大名鼎鼎的ACT。
万里长城今不在,只见当年的秦始皇:-) 把老魏和领馆侨务组搅在一起多好:-)
|