|
|
汉字信息电脑存储比英文节省一半(可编辑) |
|
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/4/2 12:35:28 | 【字体:小 大】 |
河南洛阳人任雪电脑新时代汉字不再落后,其处理效率已经反超英文(其一)电脑新时代汉字不再落后,其处理效率已经反超英文(其一) 在工业时代,在使用铅字的时候,汉字的机械化处理,诸如机械打字、四码电报、铅活字排版印刷,都显著地落后于英文。这是催生汉字落后论的一个重要社会技术原因。1995 年,铅字被淘汰了,电脑打字、网络通信、计算机激光照排取代了繁难、低效的机械打字、四码电报、铅活字排版印刷。这时候汉字依然落后吗?有一些人,包括一些权威的语文学家和管理者,他们认为:电脑产生在使用拉丁字母的西方国家,电脑最适合使用拼音文字的西方,我们实现汉字电脑化处理,花费、开销比西...
电脑新时代汉字不再落后,其处理效率已经反超英文(其一)电脑新时代汉字不再落后,其处理效率已经反超英文(其一)在工业时代,在使用铅字的时候,汉字的机械化处理,诸如机械打字、四码电报、铅活字排版印刷,都显著地落后于英文。这是催生汉字落后论的一个重要社会技术原因。1995 年,铅字被淘汰了,电脑打字、网络通信、计算机激光照排取代了繁难、低效的机械打字、四码电报、铅活字排版印刷。这时候汉字依然落后吗?有一些人,包括一些权威的语文学家和管理者,他们认为:电脑产生在使用拉丁字母的西方国家,电脑最适合使用拼音文字的西方,我们实现汉字电脑化处理,花费、开销比西方大得多,效率差得多。本文作者想在这里指出:这种认识是没有根据的,是不符合实际的。实际上,汉字的电脑化处理不再比英文落后、繁难,其处理效率实际上一节实现了对英文的反超。汉字信息电脑存储汉字信息电脑存储‐‐‐‐从沉重负担到比英文节省一半从沉重负担到比英文节省一半全文参见u/2579145677汉英两种文字信息处理中,占用电脑存贮量的比较是个带有重要性的问题。许多作者在比较汉、 英文字属性优劣时, 在论及汉字发展前途时都谈到这个问题。一种观点认为:汉字字量大,结构复杂;一个汉字占两个字节;汉字字库比英文字库大得多;故而用计算机表示、存贮、加工都要耗费比英文大得多的存贮量,是计算机的沉重负担,并认为这是古老的汉字不能适应信息新技术的一个证据。另一种观点则认为:汉字简明、准确、信息量大,这些优点在电脑文字信息处理中也一定带来许多好处。哪一种看法更正确?我们具体分析如下。1. 字形的点阵表示字形的点阵表示 计算机的打印输出和荧光屏显示,从上个世纪 70 年代中期以来,已经完全摆脱了金属铅字,使用数字化点阵表示。就字形点阵表示、存贮来说,汉字确实要比英文至少多消耗数百倍、甚至数千倍的存储。例如显示英文,最低可用 7×9 点表示一个字符。显示汉字最低需用 16×16 点。英文字符总量取为 100(实际上 Ascii 可见字符为 94 个) ,汉字取为 7000。那么汉、英字形库占用存贮量分别为: 汉字字库:16×16×7000 点英文字库:7×9×100 点简单计算可知:此处汉字字形存贮量是英文的 284 倍。由于汉字结构复杂,同一种点阵规模, 汉字字形视觉区分质量比英文差。 如果取英文的点阵规模为n×n,汉字的为(2n)×(2n) ,英文仍取 100 个字符,汉字取五万个字符。那么汉字字库: (2n)×(2n)×50000 点英文字库: n×n×100 点此时比值为 2000,即这种汉字字形存贮量为英文的 2000 倍。这里所用的单位“点” ,对应着计算机存贮的最小单位:二进制位。16×16 点阵 7000 个汉字所占计算机存贮,用计算机术语说,占 1750K位=218KB(K 字节)0.2MB(兆字节) 。24*24 点阵 7000 个汉字所占计算机存贮量为 4032000 位=504000 字节=504KB(K 字节)0.5MB(兆字节) 。这里 K=1024,近似于 1000;M=K*K,近似于一百万;G=K*K*K,近似于十亿;T=K*K*K*K,近似于万亿。就是说,KB 近似于一千字节;MB 近似于一百万字节;GB 近似于十亿字节;TB 近似于万亿字节。一个字节等于 8 个二进制位。
|
|
 栏目文章
|
|
|