1975年,岁月不饶人,王选已38岁,接近不惑之年,年轮也在他脸上刻下了比别人更多的东西。因为喘息,甚至在两肋有深纹。别看只有38岁,王选几乎有一种特殊年龄,不老,但也不年轻,身体虚弱,但眼睛放光,自有了陈堃銶后再没熄过。甚至有时亮得出奇,似乎把全身的火焰都集中在了自己的眼睛上,比如工作时,查阅资料时。当然,由于过分集中在眼睛,别处也有时更显虚弱。换句话说,他能调动全身的火焰,但却只能拆东墙补西墙,无法达到整个身体的平衡。然而,正是这样一个拆东墙补西墙的身体却灵敏地感觉到那个时代最重要的东西、革命性的东西:
r1971年,英特尔研制出世界上第一块四位字长微处理器4004;1974年英特尔再度推出比4004快20倍的微处理器8080;同年美国MITS公司利用8080设计出世界第一台微型电子计算机,预示着革命性的微机时代的到来。然而,计算机是西方人发明的,建立在英文基础上,对中国而言简直是另一星球的事,高不可攀:古老的已经使用了几千年并且还在使用的象形文字汉字,能进入微机编码吗?显然不可能——这几乎是一种常识的常识;很多人认为汉字太落后了,已经是人类之外的文字——这也是微机时代到来许多所谓有识之士普遍的共识。但王选不这么看,至少把这看成挑战。他是干什么的?就是为解决这事而来,他的奇妙而晦涩的身体这么多年来在一种特殊的运行中,已拥有了某种东西,而这东西仿佛就是上帝为汉字文明准备的。
r1974年春暖花开时,北大有了一台电子计算机,不想闲着,这朵“微机之花”不能总是含苞欲放,应该开出点什么,于是决定用计算机把学校的管理工作抓起来。一天学校组织一大批人分头到学校印刷厂、物资部门及财务部门进行调查,陈堃銶参加了调查。之前的几个月,确切地说1974年初,陈堃銶得了晕眩症,类似美尼尔,时常发作,天旋地转,无法再给学生上课,不知道是否受到王选病体的“影响”,教研室不再安排教学任务,让陈堃銶管些杂物,管管资料,对付教学之外的一些活动。这让人不由得想到王选的状况,有人开玩笑:这两口子真是天生的一对,是夫妻相,夫妻病。陈堃銶也因此参加了对印刷厂的调查了解工作。在印刷厂,事情就是这么凑巧,这么宿命,陈堃銶意外地了解到国家有一个关于汉字信息处理技术的重点科研项目,代号为“748工程”。回到家陈堃銶将这一消息告诉了王选,王选嗅觉非常灵敏,越是病人嗅觉就越灵敏,内心仿佛得到某种如同计算机内部的指令,突然感到某种沉默已久的“主机”启动,听到了嗡的一声。事实上多年来他一直在为内心的某种主机工作,此时王选眼睛放光,似乎也看到了陈堃銶眼睛放光,从此两人眼睛里多了一种东西。很难说是激光或者类似的东西,反正是只有他们俩相视时才有的东西。
r“748工程”总共包括精密汉字照排系统、汉字情报检索系统、汉字通信系统和汉字终端设备等内容的研究。王选认为精密汉字照排系统最为关键,这是书刊和报纸编辑排版工作的专用系统,对已延续了五千年的汉字意义重大,这是一场跟上世界文明潮流、使汉字不至被排除在外的革命。陈堃銶了解到在“748工程”中,已有五家单位在研制精密汉字照排系统,五家分别是上海印刷技术研究所、中华印刷厂、北京新华印刷厂、清华大学计算机系、中国科学院自动化研究所,这五家都实力雄厚,并且还有诸多合作伙伴。
r这是国家工程,与独立的个人无关,更与病人无关。
r但王选一眼便看到这五家单位的致命缺陷,王选准备单干。
r主机一旦启动,王选进入了从未有过的计算机般的工作状态,以个人之力查看了大量资料:世界上第一台手动式照排机是1946年在美国问世的,第二代是光机式照排机,第三代是阴极射线管照排机,如今已发展到第四代激光照排机:字模以数字化点阵的形式存储在计算机中,输出时,用受控制的激光束在底片上直接扫描打点。西方从第一代机发展到第四代机,经过了漫长三十年。五家单位包括背后的专家群,当然也知道这个进程。但王选单挑五家,单挑国家工程,他不相信这种事情能靠协作、集体完成,这是个人的事,或者天才的事。反过来在许多人看来,王选的个人行为无异于天方夜谭,堂吉诃德战风车。甚至这堂吉诃德不但疯,而且病。
r精密汉字照排系统的方案,其创造性、先进性和可行性是能否研制成功的关键,上述五家恰恰在这三个方面都存在着严重的缺陷;王选很想告诉他们——第三代西文照排机已在西方大量推广,第四代机也正在一些技术先进的国家加紧研制,中国的五家单位,你们选择的是二代机与三代机,即使费了九牛二虎之力研制出来,又有多大价值?此外,王选想说,更重要的一点是,五家在汉字字形存储方面采取的全部是模拟存储方式,而不是数字,模拟存储方式能解决存储和输出等技术难关吗?但如果一个多年的“病人”告诉他们这些,他们会改变吗?不要说改变,面对这样一个说话都上气不接下气的人,即使五家单位的“专家群”不把王选看作堂吉诃德,也会把王选看作一个货真价实的病人。
r但王选不是堂吉诃德,某种意义上也不是病人,而是天才。
r是孟子所说的天将降大任的那种人,甚至有过之。
r王选的目光掠过第一代、第二代和第三代照排机,直接瞄准了国外正在研制的第四代机——激光照排机。王选知道(好像那五家单位不知道似的)最早开始研制激光照排机的英国蒙纳公司(Monotype公司)对四代机刚刚进入试制阶段,尚未形成商品;日本虽然搞出了第三代照排机,但功能很不完善,仅能勉强应付日文中的少量汉字。这是挑战,也正好是机会,跟在别人后面往往是集体的行为,是一致的看得清的行为,也是平庸的行为,这便是王选和五家单位的区别。在这个意义上说,创造性很多时候不来自集体,相反很多时候集体会内耗掉遮蔽掉集体中的天才。很多时候,个人即意味自由,而创造性的工作与自由直接相关,创造怎么少得了自由呢?这是一对天生的孪生姐妹。千年以前,宋代毕昇发明活字版印刷术是个人行为,在这个意义无论如何我们个人化的行为太少了,在印刷术上千年后继无人。世界从20世纪40年代起,古老的印刷术便融合当代的机械、电子、光学等先进技术成果,把照排技术发展到了第四代。这种技术与计算机相连,组成编辑排版系统,取代了铅字(泥字),实现了书报自动排版,大大提高了生产率。目前激光照排机直接制版的前景事实上更加诱人:激光束直接打在感光版材上,经自动处理后即可直接胶印;底片的显影、定影及制版等一系列工序都可以免除,劳动生产率还将进一步提高。但是在毕昇的故乡中国,却仍在按照1488年德国古登堡的办法:以火熔铅,以铅铸字,以铅排版,以版印刷,仍停留在500年前欧洲中世纪的“铅与火”时代。王选直接延续宋朝的个人创造精神,挑战世界。其实,就根本而言,王选谁也没挑战,他挑战的是自己。
r当然,把古老的象形文字——常用字3000字以上非常用7000字以上——融进电子计算机,时间跨度达千年,谈何容易?况且汉字印刷用的字体、字号又特别多,每种字体起码也需要7000多字,每个汉字从特大号到七号,共有16种字号。如果考虑到不同字体和不同字号在内,印刷用的汉字字头数高达100万字以上。因此,汉字点阵对应的总存储量将达200亿位。这是一个吓人的天文数字,难怪五家单位的五个技术专家群在一起做。即使毕昇活在当世能应对吗?
r能,这就是王选的感觉。事情常常就是这么吊诡,正常人觉得不能的时候病人觉得能。必须找到一种方法,对汉字信息进行大大压缩,这是关键的第一步。王选唯一担心的是自己身体,灵魂过分强大,身体往往不堪使用,他的身体能支撑他吗?自从确立了“战风车”的目标,王选常常整夜整夜不睡觉,坐着研究不行就躺着研究,幸好有陈堃銶,简直就是他的另一半,他们太一样了。两个病人的能量绝非两个正常人能比的,因为爱是一种化学反应,是那个时代最大的正能量。陈堃銶早已习惯了王选,两人奇迹般地完全达到兼容,甚至很多时候他们就是一个人。王选着了魔似的拿着字典,查报刊,在床上翻来覆去、苦心孤诣研究浩如烟海的汉字:字形的特点,规律,没有规律的规律,没有逻辑的逻辑。不能按西方的逻辑分析,那样永远走不通,中国文明有自己的奇怪的逻辑。
r但是说怪也不怪,不过是自成体系。只是要用这种自成一体的体系思维出一种规律性的东西,西方性的东西,即计算机性的东西,老实说当时整个中国也只有王选与陈堃銶这样奇迹的组合才能做到。为什么说千年等一回?为什么说双重的千年等一回?就是这个意思。中国文明要过计算机这个坎就需要千年等一回。王选与陈堃銶不是通常的过日子,而是过事业,生活得再简单不过,但他们慢慢归纳出汉字的横、竖、折等规则笔画:它们由基本直线和起笔、收笔及转折等笔锋组成;归纳出撇、捺、点、钩不规则笔画:它们都有一定的曲线变化。有一天躺着的王选气喘地对陈堃銶说,能不能想办法对这些笔画进行统计,看看能否选出一些典型的笔画,供整套字合用,然后,再研究怎样用更少的信息描述它们?这样说的时候,汉字或中国逻辑已然隐现,陈堃銶非常敏感,更有女性对空间想象的本能,认为可行。打毛衣,织帽子,这些陈堃銶也是要做的,而这也是一种空间能力。陈堃銶从印刷厂找来字模,将字模稿上的一个个汉字字形放大,放在坐标纸上,再描出字形的点阵和统计笔段,就像毛活的图案,发现横、竖、折的基本部分比较固定,变化的是头和尾。而头和尾的样式不是很多,因此可以挑选出若干个供所有字合用的典型。但撇、捺、点这些不规则笔段,笔画变化太多,很难挑出几种可供所有汉字合用的典型。
r王选拿着一张张字模稿,辗转反侧,寤寐思服,也正在此时,慢慢的,在汉字古老的逻辑中,亦即中国的逻辑中,王选的西方逻辑——高等数学,发挥了作用:两者神奇地几乎不可能地在融合,在对接,在交互。而融合点正是用类似数学拓扑学的“轮廓”来描述汉字字形:用折线轮廓逼近汉字字形,然后在轮廓上选取合适的关键点,再将这些点用直线相连,成折线,用折线代表汉字的轮廓曲线,只要点取得合适,就能保证文字放大或缩小后的质量。
r这就是王选想到的:数字与汉字的结合。
r无论古老汉字多么桀骜不驯,还是被数学描述了。
r然而,在进行字形变倍实验时笔画出现了粗细不均,特别是横、竖、折这类规则笔画最甚,明显影响了文字质量。为了保证笔画的匀称,需要对这些笔画进行特殊控制。王选与陈堃銶粗略统计,汉字中规则笔段的比例占差不多一半,一套七八千字的字模会包含几万个横和同样多的竖,但分类后可能就只有几十个类型的横和竖了——王选精密的脑子运行到这儿,一个绝妙的几乎自动生成的设计又一次形成了:他气喘嘘嘘,上气不接下气,分了几次才把想法说完:
r“我们可以用参数方法描述规则笔段,就是把笔画的长度、宽度、起笔笔锋、收笔笔锋、转折笔锋——横肩、竖头、竖尾,还有,笔画的起始位置等用参数编号表示。其余撇、捺、钩、点不规则笔段仍用轮廓表示,这样不但可以保证字模变倍时横、竖、折等笔画的匀称,解决文字变倍后的质量问题,还可以使信息进一步大大压缩……”
r王选起来喝了一大口水,躺下来,接着说:
r“另一方面,由于我们可以实现不失真的变倍,不必把所有的字号压缩信息都存到计算机里去,可以只选择其中一两种有代表性的字号,放大或缩小变出别的各种字号,这样就能达到更高的压缩倍数!”
r陈堃銶不但在家帮助计算,还把压缩信息拿到系里计算机上进行各种模拟实验。陈堃銶惊讶地发现,这种“轮廓加参数”压缩信息表示法,达到了信息最大限度的节省,使汉字信息存入计算机的问题迎刃而解!
r陈堃銶把这个消息告诉了喘息的王选。
r自己激动得也有点喘。两人的目光完全一致,是激光。
r两人马不停蹄,又设计了压缩信息的紧凑形式,陈堃銶用黑、宋、仿、楷四种字体的十种字号,以及长宋、扁宋、长黑、扁黑等点阵的总存储量与压缩后的存储量相比,发现总体压缩倍数达500多倍。到了最关键时刻,即如何使存入计算机的压缩信息还原成字形点阵。陈堃銶白天还要常去上课,王选就一个人或坐或卧或在屋子中转磨,或在床上辗转反侧。有一天陈堃銶刚回来,王选大声说,我想出办法啦!由于声音过大,停了好半天才说:“我们,可以用数学公式的推导,推导出一个压缩信息复原的递推公式!”
r两人马上按王选说的验算,得出的结果惊人的漂亮。试验了一批字,无论放大缩小,完全一样,分毫不差,毫不变形。数字与汉字,东方与西方,两种不同的文明在王选的身体里以科学的方式融合。谁能想到,这种融合竟然选择的是王选这样一个病体?谁又能想到上天又送给他一个仙女?
r确如爱因斯坦所说,上帝是微妙的。
r