美冷战时期秘密任务打造世界第一台中文输入

年夏,美国亟需在冷战中取得一场胜利。年,苏联发射了人类历史上首颗人造卫星Sputnik1,在技术上获得重大胜利。次年,中国开始了轰轰烈烈的“大跃进”运动。年春,古巴革命领袖菲德尔·卡斯特罗的游击队迫使总统富尔亨西奥·巴蒂斯塔流亡海外。美国需要重振旗鼓,证明自己仍然是全球事务的掌舵人。美国的计划是:总统德怀特·艾森豪威尔要求美国科学家造出世界上第一台中文输入计算机。

第一台中文输入计算机的发明会是一场重大胜利,是资本主义馈赠给中国人民的一份“礼物”。“自由世界”将借此取得一场技术和文化胜利,同时,凭借这种新设备,中文材料将得到翻译,并能够在全球范围内传播。谁拥有了这种设备,谁就能够以前所未有的速度,用汉字“席卷”世界,这也许是一种庞大的舆论宣传优势。而且,对于中文和10多亿以中文为母语的人来说,这会开启信息技术的新纪元,很多人曾以为,只有字母文字才可能迎来这样的新时代。

这场地缘政治戏码围绕着Sinotype展开,这部机器由“计算机中文输入之父”萨缪尔·霍克斯·考德威尔(SamuelHawksCaldwell)发明。

萨缪尔·霍克斯·考德威尔(SamuelHawksCaldwell)

考德威尔是个多才多艺的人,他年出生于美国马萨诸塞州,就读于麻省理工学院,师从著名的模拟计算机设计者范内瓦·布什(VannevarBush)。后来,考德威尔又成为逻辑电路领域的先驱。他平时喜欢弹风琴,偶尔还会在波士顿管弦乐团中客串演出。

但考德威尔不会说中文,也不识汉字。他头一次接触汉语是在和麻省理工的中国留学生闲聊时。用他后来的话说,他没想到“汉字竟然也有‘拼法’。”

考德威尔原以为汉字没有拼写规律,但他很快发现事实恰恰相反:“说来也怪,(中国学生)学写表意文字的方式与西方人学写单词的方式非常相像。每个中国人在学写汉字的时候,笔画的顺序都是相同的。”

作为逻辑电路设计专家,汉字“拼写”的规律性勾起了考德威尔的好奇心:如果每个汉字都是以相同的方式构成,那么是否有可能设计出一种逻辑电路,把汉字笔画当成输入数据,然后输出汉字?尽管汉语是非字母语言,但如果它具有自己的“拼法”,那么是否有可能设计出一台中文输入计算机,来解决工程师多年来的疑惑?

考德威尔向哈佛大学远东语言教授杨联陛寻求帮助。他们对汉字的结构进行详细分析,并弄清楚大约2,个常用汉字的笔画“拼写”,最后总共确定了22种笔画。这是一个理想的数字,每种笔画都可以在西方标准打字机键盘的按键上找到自己的位置。

考德威尔没有采用QWERTY标准键盘的布局,而是让Sinotype的键位与汉字的笔画对应,打字员用这些笔画来构成(更准确地说是描述和检索)汉字。考德威尔说,他的目标是“提供交换电路所需的输入和输出数据,交换电路会把一个汉字的拼写转换成这个字在影像存储矩阵中的位置坐标”。

在研究过程中,考德威尔又有了一个意外发现。汉字不仅有拼法,而且“汉字的拼法具有高度冗余性”。考德威尔基本上用不着输完一个汉字的所有笔画,Sinotype就能检索到这个汉字。例如,一个15画的汉字,打字员可能只需要输入前五六画,Sinotype就能找出那个汉字。

英语也是如此。比如“xylophone”和“crocodile”的拼写,前五个字母就足以与完整的单词形成匹配。因此,包含九个字母的单词可能只需要五个字母就能“找到”。考德威尔分别称之为“完整拼写”和“最小拼写”。二者之间的差异常常是很大的。在他的测试样本中,某些汉字有11画,但只需要五画就能“找到”。他认为,通过利用这些因素,有可能“设计出一种机器,在它的键盘上,输入汉字的速度至少会像输入英语单词那么快”。考德威尔不仅发明了世界上第一台中文输入计算机,还在不经意间发明了我们现在所说的“自动补全”输入法。

Sinotype输入法中以字母D、P、B为开头的汉字

Sinotype项目获得了卡耐基基金会、美国陆军和美国空军的资金支持,他们都希望利用Sinotype来提高汉语宣传单的产量,从而使这种大有可为的新设备成为一种“武器”。依靠Sinotype,大规模制作和印刷中文宣传材料成为了现实。但考德威尔并不是用冷战思维来看待他的发明。

“很多人会问,为什么要做这个东西?军方为什么会投入大量资金和精力?”他后来写道,“答案简单明了。我把这个想法介绍给军方,真正目的只有一个……汉字输入机器会加强人与人之间的沟通,而沟通的加强绝不会损害和平事业。”在他看来,Sinotype是实现和平的一种方式。

年5月,美国政府担心中国科学家可能快要在计算机中文输入方面取得突破,害怕被中国人抢先。如果中国人实现突破,将会严重削弱Sinotype带来的精神胜利。政府顾问敦促“总统尽快公布这部机器”,因为“美国致力于通过加强沟通来增进世界各国人民之间的相互了解,在这个漫长而持续的过程中,这部机器会被誉为美国做出的一次重大突破”。

但那个夏天悄然而过。艾森豪威尔没有公布这台中文输入计算机,Sinotype也没有公开露面。至于该设备是否准备就绪,是否经得起国际社会和军事分析家的检验,在这些问题上,质疑始终存在。它对汉字用户来说好用吗?它是否真像设计者认为的那样意义重大?过早公布Sinotype的风险实在太大,最终,当局决定推迟发布。

第二年,Sinotype项目遭受了最沉重的打击:考德威尔去世了。没有了这位先驱的领导,军方的热情迅速降温。

然而,Sinotype的生命并未终结,曲曲折折又延续了几十年,期间美国军界、商界和学界都曾参与该项目,包括中情局、兰德公司、IBM、ITEK、麻省理工、美国无线电公司等等。在这个过程中,Sinotype更换了几次名字,先是Sinowriter,接着是Chi-coder,然后是IdeographicEncoder。

到了上世纪80年代,考德威尔团队制定的概念和技术框架仍然是计算机中文输入的基础。后来,该项目以SinotypeII的面目重生,从考德威尔最初基于笔画的键盘输入,向日益流行的中文拼音输入转变。

虽然经历了种种变化,但考德威尔的核心设计原则得到保留——自动补全仍然是60年来计算机中文输入的核心组成部分。所以,当你下一次因为不可避免的英语单词自动补全错误而频繁吐槽的时候,不妨想想:如果字母输入的自动补全功能与中文输入的自动补全功能同时起步,那么字母输入也许会比现在发展得更好。

翻译:于波

来源:TheAtlantic

造就:剧院式的线下演讲平台,发现最有创造力的思想

更多精彩内容及免费演讲门票,敬请

转载请注明地址:http://www.1xbbk.net/jwbzn/2225.html


  • 上一篇文章:
  • 下一篇文章:
  • 网站简介 广告合作 发布优势 服务条款 隐私保护 网站地图 版权声明
    冀ICP备19027023号-7