在世界范围内,机器翻译的研究与开发已经走过了50年的历史。我国机器翻译的研究开始于1956年。1959年,中国的机器翻译研究者成功地进行了中国首次 机器翻译试验表演。中国是世界上第五个进行这种实验的国家。今年应是中国的机器翻译研究的40周年。在这时刻来作一番世纪回顾,更有其纪念的意义。 在进行技术层面的回顾之前,我愿就宏观方面做点介绍。首先,中国的机器翻译研究从一开始就得到了国家的高度重视。早在1956年它便以"机器翻译 "/"自然语言的数学理论"列入了当时的《科学发展纲要》。以后则列为"六五"、"七五",以及"863"等重大科 研项目。中国的机器翻译研究虽然也有过10年的停滞,但与国外不同,并不是由于对机器翻译研究本身的中断投资引起的。其次,中国的机器翻译研究从一开始 就具有多单位,多方面不同知识结构人员的协同攻关的特点。这是这项研究自身的特点所决定的,它需要至少计算机科学、数学、语言学等多方面知识。 70年代中期,我国机器翻译研究从停滞走向了复苏,是协同攻关的特点体现最充分的时期。当时在中国科技情报所的组织下集中了许多部委的研究人员在社 科院语言所的专家的具体指导下协同攻关。当时的理想是通过这样的大协作,开发出系统,培养一批人材,然后把系统带回各自的单位投入使用,并在使用过程 中继续完善。虽然遍地开花的良好愿望后来没有实现,但通过五年多的通力合作,开发出了系统,培养了人才和积累了经验。在这一时期,还开始向国外派出人 员学习和引进技术,并与当时已在国际享有盛名的机译研究机构进行了交流。社科院语言所开始培养机器翻译专业研究生。在这时期在情报学会和后来中文信息 学会下成立了专业委员会,并曾定期地举行全国性的学术研讨会,还曾出版机器翻译专刊。 80年代中期到90年代初期是我国的机器翻译研究自复苏以来第二个重要时期。在这一时期里,产生过两个在中国机译史上具有重要意义的实用化系统。它们 分别是军事科学院研制的"KY-1"英汉机译系统,它获得了国家科技进步二等奖,后来被开发为"译星",成为中国第一个商品化系统,另一 个是中科院计算所研制的"863-IMT"英汉机译系统,它获得了国家科技进步一等奖,它的技术带来了十分可观的效益。这两个系统也是多单位、多方面 人材通力合作的结果。在这一时期里还有一个机译系统是不应被遗忘的。它就是由邮电科研院研制的"MT-IR-EC",这是一个非常实用的通讯题录系统, 人们利用它翻译出版通讯题录刊物,从而使刊物的发行效率得到很大的提高,它因此成为了第一个荣获国家科技进步奖的机译系统。在这一时期里,中国参加了由 日本发起的亚洲五国机器翻译研发的合作项目。国内近10个单位参加了这一长达7年的国际项目。这次的大协作对于培养人才、传播技术、积累资源(如词典等), 以及使中国的机译研究走向世界,都有着深远的影响。另外,这个时期又正值"七五",它给了更多的单位和研究人员参与机译研究的机会。在此期间, 清华大学和南京大学研制了实用的日汉机译系统。中国科大在机译通用工具方面进行了富有成果的研究。北京大学研制成功了机译系统自动评估系统,这在国内外 尚属首例。 90年代初期至今,中国的机器翻译走入了快速发展的时期,出现了许多商品化系统。近期的机译系统大体上有这样一些特点:多数配有大规模的多种领域的 专业词典,多数能在网上运行,有相当不错的方便用户的界面。新的应用领域的机器翻译研究,如对话翻译系统的研发等也已开始。中国的机译研究的水平在总 体上从一开始就不低,如今在PC产品、网上系统的开发方面与世界上机译研究发达的国家相比并不逊色。 中国机器翻译的占主流地位的技术策略和技术路线是:转换法,基于规则的,尤其是实用型机器翻译。世界其它地方也是如此。在回顾总结半个世纪的经验 时,我想对于实用系统来说,有一些基本技术现在应是可以肯定的。
随着因特网的出现和发展,机器翻译的应用前景将更为诱人,也会带来更好的商机。但应该提醒的是:今天机译系统的翻译质量还很差。50年来译文质量应该 说还未取得实质性的突破,这在世界范围内都如此。机器翻译不但是一个语言处理问题,也可以说是一个知识处理问题。没有点点滴滴的、艰苦的知识和经验的积 累,是不可能开发出实用的机译系统的。现在之所以有的开发周期缩短了,一则是因为开发者有长期的经验积累,一则是得到可以共享的资源,而绝不是有什么 "绝招"。实际上机器翻译要能真正满足人们的需求,还有很长的路要走。展望下一个世纪,我们做这样的预测,实际上也可以说是我们应该争取的突破 点。
|
来源:oschina
链接:https://my.oschina.net/u/121944/blog/419511