中译公司于2004年成立了专门的数据中心,在中国出版集团的资金和政策支持下,开始了“多语种翻译资源数据库及其应用系统项目”的建设工作。该项目采取数据中心策划监控,项目建设外包的方式,共分六期,目前一期项目已开始分批交接使用,可望在2006年6月下旬开始试运行,8月底正式投入使用。值得一提的是,在项目建设的前期,公司数据中心和公司领导对国内外{zxj}的计算机辅助翻译和数据库技术和工具进行了考察,先后前往加拿大翻译署、纽约联合国总部、国际货币基金组织和世界银行、联合国日内瓦办事处、维也纳办事处和巴黎教科文组织考察了术语数据库、翻译语料库、为经认证用户提供的在线词汇资源的建设和应用,以及计算机辅助翻译和各类信息技术在这些机构的使用情况,并建立了数据交流和合作机制,为今后中译公司与这些客户和合作伙伴开展数据交流和共享铺平了道路。

中译公司多语种翻译资源数据库及其应用系统的建设构想的依据有以下几点:一是中译公司对翻译工作的工作流特点的分析和理解;二是中译公司30多年来为各类客户和客户群提供翻译服务所积累的对应工整的多语种翻译语料资源,由于中译公司拥有相当一部分长期稳定的客户群,如国际组织、驻华机构、国内政府机关、企业、法律、金融、医药卫生等等,其所积累的翻译语料和术语具有一定的机构特征或分属于某一学科类别,xx可以进行分类管理和维护,同时客户群的长期稳定性也使得这些语料库和术语库建成即可立即投入使用,且在相当程度上保证了使用效率。试想,如果一个翻译资源数据库中保存的是从某些文学作品如《红楼梦》或莎士比亚戏剧中抽取的语料,则该语料库建成后的使用范围相当有限,其在翻译企业中使用效率也必然是极低的;三是中译公司根据自身30多年的翻译服务提供经验,并结合当前翻译产业化对翻译服务提供商提出的要求,定制开发出符合自身特点的项目管理流程,这一项目管理流程突出以人(客户-译者)为本,以数据库为依托,深入流程中的每一个环节、贯穿项目始终的原则,其对于翻译服务提供质量和效率的作用绝不亚于翻译资源库的建设。以下笔者将就以上{dy}和第三点进行较为详细的论述。

任何一个翻译工作站、机器辅助翻译系统和此类模型系统的设计,其前提都是对翻译工作的过程及其特点进行认真细化的分析,中译公司自然也不例外。对于任何一个翻译项目而言,其最基本的工作模式无非由以下几个环节组成:
在传统的工作模式下,以上的前四个环节都是依靠译者独立手工完成的,前四个环节结束即意味着翻译工作的结束,没有后续的数据回收和管理维护环节,从而导致了大量宝贵的翻译资源的流失,后来的翻译人员不得不在前人已经耕耘过的土地上再次开垦。而当前通用的计算机辅助翻译系统中,计算机所参与的环节包括资料收集(建立数据库和网上资源收集)、资料加工(术语库和语料库的建库)、知识处理、数据交换、文字处理等等。中译公司在对翻译工作环节进行分析的基础上,对这一通用的计算机辅助翻译系统加以专业分工和细化,使计算机、数据库和网络技术能够{zd0}程度地为翻译工作服务。

资料收集。资料收集包括两种:一是从当前客户以前所作的项目中收集对译语料和术语,二是通过互联网搜索引擎和传统渠道收集背景资料,将其加工成为可用的语料和术语。在此,中译公司突出了大型翻译服务企业的优势,成立了专门的数据中心,为译者提供数据支持和服务。中译公司数据中心的术语编辑多具有一定的学科背景和中高级以上的翻译资质,一方面,这些术语编辑要对我们以往积累的翻译资源和每天业务产生的翻译原件和成品进行审核和加工,分类录入到多语种翻译资源数据库中。另一方面,数据中心还将在翻译部收到大型紧急项目时,临时抽调术语编辑为这些项目整理语料和术语,并广泛收集数据,将传统的纸版词典扫描识别,按设定的格式入库,将在互联网上搜索到的单语资料加工成单语语料录入到背景资源库中,并进行索引和关键词标注。专门成立一个部门,由高质量的术语编辑进行资料收集和入库工作,是中译公司对翻译过程进行细化专业分工的一个重要举措。目前虽然项目建设尚未完成,但由术语编辑为翻译项目提供数据支持的做法已在全公司开展起来,并受到了翻译部门的大力欢迎。

原文分析。翻译工作中的原文分析环节主要是由译者进行的,译者根据术语编辑提供的数据支持,在参考资料的辅助下进行原文分析。但在中译公司的系统构想中,还将在整个项目过程中引入原文预处理和查重环节,尽量减少翻译工作中的重复劳动,不仅能够{zd0}限度地发挥翻译工作者的创造性,还能够在相当大地程度上提高翻译企业的工作效率(可提高25%以上)。

原文翻译。翻译过程是整个工作流的核心环节,到目前为止,这是翻译工作中最不可为机器所替代的,但在中译公司的开放的翻译工作站系统中,通过各种计算机和网络技术的使用,原文翻译的效率可以大大提高(30%)。首先,计算机辅助翻译工具的使用。在中译公司的多语种翻译资源数据库及其应用系统中,计算机辅助翻译工具的使用具有重要地位。当前的计算机辅助翻译产品均支持翻译记忆交换标准(Translation Memory Exchange,简称TMX),从而方便了翻译记忆产品之间的数据交换。上文提到,多语种翻译资源数据库及其应用系统是一个开放的系统,其最主要的特征就是,语料库和术语库采用通用架构和标准SQL语言,可以方便地转换成各种数据库结构,挂在各类计算机辅助翻译软件产品上使用。除了可以方便地使用术语库和语料库以外,使用计算机辅助翻译软件的另一个好处就是其大多支持多种常用的文档格式(DOC、RTF、HTML、SGML、PPT、FM、MIF等),不需要对翻译结果进行重新排版 。中译公司的翻译工作站系统还广泛吸收了各种其他具有提高效率的辅助作用的技术,如全文检索技术和语音输入技术等。引入项目机制后,翻译人员可在翻译过程中随时向项目组长发出问题请求,这些问题及其解答都将在整个项目组共享并在一个数据库中记录下来,保证了翻译项目的整体质量和项目资源的共享和保存,也是提高效率的一大举措。

译文审校。在整个翻译工作流程中,译文审校可谓计算机参与最少的一个部分。许多审校认为,在计算机辅助翻译工具所提供的断句后的界面上进行译文审校不利于对译文全局性的把握,且在这一环节,各种辅助工具对于提高效率的作用也确实不明显。然而,根据中译公司30多年的翻译服务经验,翻译工作的特点要求其质量控制主要集中在前端,如果前期的组稿和数据支持等工作没有做好、翻译质量太差的话,选派再优秀的审校有时也无济于事,时效性很强,客户催得很紧的大型项目尤其如此。所以,引入项目机制,在翻译项目的前端加强管理和质量控制,也可以大大提高译文审校的效率。

数据全程管理。翻译项目结束时,数据中心的术语编辑将对翻译原件和成品件进行回收,过滤客户相关信息后,分别对其进行整理入库。数据管理在中译公司的翻译工作站系统中占据核心地位,因为就当前翻译术语库和语料库的使用而言,使用效率的高低从根本上取决于这些术语库和语料库的分类管理。无庸讳言,当前使用语料库和术语库的计算机辅助翻译技术应用最多的领域就是本地化,而在社科领域的应用不多,效果也极不明显。对于不同类型的项目,翻译数据使用的效率有着很大的区别。由于科学技术类翻译本身涉及很多外来词汇,且很少存在文化差异,所以翻译数据在这一领域的使用效率应该是{zg}的。引入项目机制,建立一个数据库对项目信息进行记录和管理,并在其与翻译资源数据库之间建立关联,是中译公司提高翻译资源数据库使用效率的一个重要思路。换句话说,在中译公司的多语种翻译资源数据库中,所有的翻译记忆库、语料库和术语库都是按照一定的学科类别、机构来源、客户来源等属性严格分类管理的,前面提到的(单语)背景资源库也将建立起关键词索引并将其与特定项目建立关联,这是当前计算机辅助翻译研究和实践领域的一个共同的思路。北京大学计算语言所即于近年来专门展开了“面向新闻领域的汉英机器翻译系统”和“面向中文学术专著的机器辅助翻译系统”等研究和双语平行语料库的构建 。中译公司的翻译业务涉及自然科学和社会科学的各个领域,在我们看来,一个高效开放的翻译工作站系统xx可以面向任何领域,同时中译公司又拥有大量涉及各个领域的高质量的翻译数据资源,使我们xx有条件搭建一个多语种翻译资源数据库,但在这个庞大的多语种数据库中进行分语种、分学科、分机构、分项目的多级分类管理,是该数据库使用效率的最根本保证。

项目管理。从全球范围来看,项目和项目管理概念的引入既是翻译产业化提出的要求,又在很大程度上推进了翻译的产业化进程。Celia Rico Pérez博士在其题为“翻译和项目管理”的文章中指出,全球化趋势以及信息和网络技术的发展使得翻译产业不得不引入新的项目管理技巧,只有这样,翻译产业才能处理以往不可想象的翻译业务量、应对日益紧张的交付日程、满足更为严格的客户需求并整合分散在全球各地的“翻译生产队伍” 。所谓项目组,是指翻译企业中专门为某一“具有一定时间性”、“{dywe}”的翻译项目组成的协作团队,其不仅包括翻译和审校队伍,还包括前台客户服务、后台数据支持、外包服务和技术审核等。项目组的组长则需要负责协调、日程安排、项目进度跟踪、客户联络、预算控制和资源调配等任务。