如何自制Trados的TMX格式翻译记忆库
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何自制Trados的TMX格式翻译记忆库相关的知识,希望对你有一定的参考价值。
参考技术A 首先打开Trados并点击翻译记忆库按钮(1)进入翻译记忆库主界面。进入文件》新建》翻译记忆库菜单(1)。
为新建的翻译记忆库设置存放位置(1)和名称(2),然后点击下一步。
可以为翻译记忆库自定义一些字段,这里不是必须的。点击下一步。
这里可以设置一些翻译记忆库的变量和断句规则,不用管,直接点击下一步。
至此,我们的翻译记忆库创建完毕。点击关闭。
看看我们的翻译记忆库,已经打开了,不过里面什么东西也没有。
鼠标右击翻译记忆库,选择设置菜单(1)。
在这里我们就可以对翻译记忆库进行各种设置。看看翻译单元(1)为0,说明还没有翻译单元。
翻译记忆库创建好了,添加到自己的翻译项目中使用吧!本回答被提问者和网友采纳 参考技术B
从自身经验出发,我用过最多的是以下三个方法:
1、Trados里面的WinAlign,这个方法前几年用的比较多,但是没什么突破和进步,对比现在其他的对齐软件,处理效果不是很好,比较费力。
2、Transmate软件,网上有下载资源和使用方法,用户比较广。
打开软件→语料管理→双语对齐→导入文件好,如图。
3、Tmxmall在线对齐,不同于WinAlign和Transmate,Tmxmall在线对齐是一个网页,所以不用下载安装,百度一搜就出来了。这两年对齐功能一直在优化,操作很方便,用的人也很多,主推。文档对齐后,选择导出为tmx格式即可。
参考技术C 我把翻译记忆库分为两部分来理解:翻译记忆+库。库是壳子,而tmx格式的双语平行语料(翻译记忆,translation memory)是壳子里的内容。壳子嘛,在trados里建个空库就行了,新建项目时,在“翻译记忆库和自动翻译”那一项里,点创建就能建个空库。所以你问“如何自制Trados的TMX格式翻译记忆库“,在我看来就是如何制作tmx格式的双语平行语料。我用的工具是Tmxmall在线对齐。看你手里积累的双语文件,如果是译文和原文分成两个文档的,就选双文档对齐。译文和原文上下对照存在一个文档里的,就用单文档对齐。导进文件后,就开始做对齐。对齐是指把原文和译文以句子为单位,调整成一一对照的形式。工具栏里有上移、下移、删除、插入这些按钮,用这些按钮将原文和译文的句子调整成一一对照。不过这个工具有快捷键的,你可以点“帮助”看下。你可以先进行段落对齐,就是说把左右栏的段落数调整至一致。然后按“对齐”按钮,Tmxmall会自动把段落拆分成句子,再调整左右栏的句子数量,确保一致。然后按“导出”键,选择tmx格式,就全部完成了。他们网站的下载中心里有使用说明,你要是觉得我说的不清楚,可以下载个说明看下。总的来说,Tmxmall是我用过的体验比较好的一款对齐软件,节省了很多人工干预的时间,让对齐变得挺有效率的。 参考技术D tmxmall啊trados怎么用?好用吗?请高手指点!!
我用Trados的时间不长,可以说是一个新手。但我在较短的时间内就已经初步掌握这个工具,说明它并不是那么神秘,并不是那么深不可测。这里,我说一说学习它的一点体会。在我转发的文章中有的内容,我就少讲一些。别人没有提到,或者没有强调的部分,我就多说一说。1.Trados不是一种机器翻译软件,而是一种翻译记忆软件
提起翻译软件,不少人就会联想到金山快译、东方快车等翻译软件。尽管这些软件有一定的市场,也有人把它们吹得神乎其神,但我对它们并不看好。这些翻译软件的特点是将英语或者汉语输进它的输入界面,马上就能得到它的译文。可是,这只能蒙外行。懂一点外语知识的人都能看出它的译文是驴头不对马嘴。有一次我用金山快译翻译一段计算机方面的资料,它将Library译为图书馆,还有许多莫名其妙的错误。我就再也不用这种软件了。即使偶尔用用,也只是作为一种翻译的参考。
Trados是一种计算机辅助翻译(CAT:Computer Aided Translation)软件,它也称为翻译记忆(TM:Translation Memory)软件。什么是翻译记忆?简言之,就是将译员做过的工作,用Trados提供的工具存储起来,放到两个主要的数据库(记忆库)中,一个是句料库(用WinAlign工具制作),另一个是术语库(即Multiterm)。在进行翻译工作的时候,只要是句料库和术语库中有的,Trados就会提醒你,帮助你,完全相同的句子,在Trados中称为100%完全匹配,自动插入译文,不再要你译第二次。类似的句子,它用一种称为模糊匹配的方法,给出参考译文,让译员去选择、修改。对数字、缩写、日期、时间和度量单位等等,Trados能够自动替换,比如已有的句料库中有2004年4月20日,到译文中出现日期(May 3,2005)时就会自动替换为2005年5月3日。
2.用Trados工作,必须要有句料库和术语库
有的人光知道用Trados,以为有了Trados,就能够提高工作效率和译文的准确程度。他不知道,如果没有句料库和术语库,用它是既不可能提高工作效率,也不可能做到译文准确的。这是因为翻译记忆软件在国内还没有广泛为人们所了解,以为有了它,就一通百通了。这是一种模糊认识,笔者必须加以澄清。
在国外,许多翻译公司和企业都使用Trados(在德国,还有一种应用较广的称为Transit的翻译记忆软件),在他们要求你使用Trados翻译的同时,还会提供给你参考文本(即句料库)和术语库。使用翻译记忆软件的最大好处还在于可以让许多译员通过网络同时工作,他们在网上可以共享术语库,某一译员的译文可以给其它人做参考,做到多人同步高效工作。
Trados还有一个优点,即在翻译较长的资料时,在后面碰到和前面译过的相同或者类似的部分,你就可以用相关搜索(Concordance)查找已在记忆库中已译过的术语和句子。这个工作不要你去做,Trados是自动完成的。你在翻译的过程中,它已经将你译过的单词、术语和句子自动存储起来了。
3.句料库的制作
使用Trados有两大重要工具,其中之一就是WinAlign。许多介绍Trados的文章忽视了工具WinAlign,光是介绍Trados和Multiterm。其实,在我看来,WinAlign在Trados中是比Multiterm还要重要的工具。它的作用就是制作句料库。你译了一些资料以后,千万不要束之高阁,而是要花点时间,用WinAlign作成句料库。这项工作看起来简单,其实很重要。
用WinAlign制作句料库需要一篇原文和一篇较准确的译文。如果你在翻译的时候比较匆忙,有些译文部分不够准确,我建议你在有空的时候,将这些译文推敲推敲。在WinAlign中有两列,一列是原文,一列是相应的译文。WinAlign的任务就是分别对齐相应的原文和译文。原文和经过推敲的译文应存储为Word文档的RTF格式。Word允许用户输入和输出一种RTF特殊格式的文件,只需选择“另存为”命令,在“保存类型”中选择“RTF格式”即可。RTF是Rich Text Format的缩写,并将它作为该格式文件的扩展名。RTF文件格式是由Microsoft Word创建的。它是为在不同程序间传递数据而设计的。其优点之一就是文件的格式信息不会丢失或破坏。RTF格式用在WinAlign中,就是通过对这些格式的识别,进行句料之间的对齐。
有时用自动对齐并不能得到好的效果,这时就需要手工对齐。手工对齐主要用到以下几个菜单项:在WinAlign的Edit菜单下有一个Split Segment项、一个Edit Segment项和一个Join Segments项,在WinAlign的Alignment菜单下有一个File Pair Statistics项和一个Commit项、一个Mark Finished项。在自动对齐以后用File Pair Statistics菜单检查文件对(File Pairs)的对齐结果,你可能发现有几个High Quality Units的匹配,有几个 Medium Quality Units的匹配和几个Low Quality Units的匹配。根据我的经验,有少量的Low Quality Units匹配,并不影响最终使用效果。当然High Quality Units匹配的数量越多越好。其中还有一个Number of 1:2 and 2:1 Units的项,其意义为原文和译文之间的句子有 1:2 和 2:1 对应的。按照我的经验,原文和译文之间的句子的 1:2 和 2:1 对应最好不要有。其方法就是用上面提到的Split Segment项将句料分割开或者用Join Segments将句料合并。最后在统计结果中最好完全是1:1对应的句子。Edit Segment项是用来在进行Align时修改译文用的。如果对Align的结果比较满意,别忘了用Commit进行确认。如果没有进行确认,在用Trados进行翻译时,在Trados Workbench的有关栏中会出现乱码或者出现中文竖排。
以上说的有人可能觉得太噜苏了,请不要感到厌烦,这些正是容易出问题之所在。
4.术语库的制作
Trados的另一个重要工具就是Multiterm。术语库的制作方法许多文章都有介绍,我不多说了。我要说的有几个问题:
(1)术语的来源
网上可以找到金山快译的24本字典,这些字典完全是用制表符格式排列的,可以根据各人的需要制成英汉/汉英术语库。
(2)术语库的大小
根据我的经验,术语库不能做得太大,也不要做得太小。有人曾向我提出是不是将所有的术语都放在一起,我的答案是不妥。因为如果太大,运行速度减慢;但如果太小,不方便使用,在术语库之间转换,也要花不少时间。一般来说,近似的专业可以放在一起,例如机械专业和汽车专业。
(3)Multiterm 5术语库的导入
除了转引的文章中介绍的方法而外,还可以在网上找到一个名称为Trados字典制作的软件,用它可以非常方便地将以逗号、制表符、空格或对照文本格式排列的术语文本制成可以直接输入Multiterm 5.5的格式,作成Multiterm 5术语库。
(4)Multiterm iX术语库的制作
然后用迁移工具(Migration Tool)迁移转为XML格式的Multiterm iX术语库。不过我在Windows XP下Import迁移后的XML文件失败了。用和在Windows 98 下完全相同的方法却无法将文件Import进Multiterm iX术语库,最后只好仍在Windows 98下花了一整天时间输入了20余万条词汇。如有哪位高手在Windows XP下Import成功的,请指教一下。
最后要说的是,其实在用Trados做翻译工作时,句料库的作用远远大于术语库的作用。请朋友们千万要珍惜自己的劳动成果,它可是一笔宝贵的财富啊! 参考技术A
Trados相当于一个空锅,要自己往里面加食材,芝士啊泡菜啊午餐肉啊年糕啊辛拉面啊等等,相当于术语库、语料库、机器翻译插件等等。
在还是翻译小白的时候,对机器辅助软件、机器翻译软件有过概念的误解。
啊哈哈哈哈哈哈哈哈哈哈印象深刻是因为本科的时候临时要翻一个超大的文件,当时朦朦胧胧以为,CAT(机器辅助翻译)工具相当于快速翻译工具,梦想着一导入就能导出成品供我参看,结果当时辗转下到了memoQ,一打开傻眼了,什!么!都!没!有!
所以说,Trados并不是快速翻译工具,而只是辅助工具,能够对财经、科技、法律等重复率较高的文本 进行翻译效率提升,避免重复劳动,节省时间成本。打个简单的比方就像是,连连看???(这是一个暴露年龄的游戏),利用技术,识别相似率高或是重复的文本,快速通关的过程。
但是对于新手来说,这一点是很不友好的,因为既没有语料库,也没钱淘宝买机器翻译插件。
所以现在的趋势是:在线CAT翻译平台+共享语料库
比如YicatYiCAT-让翻译更简单 -Tmxmall(手动变粉)就亲测好!!!!用,我简直要为这个软件打call一万次。
首先,它支持7种机器翻译,千字五毛,四舍五入就是不要钱啊。
其次,有强大的语料商城支持。有很多用户根据爱好整理了语料库上传,所以像一些生僻领域,诗歌、古文、文学,都有涉及,是一个非常友好的,用户可DIY的平台。
根据上传的文件的匹配度收费。我随意上传了一个文件,匹配度和收费如图:
这种共享语料库的模式个人觉得非常棒,不再是孤军奋战默默吭哧吭哧做语料,有用的可能就若干术语,而是能够享受大家的慷慨分享,节省了好多时间,赚更多的毛爷爷,感觉贼拉棒(๑•̀ㅂ•́) ✧呢!因此把这么好用的平台分享给大家,共勉之。
参考技术B要进行翻译,先需要建立一个项目,直接点击“主页”界面上的“新建项目”即可,然后按照向导,添加源文件语种和目标翻译语种。这里可以同时添加几个目标语种。
接着进入到最关键的一步,建立翻译记忆库。Trados的核心就在这里。点击向导界面上的“新建“,创建一个记忆库。这步必须做,否则,就失去了翻译记忆的意义。接着一直下一步到结束。
接着点击”文件“选项卡就,找到刚添加的文件双击,即可在翻译界面上打开文件进行翻译。这时候还不能发现它的优势所在,还得老老实实一字一句的翻译。每完成一个单元,使用”Ctrl+Enter“来进入下一单元,这很重要,因为这一操作就是把刚翻译完的内容保存到记忆库。接着就会发现,下面如有重复或者类似的句段,已经自动完成了翻译或者给出了翻译建议。
完成翻译后,先按F8执行翻译检查。凡是在顶端提示了红叉的,都必须改正,警告的,可以忽略过。否则,将不能输出译文。检查完成后点击输出译文即可。
参考技术C 没用过,看别人的描述,好像不错,我正准备用,还没有下载到合适的呢 参考技术D 对于专业翻译来说是好用的,不过没用过需要看视频学习下,我在淘宝上一家叫trados翻译软件之家,花了20元买了19版的,有很强大的术语库视频插件那些,卖家也帮忙解密可以终身使用
以上是关于如何自制Trados的TMX格式翻译记忆库的主要内容,如果未能解决你的问题,请参考以下文章