CN112949324A - 飞机维修技术手册数据的翻译、管理方法及其***和终端 - Google Patents
飞机维修技术手册数据的翻译、管理方法及其***和终端 Download PDFInfo
- Publication number
- CN112949324A CN112949324A CN202110148567.3A CN202110148567A CN112949324A CN 112949324 A CN112949324 A CN 112949324A CN 202110148567 A CN202110148567 A CN 202110148567A CN 112949324 A CN112949324 A CN 112949324A
- Authority
- CN
- China
- Prior art keywords
- translation
- original
- aircraft maintenance
- technical manual
- maintenance technical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 292
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000013519 translation Methods 0.000 claims abstract description 180
- 238000006243 chemical reaction Methods 0.000 claims abstract description 31
- 230000014616 translation Effects 0.000 claims description 179
- 238000013523 data management Methods 0.000 claims description 29
- 238000003780 insertion Methods 0.000 claims description 15
- 230000037431 insertion Effects 0.000 claims description 15
- 230000036961 partial effect Effects 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 8
- 239000000463 material Substances 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 5
- 238000005192 partition Methods 0.000 claims description 3
- 238000012552 review Methods 0.000 claims 1
- 230000002829 reductive effect Effects 0.000 abstract description 10
- 230000008569 process Effects 0.000 abstract description 7
- 230000001915 proofreading effect Effects 0.000 abstract description 3
- 230000003252 repetitive effect Effects 0.000 abstract description 2
- 230000009897 systematic effect Effects 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 37
- 230000006872 improvement Effects 0.000 description 26
- 238000007726 management method Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 6
- 230000008439 repair process Effects 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000004557 technical material Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明提出一种飞机维修技术手册数据的翻译、管理方法及其***和终端,对各类手册经过翻译,校对和审核实现汉化,从而将维修人员对手册理解偏差的风险降至最低;翻译过程中大量重复性工作由电脑完成,只需少量人工干预,同时做到快速跟踪修订;***航空公司飞机维护经验,对关键步骤,关键部位,关键数值进行优化处理,在提高效率的同时又能有效减少维修差错;采用可扩展标记语言实现体系化、结构化***全链接,实现了手册间跳转定位,方便快捷,准确无误;而独有的移动端浏览页面,极大方便了基层维修人员的工作。
Description
技术领域
本发明涉及航空飞行器维修技术领域,特别是涉及飞机维修技术手册数据的翻译方法、管理方法及相应的***。
背景技术
随着我国航空业的深入发展,民航强国战略对民航业的方方面面都提出了更高的要求。飞机制造厂家和部件厂家的各种技术手册,是飞机维护中必须遵照执行的基础适航性资料,在提高飞机维修的深度和广度方面发挥着越来越重要的作用。
近年各飞机制造厂商均逐步将所有相关维修技术手册,包括AMM(AircraftMaintenance Manual飞机维护手册),TSM(Trouble Shooting Manual排故手册),IPC(Illustrated Part Catalogue图解零件目录),CML(Consumable Material List耗材清单),TEM(Tool&Equipment Manual工具设备手册), AWL(Aircraft Wiring List飞机电路图册),SRM(Structure Repair Manual结构修理手册),SPM(Standard Practice Manual标准施工手册)等,整合成为一套技术手册数据平台,以方便维修人员使用。
但是,各飞机制造厂商的技术手册数据的语言都是英文,而当前飞机维修人员的英语能力从客观上来讲存在良莠不齐的现象,近年来行业内外对飞机运行正常性的要求也日益提高。从人为因素的角度考虑,放行压力和英语能力欠缺的双重因素叠加会造成突破安全底线的事件频频发生,因飞机维修不当而引起空难的后果也就只是时间问题。
为了避免上述情况下所产生的安全隐患,民航局也加强了飞机维修人员的英语能力要求,发布了新的维修人员执照管理要求,拟将工作资质要求与英语能力相挂钩,但维修人员的英语能力提高需要时间,在民航业日益繁荣的状况下,面对大量的英文维修手册和技术文献资料,让大批量维修人员长时间脱产以掌握大量的民航专业英语词汇及维修技术领域英语文献的阅读能力,十分不现实。因而,如果英语水平不足以自主阅读英文技术资料,就必须有满足资质的人员翻译指导或者有中文版本的手册供使用。
另外,对于维修技术手册数据,仍然是以传统的技术资料管理方法,将厂家原文手册内容下载,再按手册类型上传到服务器上。无法将各种手册互相关联、整合成为一套技术手册数据平台,使得基层维修人员查阅十分不便。
再则,航空公司飞机维修部门在多年的工作中,总结的大量经验和规范,包括APS(Arrangement Procedure Standard航空公司飞机维修理念)、 MT(Maintenance Tip维护提示)、MSL(Maintenance Service Letter维护服务信函)等,虽然也能***维修技术手册中,但无法精准定位在需要的任务,只能放置在相应章节的起始位置,无法充分发挥对基层维修人员的提示和指导作用。
最后,飞机在进行维修工作时,需要打印所有相关资料,既浪费纸张又不便携带,严重影响维修效率。
发明内容
为了便于飞机维修人员在进行维修工作时能使用中文对整合大量经验和规范的飞机维修技术手册进行实时查阅,本发明提供了一种用于飞机维修技术手册数据的翻译方法、翻译***、数据管理方法、数据管理***以及查阅终端。所述技术方案如下:
一方面,提供了一种用于飞机维修技术手册数据的翻译方法,包括如下步骤:
建立基础语料库,然后将中英文飞机维修工卡中的英文单句连同对应的中文单句,转换为可扩展标记语言后生成语料,存入所述基础语料库;
对厂家原文飞机维修技术手册进行断句以分解成原文单句;
将所述原文单句与基础语料库中的英文单句进行匹配,若匹配度100%,则直接将语料中的中文单句输出作为译文,否则依据匹配度对原文单句进行预处理后,供译员翻译并输出译文;
将所述译文连同其对应的原文单句,转换为可扩展标记语言后生成新的语料,存入所述基础语料库。
所述翻译方法,可以作如下改进:
作为一种改进,将所述中英文飞机维修工卡转换为所述可扩展标记语言之前,将中英文飞机维修工卡进行格式转换,形成一列为中文单句、一列为英文单句且相互对照的表格文件,所述表格文件中的一行即为一条语料。
作为一种改进,所述新的语料在存入所述基础语料库之前,若出现原文单句一致但译文不一致的多条语料时,只保留一条语料以存入基础语料库。
作为一种改进,在对所述厂家原文飞机维修技术手册进行断句之前,确定厂家原文飞机维修技术手册的标记语言是否为所述可扩展标记语言,若是则直接将其分解成原文单句,否则先转换为可扩展标记语言后,再对厂家原文飞机维修技术手册的内容进行断句以分解成原文单句。
作为一种改进,所述厂家原文飞机维修技术手册中存在的假表转换为可扩展标记语言之后,将所述假表内的制表符替换为用于表达表格属性的标签,以使假表中的内容能被正确分解为原文单句。
作为一种改进,对所述厂家原文飞机维修技术手册所分解出来的所有原文单句进行统计,筛选出所有不重复的原文单句。
作为一种改进,所述预处理,包括:
若匹配度低于100%但不低于70%,则高亮原文单句中与语料的英文单句不一致的文本以生成待译单句,供译员人工翻译后输出译文;
若匹配度低于70%,则对原文单句使用神经元云翻译后生成参考译文,供译员参照所述参考译文,参考原文单句进行检查和修改后,输出译文。
作为一种改进,检验语料中的非译元素与译文中的非译元素是否对应,如不对应则弹出警告要求译者修改。
作为一种改进,建立基础术语库,提取厂家原文飞机维修技术手册中的专业术语并翻译,并将译文和原文转换为所述可扩展标记语言后作为基础术语,并存入所述基础术语库;
检索所述基础术语库中是否存在基础术语的原文与所述英文单句中的部分单词或词组相对应,若对应则进行提示以供译员参考。
作为一种改进,若译员认为特定单词或词组需要新增为基础术语,可以将所述特定单词或词组添加到术语库。
作为一种改进,若在先翻译的所述特定单词或词组的译文与术语库中基础术语的译文不对应,则报错以要求译员进行修正。
另一方面,提供了一种用于飞机维修技术手册数据的翻译***,其包括:
语料生成模块,用于将中英文飞机维修工卡中的英文单句连同对应的中文单句,转换为可扩展标记语言后生成语料;
基础语料库,用于存储所述语料;
手册数据转换模块,用于对厂家原文飞机维修技术手册进行断句以分解成原文单句;
机器翻译模块,用于将所述原文单句与基础语料库中的英文单句进行匹配,并依据匹配度输出译文或预处理后供译员翻译再输出译文;
所述语料生成模块还将所述译文连同其对应的原文单句,转换为可扩展标记语言后以生成新的语料,存入所述基础语料库。
所述翻译***还可以作如下改进:
作为一种改进,所述语料生成模块包括工卡格式转换子模块,用于将中英文飞机维修工卡进行格式转换,形成一列为中文单句、一列为英文单句且相互对照的表格文件,所述表格文件中的一行即为一条语料。
作为一种改进,所述语料生成模块还包括语料去重子模块,用于判定新的语料在存入所述基础语料库之前是否出现原文单句一致但译文不一致的多条语料,若是则只保留一条语料以存入基础语料库。
作为一种改进,所述手册数据转换模块包括:
标记语言判断子模块,用于确定厂家原文飞机维修技术手册的标记语言是否为所述可扩展标记语言;
标记语言转换子模块,用于对厂家原文飞机维修技术手册转换为可扩展标记语言。
作为一种改进,所述手册数据转换模块还包括断句规则子模块,用于定义可扩展标记语言中的特定标签作断句标记后,依据所述断句标记将厂家原文飞机维修技术手册的内容分解成原文单句。
作为一种改进,所述手册数据转换模块还包括假表转换子模块,在所述厂家原文飞机维修技术手册中存在的假表转换为可扩展标记语言之后,用于将所述假表内的制表符替换为用于表达表格属性的标签,以使假表中的内容能被正确分解为原文单句。
作为一种改进,所述手册数据转换模块还包括统计子模块,用于对所述厂家原文飞机维修技术手册所分解出来的所有原文单句进行统计,筛选出所有不重复的原文单句。
作为一种改进,所述机器翻译模块还包括:
语料库检索子模块,用于检索所述基础语料库中与原文单句最相近的英文单句,并判定所述原文单句与所述英文单句的匹配度;
原文单句预处理子模块,用于高亮原文单句中与语料的英文单句不一致的文本以生成待译单句,或用于对原文单句进行神经元云翻译后生成参考译文。
作为一种改进,所述翻译***还包括:
术语生成模块,用于提取厂家原文飞机维修技术手册中的专业术语并翻译,并将译文和原文转换为所述可扩展标记语言作为基础术语;
基础术语库,用于存储所述基础术语;
术语库检索模块,用于检索所述基础术语库中是否存在基础术语的原文与所述英文单句中的部分单词或词组相对应,若对应则进行提示以供译员参考。
作为一种改进,所述翻译***还包括术语验证模块,用于判断在先翻译的所述特定单词或词组的译文与术语库中基础术语的译文是否对应。
作为一种改进,所述翻译***还包括非译元素检验模块,用于检验语料中的非译元素与译文中的非译元素是否对应,如不对应则弹出警告作为修改请求。
再一方面,提供了一种飞机维修技术手册的数据管理方法,包括如下步骤:
利用所述飞机维修技术手册数据的翻译***通过所述飞机维修技术手册数据的翻译方法对飞机维修技术手册数据进行翻译后,将所输出的译文整合成中英对照维护手册大数据库;
将所述中英对照维护手册大数据库中的译文,依据厂家原文飞机维修技术手册中的目录结构,结合原文单句,生成原文单句在上、对应译文在下的中英文双语段落,向终端进行展示;
将厂家原文飞机维修技术手册中的图片,依据其在厂家原文飞机维修技术手册中对应原文的位置,***至对应译文的中英文段落中。
提供搜索接口,用于供维修人员在终端通过关键词对中英对照维护手册大数据库进行检索。
所述数据管理方法,还可以作如下改进:
作为进一步改进,接收飞机生产厂家发送的飞机维修技术手册原文修订数据,对所述中英对照维护手册大数据库中的原文单句进行修订;
利用所述飞机维修技术手册数据的翻译***通过所述飞机维修技术手册数据的翻译方法对修订后的原文单句翻译并生成新的译文,所述新的译文替换中英对照维护手册大数据库中对应修订后的原文单句的原译文。
作为进一步改进,将原有的***所述厂家原文飞机维修技术手册中的APS、 MT、MSL以附件形式,以所述APS、MT、MSL的相关任务对应所述译文的关键词为***点,可折叠地***中英文双语段落中。
又一方面,提供了一种飞机维修技术手册的数据管理***,其包括:
数据库生成模块,用于利用所述飞机维修技术手册数据的翻译***通过所述飞机维修技术手册数据的翻译方法对飞机维修技术手册数据进行翻译后,将所输出的译文整合成中英对照维护手册大数据库;
显示文本生成模块,用于将所述中英对照维护手册大数据库中的译文,依据厂家原文飞机维修技术手册中的目录结构,结合原文单句,生成原文单句在上、对应译文在下的中英文双语段落,向终端进行展示;
搜索接口,用于供维修人员在终端通过关键词对中英对照维护手册大数据库进行检索。
所述数据管理***,还可以作如下改进:
作为进一步改进,还包括手册修订模块,用于接收飞机生产厂家发送的飞机维修技术手册原文修订数据,对所述中英对照维护手册大数据库中的原文单句进行修订后,利用所述飞机维修技术手册数据的翻译***通过所述飞机维修技术手册数据的翻译方法对修订后的原文单句翻译并生成新的译文,所述新的译文替换中英对照维护手册大数据库中对应修订后的原文单句的原译文。
作为进一步改进,还包括自编内容***模块,用于将原有的***所述厂家原文飞机维修技术手册中的APS、MT、MSL以附件形式,以所述APS、MT、MSL的相关任务对应所述译文的关键词为***点,可折叠地***中英文双语段落中。
更一方面,提供了一种飞机维修技术手册查阅终端,其包括:
显示文本及图片接收模块,用于接收所述飞机维修技术手册的数据管理***所生成的中英文双语段落以及***所述中英文段落的图片,并在终端的显示屏所展示;
检索模块,连接所述飞机维修技术手册的数据管理***的检索接口,并在终端的显示屏内提供检索框,供维修人员在终端通过关键词对中英对照维护手册大数据库进行检索。
所述查阅终端,可以作如下改进:
作为进一步改进,还包括终端显示界面生成模块,用于将所述中英文段落、图片、目录结构在终端显示屏上分区显示。
作为进一步改进,所述查阅终端为移动终端,所述移动终端设置显示界面自适应模块,用于实现目录结构、中英文段落和图片之间的单屏跳转展示。
本发明相对于现有技术,具有如有有益效果:
(1)通过上述用于飞机维修技术手册数据的翻译方法和翻译***,能实现国外两家飞机制造厂商的厂家原文飞机维修技术手册进行汉化,防范了维修管理风险,提升了维修生产效率;
(2)通过飞机维修技术手册的数据管理方法及数据管理***,其运用国际通行的交互式结构化语言标准,使各类维修技术资料之间具有了交互式链接访问关系,包括AAMM(APS化飞机维护手册)、IPC(零部件图解手册)、FIM或TSM(故障隔离手册)、CML(消耗件材料清单)、TEM(工具设备手册)、SRM(结构修理手册)、 SPM(规范施工手册)等,数据管理***实现了单机化适用内容的查询;
(3)有效地打破了航空公司飞机维修技术文档管理(TDMS)***的局限,可以较好地将维护信函、维护提示信息在AAMM原文的准确位置体现,改变目前囿于条件限制不得不粗犷管理的现状,将改善维修人员手册使用体验,助力维修生产;
(4)有利于组织机务维修人员专业英语的学习,结构化的技术文件数据可以更加方便作为专业英语培训以及飞机各子***学习之用,使广大机务人员对飞机的认识从知道(know)的阶段方便跨越到深入了解(understand)的阶段;
(5)本发明将优秀的APS项目从培训指南升华成为具有适航意义的工作依据,将从维修实际中总结出的优秀APS内容与飞机制造商的厂家原文飞机维修技术手册相结合,形成维修依据文件,对关键步骤和操作进行多维度的提示和警示,改变了工程管理和质量管理要求落地难的局面,促进机务维修工程管理能力进一步提升;
(6)本发明从最初积累的工卡开始,逐步建立了基础术语库,基础语料库,和最终的中英文段落,为机器智能翻译、智能快速修订奠定了底层数据基础;
(7)使用上述基础术语库,基础语料库和中英文段落,加上少量人工干预,就能够实现飞机维修技术手册数据的快速翻译和修订,大大提高了飞机维修技术手册数据处理的效率,使其跟踪更新成为可能,从而确保了AAMM手册***的合法性和适航性。
(8)本发明建立的中英对照维护手册大数据库采用了国际流行的XML可扩展标记语言,使得文档可以像数据一样被其他的管理***识别和利用,在本发明中,手册内部以及手册之间可以交叉引用,实现各种相关程序、标签、图示之间的跳转和索引,为数字化维修、电签以及飞机智能化维修奠定了实施基础;
综上,对各类手册经过翻译,校对和审核实现汉化,从而将维修人员对手册理解偏差的风险降至最低;翻译过程中大量重复性工作由电脑完成,只需少量人工干预,同时做到快速跟踪修订;***航空公司飞机维护经验,对关键步骤,关键部位,关键数值进行优化处理,在提高效率的同时又能有效减少维修差错;采用可扩展标记语言实现体系化、结构化***全链接,实现了手册间跳转定位,方便快捷,准确无误;而独有的移动端浏览页面,极大方便了基层维修人员的工作。
附图说明
图1为实施例一所述翻译方法的流程图;
图2为维修工卡的示意图;
图3为docx文件解压后各组成部分的文件;
图4为XML文件标签样例;
图5为用于类别标识的程序代码;
图6为句段合并程序流程图;
图7为段落合并效果图;
图8和图9均为去重示例;
图10为需要特别注意的不能认作重复句的去重示例;
图11为假表示例;
图12为假表部分对应的XML文件代码;
图13为假表转换后的XML文件代码;
图14至图20均为用于演示断句过程的示例图;
图21为实施例二所述翻译方法的流程图;
图22为基础术语库部分内容示例;
图23为实施例三所述翻译***的结构框图;
图24为实施例四所述翻译***的结构框图;
图25为术语验证模块在进行报错时的界面;
图26为实施例五所述数据管理方法的流程图;
图27为实施例六所述数据管理***的结构框图;
图28至图30为用于演示自编内容***模块运作的示例图;
图31为将维修经验亦即自编内容批量***手册的批处理文件源代码节选;
图32至图33为用于演示移动终端的显示界面自适应模块运作的示例图;
图34为完成中英文维修工卡格式转换的中英对照表格文件。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步的详细描述。
实施例一
本发明提供了一种用于飞机维修技术手册数据的翻译方法,如图1所示,包括如下步骤。
步骤101,建立基础语料库,然后将中英文飞机维修工卡中的英文单句连同对应的中文单句,转换为可扩展标记语言后生成语料,存入所述基础语料库。
步骤102,对厂家原文飞机维修技术手册进行断句以分解成原文单句。
步骤103,对所述厂家原文飞机维修技术手册所分解出来的所有原文单句进行统计,筛选出所有不重复的原文单句。
具体地,AAMM平台所需要处理的数据量极为庞大,仅A320 AMM手册一项就有350万句段需要翻译。要完成这样一项艰巨的任务,除了我们工程师们的艰辛付出外,翻译软件也为我们提供了重要的帮助,技术类维修手册中通常有大量重复的句子,根据这一特点,使用trados的统计报告功能,可以筛选出所有不重复的句段,从而大幅度降低工作量;
以空客A320系列AMM手册为例,经过筛选,A320的维护手册共有不重复句段462688个,不到整本手册的总句段的七分之一,依据这个报告制定工作计划,大大降低了翻译人员的工作强度,提高工作效率。
步骤104,将所述原文单句与基础语料库中的英文单句进行匹配,判断匹配度;
若匹配度100%,执行步骤104a:直接将语料中的中文单句输出作为译文;否则,执行步骤104b,依据匹配度对原文单句进行相应预处理后,供译员翻译并输出译文。
步骤105,将所述译文连同其对应的原文单句,转换为可扩展标记语言后生成新的语料,存入所述基础语料库。
具体地,由于基础语料库可以设置在服务器上,每位译员都可以共享,使得任何一句经审核的语句译文可以供所有译员使用,不仅极大提高了翻译效率,也确保了翻译标准的统一。
该翻译方法还可以包括步骤106,检验语料中的非译元素与译文中的非译元素是否对应,如不对应则弹出警告要求译者修改。
所述步骤101,包括如下步骤:
步骤1011,将中英文飞机维修工卡进行格式转换,形成一列为中文单句、一列为英文单句且相互对照的表格文件,所述表格文件中的一行即为一条语料。
具体地,现有维修工卡为doc文档,如图2所示,格式转换的具体过程如下,其处理程序所用的编程语言为python。
首先将doc转化为docx,由于Word 2003及以前版本与Word 2007及其之后版本的组织方式不同,为满足更新需求及后来的Python docx库函数的使用,需要将doc格式文件转换为docx格式,而直接更改文件后缀的方式,会导致后期解析出问题,所以调用了win32程序,通过office软件将doc文件批量另存为docx文件;
将docx文件进行解压,由于docx文件本身是一个压缩文件,其集成了文本,图片以及大量的格式设置等等,通过zipfile可将docx解压成各个组成部分,如图3所示,通过分析这些组成部分,发现所需的文本都在doc文件夹下的document.xml中,因此可以只保存此xml文件;
通过对Word转化的xml标签分析,发现其基本的组织形式为para,如图4 所示,文本在<w:p>中的<w:t>标签内,锁定了需要提取的内容;
提取出带编号的段落,由于按照<w:t>标签提取出来的内容多且杂,最初的处理方式是找到需要删除的东西,然后用正则表达式将其删除,到后来发现,每份工卡的处理方式不同,个性内容也层出不穷,依靠删除内容的方法效率不高,普适性不强,这是因为我们所需的内容在原Word中都是以带编号的步骤出现,另外还有警告,警戒,注等特殊内容,其他内容基本都不需要,因此,接下来需要提取原Word中带编号的步骤内容,根据office的官方openxml文档,编号信息体现在<w:ilvl>和<w:numId>中,利用Python的lxml库解析出document.xml文件的numId父标签内的内容(另外用lxml解析Word生成的xml 文件时会遇到namespace的问题,这些信息都在相应的xml文件的起始位置,只需在程序中声明即可),此过程只提取出了标准格式的带编号内容,还有文本形式的带编号内容,而在标签中并没有相关信息,因此需要用逻辑关系将他们提取出来;
合并被拆分为多个段落的文本,经过上述步骤,所需的文本信息基本被提取出来,但很多Word中一个段落的文本被拆分成多个段落,一个句子被拆分成多个不完整的句子,因此需要将被拆开的句子重新合并,此外每份工程指令或工卡的内容有一定的组织规则,或者中文在上对应的英文在下或者英文在上对应的中文在下,基于此,在解析每篇文档时,先做出文档的语言上下的判断,然后将被目前的段落分类,并加上类别标识,具体的程序代码如图5所示:
1)按照Word格式编号的段落;
2)以文本形式编号的段落;
3)以Warning、Caution、NOTE等形式的段落;
标识完成后,Word文档中带步骤编号的段落和特殊形式(Warning、Caution、NOTE)的段落全部被标记出来,剩下的不带标记的段落即为需要合并的段落,合并规则如图6所示,经过图6的程序流程,可以将拆散的段落合并起来,最后得到如图7中维修工卡被拆分为多个段落的文本的合并效果,防止其后续中英双语对照时出现错误;
分句,接着将段落中的句子拆分,考虑到句子成分的复杂性,这里做了些简化,首先将整个段落按照软回车拆分为中文和英文分部分,然后将中文部分按照“。”拆分,英文部分按照“.”拆分,且拆分后的中文句段数量等于英文句段数量时,再合并中英文,使之成为我们希望的句段对照格式,因为英文中存在缩写加“.”的特殊情况,在拆分英文句段时,用了nltk自然语言分句库,它可以完美解决英文分句中非正常标点的断句;
写入Excel保存,经过分句后,可以将英文和对应的中文组织起来,用 xlwings操作Excel,将英中对照文本保存起来,形成一列为中文单句、一列为英文单句且相互对照的表格文件,如图34所示,所述表格文件中的一行即为一条语料,以备后续存入基础语料库。
步骤1012,若出现原文单句一致但译文不一致的多条语料时,只保留一条语料以存入基础语料库。
具体地,由于工卡翻译人员的不同,也可能导致同一句英文,有不同的对应中文。有些属于翻译问题,需要判断并保留正确译文。有些则只是习惯用语差异,需要去除冗余的译文句段,统一成一种比较顺畅的译文,如图8和图9所示。
另外,需要特别注意的是,经过转换整理后的中英对照表格文件中,有大量重复出现的句段,原文中很多句子整体极度相似,只有细微差别,比如数字,方位类名称(上/下,前/后,左/右等),如图10所示的例子,两个句段近30个单词,只相差一个字母,却指向不同位置的零件,这些绝不能算做重复句,否则会导致严重翻译错误。
所述步骤102包括如下步骤:
步骤1021,确定厂家原文飞机维修技术手册的标记语言是否为所述可扩展标记语言,若是则直接将其分解成原文单句,否则先转换为可扩展标记语言后,再对厂家原文飞机维修技术手册的内容进行断句以分解成原文单句。
具体地,目前空客320手册和波音737NG的部分厂家原文飞机维修手册如 AMM手册,使用的是SGML格式文件,而的现有维修工作中维修人员结合维修经验以及对文件的分析,以XML形式建立了APS化AMM平台的文件规则,为了便于对厂家原文飞机维修手册进行后续处理,最终用Arbor text将SGML格式的 AMM手册,转换为XML文件,以实现按需切分成合适的节文件来进行进一步翻译操作。
步骤1022,所述厂家原文飞机维修技术手册中存在的假表转换为可扩展标记语言之后,将所述假表内的制表符替换为用于表达表格属性的标签,以使假表中的内容能被正确分解为原文单句。
具体地,在AMM手册中存在如图11所示的不规范图表显示,它以叹号等标点符号作为制表符绘制表格边框,用空格控制表的长度,是早期文本处理时临时制表方法,分析XML文件后发现,其标签为<txtGraphic>,其子标签为<txtLine>,每一行为一个如图12所示的<txtLine>标签,这样的表格称为假表,假表的存在导致本来连续的手册原文被拆散再混合到不同的标签中,在软件中是以标签为单位对文件进行解析,这就导致在不同单元格的内容融合进同一单元格或者不同单元格混合成同一单元格的情况出现,给处理数据带来了很大的困难;为了解决这一问题,可以首先将XML中的<txtGraphic>标签提取出来,并根据每个假表的内容以符合XML结构的形式绘制新的表格,转换后的表格在XML 中以在txtgrphc标签后***的<table>标签显示,如图13所示,对<table>标签定义属性“xylinkid”以识别该表格,其子标签含义如下表:
tgroup | 定义列数 |
Colspec | 定义列宽比例及列识别号 |
Thead | 定义表头列数 |
Tbody | 定义表格正文 |
Row | 定义行 |
Para | 定义单元格内正文 |
Morerows | 定义合并单元格 |
通过以上方法,将难以处理的假表转换为格式统一的符合格式要求的表格形式,可以正确解析假表表格中的内容,方便后续进行处理。
步骤1023,用于定义可扩展标记语言中的特定标签作断句标记后,依据所述断句标记将厂家原文飞机维修技术手册的内容分解成原文单句。
具体地,断句错误一般是由Trados的断句规则将XML文件中的某些标签识别为结束符导致的,所以需要将Trados更改对标签的处理。如图14所示,图中,一句话被分成了3行,即44-46行,此时,需要查找原XML文件对应的内容是否有标签。用浏览器打开相应XML文件,查找45行的内容为图15所示,这句话被标签<REFINT></REFINT>分割开,继续查找XML文件中的标签“REFINT”,确认这个标签在文档其他位置的作用,如果没有其他作用,则可以设置Trados 中这个标签为“内嵌”,从而使遇到这个标签后,不被当做断句符。
设置成功后,打开文件,如图16所示,标签“REFINT”已显示出来,翻译时,标签必须保留,一般都是成对出现(句首如果有标签,则不能显示图17),其在句子中的相对位置可根据中文语序修改如图18,由于XML文件中存在大量的标签,且标签的功能各不相同,因此在翻译时,就需要对不同的标签进行不同的定义,以对XML文件进行解析,从而使文档的断句符合其含义的要求,在开始制定解析规则时,是将手册XML文件中所有的标签都列举出来,如图19所示,以此解析文件并进行翻译,在翻译过程中发现一处因为标签导致的异常断句修改一处解析规则,这样做需要对所有标签的上下文进行分析,费时费力,且需要根据翻译过程中的反馈不断地调整解析器规则,而且,每次调整都必须重新建立项目,导致了大量的重复工作;
经过总结,通过XPATH的方式重新定义标签规则。利用XPATH中子标签的对应关系,对句子的最小单位标签“PARA”下的所有子标签及孙标签都进行集合定义翻译属性,如图20所示,从而一次性的解决了翻译中的异常断句问题,有效地减少了需要分析的标签数量,大大提高了文件的解析效率。
步骤104中的预处理,包括:
步骤1041,若匹配度低于100%但不低于70%,则高亮原文单句中与语料的英文单句不一致的文本以生成待译单句,供译员人工翻译后输出译文。
步骤1042,若匹配度低于70%,则对原文单句使用神经元云翻译后生成参考译文,供译员参照所述参考译文,参考原文单句进行检查和修改后,输出译文。
实施例二
在实施例一的基础上,该用于飞机维修技术手册数据的翻译方法,如图21 所示,还可以包括如下步骤:
步骤201,建立基础术语库,提取厂家原文飞机维修技术手册中的专业术语并翻译,并将译文和原文转换为所述可扩展标记语言后作为基础术语,并存入所述基础术语库。
具体地,本实施例中所选取的飞机维修基础术语2181个,作为基础术语库,部分基础术语及翻译如图22所示。
步骤202,检索所述基础术语库中是否存在基础术语的原文与所述英文单句中的部分单词或词组相对应,若对应则进行提示以供译员参考。
步骤203,若译员认为特定单词或词组需要新增为基础术语,可以将所述特定单词或词组添加到术语库。
步骤204,若在先翻译的所述特定单词或词组的译文与术语库中基础术语的译文不对应,则报错以要求译员进行修正。
实施例三
本发明还提供了一种用于飞机维修技术手册数据的翻译***,如图23所示,包括:
语料生成模块,用于将中英文飞机维修工卡中的英文单句连同对应的中文单句,转换为可扩展标记语言后生成语料;
基础语料库,用于存储所述语料;
手册数据转换模块,用于对厂家原文飞机维修技术手册进行断句以分解成原文单句;
机器翻译模块,用于将所述原文单句与基础语料库中的英文单句进行匹配,并依据匹配度输出译文或预处理后供译员翻译再输出译文;
所述语料生成模块还将所述译文连同其对应的原文单句,转换为可扩展标记语言后以生成新的语料,存入所述基础语料库。
其中,语料生成模块包括:
工卡格式转换子模块,用于将中英文飞机维修工卡进行格式转换,形成一列为中文单句、一列为英文单句且相互对照的表格文件,所述表格文件中的一行即为一条语料;
语料去重子模块,用于判定新的语料在存入所述基础语料库之前是否出现原文单句一致但译文不一致的多条语料,若是则只保留一条语料以存入基础语料库。
其中,手册数据转换模块包括:
标记语言判断子模块,用于确定厂家原文飞机维修技术手册的标记语言是否为所述可扩展标记语言;
标记语言转换子模块,用于对厂家原文飞机维修技术手册转换为可扩展标记语言;
断句规则子模块,用于定义可扩展标记语言中的特定标签作断句标记后,依据所述断句标记将厂家原文飞机维修技术手册的内容分解成原文单句;
假表转换子模块,在所述厂家原文飞机维修技术手册中存在的假表转换为可扩展标记语言之后,用于将所述假表内的制表符替换为用于表达表格属性的标签,以使假表中的内容能被正确分解为原文单句;
统计子模块,用于对所述厂家原文飞机维修技术手册所分解出来的所有原文单句进行统计,筛选出所有不重复的原文单句。
其中,机器翻译模块还包括:
语料库检索子模块,用于检索所述基础语料库中与原文单句最相近的英文单句,并判定所述原文单句与所述英文单句的匹配度;
原文单句预处理子模块,用于高亮原文单句中与语料的英文单句不一致的文本以生成待译单句,或用于对原文单句进行神经元云翻译后生成参考译文。
实施例四
在实施例三的基础上,如图24所示,该用于飞机维修技术手册数据的翻译***还包括:
术语生成模块,用于提取厂家原文飞机维修技术手册中的专业术语并翻译,并将译文和原文转换为所述可扩展标记语言作为基础术语;
基础术语库,用于存储所述基础术语;
术语库检索模块,用于检索所述基础术语库中是否存在基础术语的原文与所述英文单句中的部分单词或词组相对应,若对应则进行提示以供译员参考;
术语验证模块,用于判断在先翻译的所述特定单词或词组的译文与术语库中基础术语的译文是否对应;
具体地,该术语验证模块总结了163个常见容易出现错误的关键词汇,建立逻辑关系,如果原文出现某个关键词,则中文必须有对应的译文,否则如图25 所示通过报错以要求人工处理;
非译元素检验模块,用于检验语料中的非译元素与译文中的非译元素是否对应,如不对应则弹出警告作为修改请求;
具体地,非译元素检验模块在检验如数字这一非译元素时,可以验证译文句子中的数字的个数和数值与原文句子中的完全一致性,如果有不同,则提出警告,要求译者修改。
实施例五
本发明还提供了一种飞机维修技术手册的数据管理方法,如图26所示,包括如下步骤:
步骤301,利用所述飞机维修技术手册数据的翻译***通过所述飞机维修技术手册数据的翻译方法对飞机维修技术手册数据进行翻译后,将所输出的译文整合成中英对照维护手册大数据库;
步骤302,将所述中英对照维护手册大数据库中的译文,依据厂家原文飞机维修技术手册中的目录结构,结合原文单句,生成原文单句在上、对应译文在下的中英文双语段落,向终端进行展示;
步骤303,将厂家原文飞机维修技术手册中的图片,依据其在厂家原文飞机维修技术手册中对应原文的位置,***至对应译文的中英文段落中;
步骤304,提供搜索接口,用于供维修人员在终端通过关键词对中英对照维护手册大数据库进行检索;
步骤305,接收飞机生产厂家发送的飞机维修技术手册原文修订数据,对所述中英对照维护手册大数据库中的原文单句进行修订;
步骤306,利用所述飞机维修技术手册数据的翻译***通过所述飞机维修技术手册数据的翻译方法对修订后的原文单句翻译并生成新的译文,所述新的译文替换中英对照维护手册大数据库中对应修订后的原文单句的原译文;
步骤307,将原有的***所述厂家原文飞机维修技术手册中的APS、MT(Maintenance Tip维护提示)、MSL(Maintenance Service Letter维护服务信函)以附件形式,以所述APS、MT、MSL的相关任务对应所述译文的关键词为***点,可折叠地***中英文双语段落中。
实施例六
本发明还提供了一种飞机维修技术手册的数据管理***,如图27所示,其包括:
数据库生成模块,用于利用所述飞机维修技术手册数据的翻译***通过所述飞机维修技术手册数据的翻译方法对飞机维修技术手册数据进行翻译后,将所输出的译文整合成中英对照维护手册大数据库;
具体地,该数据库生成模块使用现有空客A320、波音B737NG飞机维护中英文工卡,建立基础语料库和基础术语库,利用机器翻译模块使用基础语料库和术语库,翻译空客A320飞机、波音B737NG原厂家的AMM手册,经过人工校对/审核,不断提高机器翻译的准确度,最终形成完整的中英对照维护手册大数据库。
显示文本生成模块,用于将所述中英对照维护手册大数据库中的译文,依据厂家原文飞机维修技术手册中的目录结构,结合原文单句,生成原文单句在上、对应译文在下的中英文双语段落,向终端进行展示;
搜索接口,用于供维修人员在终端通过关键词对中英对照维护手册大数据库进行检索。
该数据管理***还包括手册修订模块,用于接收飞机生产厂家发送的飞机维修技术手册原文修订数据,对所述中英对照维护手册大数据库中的原文单句进行修订后,利用所述飞机维修技术手册数据的翻译***通过所述飞机维修技术手册数据的翻译方法对修订后的原文单句翻译并生成新的译文,所述新的译文替换中英对照维护手册大数据库中对应修订后的原文单句的原译文;
具体地,以中英对照维护手册大数据库为基础,实现人工干预下的厂家英文技术资料快速翻译、修订以及数字化、结构化处理,最大限度降低人工翻译/修订工作量,从而确保手册***的最新有效;
自编内容***模块,用于将原有的***所述厂家原文飞机维修技术手册中的APS、MT、MSL以附件形式,以所述APS、MT、MSL的相关任务对应所述译文的关键词为***点,可折叠地***中英文双语段落中。
具体地,自编内容分为航空公司维修管理理念(APS)和维修经验(MT,MSL 等),它们是飞机维修技术手册的数据管理***中AAMM手册的重要组成部分,***维护APS条目,将航空公司从多年维修实践中总结出的优秀APS内容与飞机制造厂家手册相结合,以***文字或图片形式讲解,对关键步骤,关键部位,关键数值进行优化处理,在提高效率的同时又能有效减少维修差错,将这些航空公司自编内容***AAMM手册,改变了工程管理和质量管理要求落地难的局面,促进航空公司维修工程管理能力进一步提升。
APS相关内容以文字或图片形式直接***AAMM手册,如图28所示,在***时,可以设置为可折叠的形式,避免使得自编内容占用过大的阅读版面,影响使用体验,维修经验(MT,MSL等)以附件形式***AAMM手册***相关任务中,如图29所示,基层维修人员在执行相关任务前,点击特定图标即可展开,得到如图30所示的维护提示。
同时,由于维修经验数量较大,***位置多样,开发组编写了相关批处理文件,将每个维修经验文件与其相应***点一一对照,成功实现了自动批量***。这种方式极大减少了***工作量,提高工作效率,图31所示即为将维修经验亦即自编内容批量***手册的批处理文件源代码节选。
实施例七
本发明还提供了一种飞机维修技术手册查阅终端,其包括:
显示文本及图片接收模块,用于接收所述飞机维修技术手册的数据管理***所生成的中英文双语段落以及***所述中英文段落的图片,并在终端的显示屏所展示;
检索模块,连接所述飞机维修技术手册的数据管理***的检索接口,并在终端的显示屏内提供检索框,供维修人员在终端通过关键词对中英对照维护手册大数据库进行检索;
终端显示界面生成模块,用于将所述中英文段落、图片、目录结构在终端显示屏上分区显示。
其中,所述查阅终端为移动终端,所述移动终端设置显示界面自适应模块,用于实现目录结构、中英文段落和图片之间的单屏跳转展示。具体地,如图32 和图33所示,当点击图32中的维修技术手册的其中一种类型如AMM时,即全屏跳转至图33中的目录。
本领域普通技术人员可以理解,实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储与一种计算机刻度存储介质中,上述提到的存储介质可以是只读存储器、磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应携带在本发明的保护范围之内。
Claims (31)
1.一种用于飞机维修技术手册数据的翻译方法,包括如下步骤:
建立基础语料库,然后将中英文飞机维修工卡中的英文单句连同对应的中文单句,转换为可扩展标记语言后生成语料,存入所述基础语料库;
对厂家原文飞机维修技术手册进行断句以分解成原文单句;
将所述原文单句与基础语料库中的英文单句进行匹配,若匹配度100%,则直接将语料中的中文单句输出作为译文,否则对原文单句进行预处理后,供译员翻译并输出译文;
将所述译文连同其对应的原文单句,转换为可扩展标记语言后生成新的语料,存入所述基础语料库。
2.根据权利要求1所述用于飞机维修技术手册数据的翻译方法,其特征在于:将所述中英文飞机维修工卡转换为所述可扩展标记语言之前,将中英文飞机维修工卡进行格式转换,形成一列为中文单句、一列为英文单句且相互对照的表格文件,所述表格文件中的一行即为一条语料。
3.根据权利要求2所述用于飞机维修技术手册数据的翻译方法,其特征在于:所述新的语料在存入所述基础语料库之前,若出现原文单句一致但译文不一致的多条语料时,只保留一条语料以存入基础语料库。
4.根据权利要求3所述用于飞机维修技术手册数据的翻译方法,其特征在于:在对所述厂家原文飞机维修技术手册进行断句之前,确定厂家原文飞机维修技术手册的标记语言是否为所述可扩展标记语言,若是则直接将其分解成原文单句,否则先转换为可扩展标记语言后,再对厂家原文飞机维修技术手册的内容进行断句以分解成原文单句。
5.根据权利要求4所述用于飞机维修技术手册数据的翻译方法,其特征在于:所述厂家原文飞机维修技术手册中存在的假表转换为可扩展标记语言之后,将所述假表内的制表符替换为用于表达表格属性的标签,以使假表中的内容能被正确分解为原文单句。
6.根据权利要求5所述用于飞机维修技术手册数据的翻译方法,其特征在于:对所述厂家原文飞机维修技术手册所分解出来的所有原文单句进行统计,筛选出所有不重复的原文单句。
7.根据权利要求6任一所述用于飞机维修技术手册数据的翻译方法,其特征在于,所述预处理,包括:
若匹配度低于100%但不低于70%,则高亮原文单句中与语料的英文单句不一致的文本以生成待译单句,供译员人工翻译后输出译文;
若匹配度低于70%,则对原文单句使用神经元云翻译后生成参考译文,供译员参照所述参考译文,参考原文单句进行检查和修改后,输出译文。
8.根据权利要求7所述用于飞机维修技术手册数据的翻译方法,其特征在于:检验语料中的非译元素与译文中的非译元素是否对应,如不对应则弹出警告要求译者修改。
9.根据权利要求1或8所述用于飞机维修技术手册数据的翻译方法,其特征在于,还包括如下步骤:
建立基础术语库,提取厂家原文飞机维修技术手册中的专业术语并翻译,并将译文和原文转换为所述可扩展标记语言后作为基础术语,并存入所述基础术语库;
检索所述基础术语库中是否存在基础术语的原文与所述英文单句中的部分单词或词组相对应,若对应则进行提示以供译员参考。
10.根据权利要求9所述用于飞机维修技术手册数据的翻译方法,其特征在于:若译员认为特定单词或词组需要新增为基础术语,可以将所述特定单词或词组添加到术语库。
11.根据权利要求10所述用于飞机维修技术手册数据的翻译方法,其特征在于:若在先翻译的所述特定单词或词组的译文与术语库中基础术语的译文不对应,则报错以要求译员进行修正。
12.一种用于飞机维修技术手册数据的翻译***,其包括:
语料生成模块,用于将中英文飞机维修工卡中的英文单句连同对应的中文单句,转换为可扩展标记语言后生成语料;
基础语料库,用于存储所述语料;
手册数据转换模块,用于对厂家原文飞机维修技术手册进行断句以分解成原文单句;
机器翻译模块,用于将所述原文单句与基础语料库中的英文单句进行匹配,并依据匹配度输出译文或预处理后供译员翻译再输出译文;
所述语料生成模块还将所述译文连同其对应的原文单句,转换为可扩展标记语言后以生成新的语料,存入所述基础语料库。
13.根据权利要求12所述用于飞机维修技术手册数据的翻译***,其特征在于:所述语料生成模块包括工卡格式转换子模块,用于将中英文飞机维修工卡进行格式转换,形成一列为中文单句、一列为英文单句且相互对照的表格文件,所述表格文件中的一行即为一条语料。
14.根据权利要求13所述用于飞机维修技术手册数据的翻译***,其特征在于:所述语料生成模块还包括语料去重子模块,用于判定新的语料在存入所述基础语料库之前是否出现原文单句一致但译文不一致的多条语料,若是则只保留一条语料以存入基础语料库。
15.根据权利要求12所述用于飞机维修技术手册数据的翻译***,其特征在于,所述手册数据转换模块包括:
标记语言判断子模块,用于确定厂家原文飞机维修技术手册的标记语言是否为所述可扩展标记语言;
标记语言转换子模块,用于对厂家原文飞机维修技术手册转换为可扩展标记语言。
16.据权利要求15所述用于飞机维修技术手册数据的翻译***,其特征在于:所述手册数据转换模块还包括断句规则子模块,用于定义可扩展标记语言中的特定标签作断句标记后,依据所述断句标记将厂家原文飞机维修技术手册的内容分解成原文单句。
17.据权利要求16所述用于飞机维修技术手册数据的翻译***,其特征在于:所述手册数据转换模块还包括假表转换子模块,在所述厂家原文飞机维修技术手册中存在的假表转换为可扩展标记语言之后,用于将所述假表内的制表符替换为用于表达表格属性的标签,以使假表中的内容能被正确分解为原文单句。
18.据权利要求17所述用于飞机维修技术手册数据的翻译***,其特征在于:所述手册数据转换模块还包括统计子模块,用于对所述厂家原文飞机维修技术手册所分解出来的所有原文单句进行统计,筛选出所有不重复的原文单句。
19.根据权利要求12所述用于飞机维修技术手册数据的翻译***,其特征在于,所述机器翻译模块还包括:
语料库检索子模块,用于检索所述基础语料库中与原文单句最相近的英文单句,并判定所述原文单句与所述英文单句的匹配度;
原文单句预处理子模块,用于高亮原文单句中与语料的英文单句不一致的文本以生成待译单句,或用于对原文单句进行神经元云翻译后生成参考译文。
20.根据权利要求12-19任一所述用于飞机维修技术手册数据的翻译***,其特征在于,还包括:
术语生成模块,用于提取厂家原文飞机维修技术手册中的专业术语并翻译,并将译文和原文转换为所述可扩展标记语言作为基础术语;
基础术语库,用于存储所述基础术语;
术语库检索模块,用于检索所述基础术语库中是否存在基础术语的原文与所述英文单句中的部分单词或词组相对应,若对应则进行提示以供译员参考。
21.根据权利要求20所述用于飞机维修技术手册数据的翻译***,其特征在于还包括术语验证模块,用于判断在先翻译的所述特定单词或词组的译文与术语库中基础术语的译文是否对应。
22.根据权利要求21所述用于飞机维修技术手册数据的翻译***,其特征在于,还包括非译元素检验模块,用于检验语料中的非译元素与译文中的非译元素是否对应,如不对应则弹出警告作为修改请求。
23.一种飞机维修技术手册的数据管理方法,包括如下步骤:
利用权利要求12-22任一所述飞机维修技术手册数据的翻译***通过权利要求1-11任一所述飞机维修技术手册数据的翻译方法对飞机维修技术手册数据进行翻译后,将所输出的译文整合成中英对照维护手册大数据库;
将所述中英对照维护手册大数据库中的译文,依据厂家原文飞机维修技术手册中的目录结构,结合原文单句,生成原文单句在上、对应译文在下的中英文双语段落,向终端进行展示;
将厂家原文飞机维修技术手册中的图片,依据其在厂家原文飞机维修技术手册中对应原文的位置,***至对应译文的中英文段落中。
提供搜索接口,用于供维修人员在终端通过关键词对中英对照维护手册大数据库进行检索。
24.根据权利要求23所述飞机维修技术手册的数据管理方法,其特征在于,还包括如下步骤:
接收飞机生产厂家发送的飞机维修技术手册原文修订数据,对所述中英对照维护手册大数据库中的原文单句进行修订;
利用所述飞机维修技术手册数据的翻译***通过所述飞机维修技术手册数据的翻译方法对修订后的原文单句翻译并生成新的译文,所述新的译文替换中英对照维护手册大数据库中对应修订后的原文单句的原译文。
25.根据权利要求24所述飞机维修技术手册的数据管理方法,其特征在于,还包括如下步骤:
将原有的***所述厂家原文飞机维修技术手册中的APS、MT、MSL以附件形式,以所述APS、MT、MSL的相关任务对应所述译文的关键词为***点,可折叠地***中英文双语段落中。
26.一种飞机维修技术手册的数据管理***,其包括:
数据库生成模块,用于利用所述飞机维修技术手册数据的翻译***通过所述飞机维修技术手册数据的翻译方法对飞机维修技术手册数据进行翻译后,将所输出的译文整合成中英对照维护手册大数据库;
显示文本生成模块,用于将所述中英对照维护手册大数据库中的译文,依据厂家原文飞机维修技术手册中的目录结构,结合原文单句,生成原文单句在上、对应译文在下的中英文双语段落,向终端进行展示;
搜索接口,用于供维修人员在终端通过关键词对中英对照维护手册大数据库进行检索。
27.根据权利要求26所述飞机维修技术手册的数据管理***,其特征在于:还包括手册修订模块,用于接收飞机生产厂家发送的飞机维修技术手册原文修订数据,对所述中英对照维护手册大数据库中的原文单句进行修订后,利用所述飞机维修技术手册数据的翻译***通过所述飞机维修技术手册数据的翻译方法对修订后的原文单句翻译并生成新的译文,所述新的译文替换中英对照维护手册大数据库中对应修订后的原文单句的原译文。
28.根据权利要求27所述飞机维修技术手册的数据管理***,其特征在于:还包括自编内容***模块,用于将原有的***所述厂家原文飞机维修技术手册中的APS、MT、MSL以附件形式,以所述APS、MT、MSL的相关任务对应所述译文的关键词为***点,可折叠地***中英文双语段落中。
29.一种飞机维修技术手册查阅终端,其包括:
显示文本及图片接收模块,用于接收所述飞机维修技术手册的数据管理***所生成的中英文双语段落以及***所述中英文段落的图片,并在终端的显示屏所展示;
检索模块,连接所述飞机维修技术手册的数据管理***的检索接口,并在终端的显示屏内提供检索框,供维修人员在终端通过关键词对中英对照维护手册大数据库进行检索。
30.根据权利要求29所述飞机维修技术手册的数据管理***,其特征在于:还包括终端显示界面生成模块,用于将所述中英文段落、图片、目录结构在终端显示屏上分区显示。
31.根据权利要求30所述飞机维修技术手册的数据管理***,其特征在于:所述查阅终端为移动终端,所述移动终端设置显示界面自适应模块,用于实现目录结构、中英文段落和图片之间的单屏跳转展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110148567.3A CN112949324A (zh) | 2021-01-28 | 2021-01-28 | 飞机维修技术手册数据的翻译、管理方法及其***和终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110148567.3A CN112949324A (zh) | 2021-01-28 | 2021-01-28 | 飞机维修技术手册数据的翻译、管理方法及其***和终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112949324A true CN112949324A (zh) | 2021-06-11 |
Family
ID=76242182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110148567.3A Pending CN112949324A (zh) | 2021-01-28 | 2021-01-28 | 飞机维修技术手册数据的翻译、管理方法及其***和终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112949324A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113590882A (zh) * | 2021-08-03 | 2021-11-02 | 武汉品致汽车技术有限公司 | 一种汽车电路电子图册整合方法 |
CN114970564A (zh) * | 2022-06-16 | 2022-08-30 | 北京汉端科技有限公司 | 基于云平台微服务化民航安全管理sop*** |
CN115829549A (zh) * | 2023-02-17 | 2023-03-21 | 中国航空工业集团公司西安飞机设计研究所 | 一种飞机维修工艺管理方法 |
CN117291399A (zh) * | 2023-11-24 | 2023-12-26 | 中航材利顿航空科技股份有限公司 | 一种基于xml的可视化工卡数据处理方法及*** |
CN117743286A (zh) * | 2024-02-20 | 2024-03-22 | 商飞软件有限公司 | 一种生成结构化飞机电子维护日志的***及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004220266A (ja) * | 2003-01-14 | 2004-08-05 | Cross Language Inc | 機械翻訳装置および機械翻訳方法 |
CN101539933A (zh) * | 2009-01-21 | 2009-09-23 | 北京跳网无限科技发展有限公司 | 智能型内容直达技术 |
CN103823796A (zh) * | 2014-02-25 | 2014-05-28 | 武汉传神信息技术有限公司 | 一种翻译***及翻译方法 |
CN107943797A (zh) * | 2017-11-22 | 2018-04-20 | 语联网(武汉)信息技术有限公司 | 一种全原文参考的在线翻译*** |
CN108519979A (zh) * | 2018-02-28 | 2018-09-11 | 成都优译信息技术股份有限公司 | 一种cat***中翻译记忆库和mt结合的方法及*** |
CN109783826A (zh) * | 2019-01-15 | 2019-05-21 | 四川译讯信息科技有限公司 | 一种文档自动翻译方法 |
-
2021
- 2021-01-28 CN CN202110148567.3A patent/CN112949324A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004220266A (ja) * | 2003-01-14 | 2004-08-05 | Cross Language Inc | 機械翻訳装置および機械翻訳方法 |
CN101539933A (zh) * | 2009-01-21 | 2009-09-23 | 北京跳网无限科技发展有限公司 | 智能型内容直达技术 |
CN103823796A (zh) * | 2014-02-25 | 2014-05-28 | 武汉传神信息技术有限公司 | 一种翻译***及翻译方法 |
CN107943797A (zh) * | 2017-11-22 | 2018-04-20 | 语联网(武汉)信息技术有限公司 | 一种全原文参考的在线翻译*** |
CN108519979A (zh) * | 2018-02-28 | 2018-09-11 | 成都优译信息技术股份有限公司 | 一种cat***中翻译记忆库和mt结合的方法及*** |
CN109783826A (zh) * | 2019-01-15 | 2019-05-21 | 四川译讯信息科技有限公司 | 一种文档自动翻译方法 |
Non-Patent Citations (1)
Title |
---|
解倩倩 等: "混合策略的汉维辅助翻译***的设计与实现", 现代电子技术, vol. 40, no. 20, pages 5 - 8 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113590882A (zh) * | 2021-08-03 | 2021-11-02 | 武汉品致汽车技术有限公司 | 一种汽车电路电子图册整合方法 |
CN113590882B (zh) * | 2021-08-03 | 2024-01-05 | 武汉品致汽车技术有限公司 | 一种汽车电路电子图册整合方法 |
CN114970564A (zh) * | 2022-06-16 | 2022-08-30 | 北京汉端科技有限公司 | 基于云平台微服务化民航安全管理sop*** |
CN114970564B (zh) * | 2022-06-16 | 2023-02-03 | 北京汉端科技有限公司 | 基于云平台微服务化民航安全管理sop*** |
CN115829549A (zh) * | 2023-02-17 | 2023-03-21 | 中国航空工业集团公司西安飞机设计研究所 | 一种飞机维修工艺管理方法 |
CN115829549B (zh) * | 2023-02-17 | 2023-05-05 | 中国航空工业集团公司西安飞机设计研究所 | 一种飞机维修工艺管理方法 |
CN117291399A (zh) * | 2023-11-24 | 2023-12-26 | 中航材利顿航空科技股份有限公司 | 一种基于xml的可视化工卡数据处理方法及*** |
CN117291399B (zh) * | 2023-11-24 | 2024-01-26 | 中航材利顿航空科技股份有限公司 | 一种基于xml的可视化工卡数据处理方法及*** |
CN117743286A (zh) * | 2024-02-20 | 2024-03-22 | 商飞软件有限公司 | 一种生成结构化飞机电子维护日志的***及方法 |
CN117743286B (zh) * | 2024-02-20 | 2024-05-24 | 商飞软件有限公司 | 一种生成结构化飞机电子维护日志的***及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949324A (zh) | 飞机维修技术手册数据的翻译、管理方法及其***和终端 | |
US6014680A (en) | Method and apparatus for generating structured document | |
US6654950B1 (en) | Software rehosting system and method | |
US6539348B1 (en) | Systems and methods for parsing a natural language sentence | |
US7721201B2 (en) | Automatic authoring and publishing system | |
US7478092B2 (en) | Key term extraction | |
US20070101259A1 (en) | Automatic Authoring and Publishing System | |
US7231600B2 (en) | File translation | |
CN102262621A (zh) | 译文检查装置及译文检查方法 | |
US20090083300A1 (en) | Document processing device and document processing method | |
EP1830274A1 (en) | Server device and name space issuing method | |
US8423888B2 (en) | Document conversion and use system | |
CN111159979A (zh) | 一种将动态数据整合生成pdf文档的方法及程序 | |
US20080052616A1 (en) | Document Processing Method and Device | |
CN114385679A (zh) | 一种表结构巡检方法、表结构巡检装置和电子设备 | |
US20070260973A1 (en) | Document Processing Method and Device | |
US20080005085A1 (en) | Server Device and Search Method | |
US20090287994A1 (en) | Document processing device and document processing method | |
EP1837776A1 (en) | Document processing device and document processing method | |
Nagao et al. | An attempt to computerized dictionary data bases | |
EP1744271A1 (en) | Document processing device | |
Ott | Strategies and tools for textual scholarship: the Tübingen System of Text Processing Programs (TUSTEP) | |
Tursunov | Description of the management system programs of the national corpus of the uzbek language | |
US20090083620A1 (en) | Document processing device and document processing method | |
Lutsky | Automating testing by reverse engineering of software documentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |