CN106649295A - 用于移动终端的文字转译方法 - Google Patents

用于移动终端的文字转译方法 Download PDF

Info

Publication number
CN106649295A
CN106649295A CN201710005334.1A CN201710005334A CN106649295A CN 106649295 A CN106649295 A CN 106649295A CN 201710005334 A CN201710005334 A CN 201710005334A CN 106649295 A CN106649295 A CN 106649295A
Authority
CN
China
Prior art keywords
translation
text message
word
segmentation
mobile terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710005334.1A
Other languages
English (en)
Inventor
廉洁
任博
赵钟华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Network Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Network Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Network Technology Shanghai Co Ltd filed Critical Ctrip Travel Network Technology Shanghai Co Ltd
Priority to CN201710005334.1A priority Critical patent/CN106649295A/zh
Publication of CN106649295A publication Critical patent/CN106649295A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种用于移动终端的文字转译方法,首先,根据原语言库对文本信息进行自动分段,形成至少两段子文本信息;当形成的至少两段子文本信息满足分段要求时,根据转译对照语言库对每段子文本信息进行目标语言的转译,并将转译结果显示于相应填写框。本发明能在使用手机等职能移动设备输入表单信息时,在手动输入部分信息后,实现多个填写框的自动对应填入与语言切换。本发明能够解决在手动输入转换译文内容时效率较低且出错率较高的问题,增加了用户操作的便捷性、正确性。

Description

用于移动终端的文字转译方法
技术领域
本发明涉及数据输入领域,具体涉及一种用于移动终端的文字转译方法。
背景技术
随着互联网技术、智能移动技术的发展,利用互联网、智能移动终端进行智能操作,为人们的生活提供了越来越便利的条件。在日常购物、休闲、旅游过程中,越来越多的人们利用移动终端进行购买、预约等行为,使得在利用移动终端进行信息输入,变成了越来越频繁的动作。然而,在实际使用中,随着信息量的增大,在人们进行网络操作过程中,要求填入的信息量也越来越大,由于利用移动终端进行信息填写时,输入费力度较高,且易出错率较高,现有技术中,当填写错误时,人们只能选择手动重新输入,使得人们的体验度降低。
发明内容
本发明的目的在于为了解决现有技术中,利用移动终端填写信息出错概率高等问题的出现;提供用于移动终端的文字转译方法。
为了达到上述目的,本发明通过以下技术方案实现:
一种用于移动终端的文字转译方法,所述方法包含:
S1,根据原语言库对文本信息进行自动分段,形成至少两段子文本信息;
S2,当形成的至少两段所述子文本信息满足分段要求时,根据转译对照语言库对每段所述子文本信息进行目标语言的转译,并将转译结果显示于相应填写框。
较佳地,在所述步骤S1之前;所述方法还包含:
输入所述文本信息,并判断所述文本信息是否符合书写要求;
当不符合书写要求时,重写输入所述文本信息;
当符合书写要求时,执行所述步骤S1。
较佳地,所述步骤S1包含:
根据所述原语言库对所述文本信息进行自动分段时,判断是否存在至少两种分段方式;
当存在至少两种所述分段方式时,选择适合当前场景的所述分段方式对所述文本信息进行分段,形成至少两段所述子文本信息,执行步骤S2;
当仅存在一种所述分段方式时,采用所述分段方式对所述文本信息进行分段,形成至少两段所述子文本信息,执行步骤S2。
较佳地,在所述步骤S1之后,所述方法还包含:
当形成的至少两段所述子文本信息不能满足所述分段要求时,根据所述分段要求对所述文本信息进行手动分段,将所述文字信息划分为符合所述分段要求的至少两段所述子文本信息;
将每段所述子文本信息根据转译要求进行手动转译,并将所述转译结果填写于所述相应填写框,结束。
较佳地,在所述步骤S2中,具体包含:
当根据所述转译对照语言库对每段所述子文本信息进行转译时,判断是否存在多种可能的译文;
当存在多种可能的译文时,判断是否存在符合转译要求的译文;当存在时,选择符合所述转译要求的译文作为所述转译结果显示于相应所述填写框;否则,用户手动输入译文作为所述转译结果显示于相应所述填写框;
当仅存在一种译文时,判断译文是否符合所述转译要求;符合时,将译文作为所述转译结果显示于相应所述填写框;否则,用户手动输入译文作为所述转译结果填写于相应所述填写框。
较佳地,在所述步骤S1中:
将所述文本信息按照原语言读写习惯顺序调用所述原语言库进行逐字逐句匹配;当所述文本信息的任一部分内容匹配成功时,则在已匹配内容末尾处进行分段;当所述文本信息出现至少两种匹配结果时,判断存在所述多种分段方式;否则,仅存在一种所述分段方式。
较佳地,所述原语言库包含所述文本信息相应领域的所有专业术语;所述转译对照语言库包含与所述原语言库中所有词语对应的目标语言的词语。
较佳地,在所述步骤S1之前;所述方法还包含:
输入并识别语音信息,将所述语音信息转换为所述文本信息,并判断所述文本信息是否符合书写要求;
当不符合书写要求时,重写输入所述语音信息;
当符合书写要求时,执行所述步骤S1。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明的积极进步效果在于:
本发明公开的一种用于移动终端的文字转译方法,首先,根据原语言库对文本信息进行自动分段,形成至少两段子文本信息;当形成的至少两段子文本信息满足分段要求时,根据转译对照语言库对每段子文本信息进行目标语言的转译,并将转译结果显示于相应填写框。本发明能在使用手机等职能移动设备输入表单信息时,在手动输入部分信息后,实现多个填写框的自动对应填入与语言切换。本发明能够解决在手动输入转换译文内容时效率较低且出错率较高的问题,增加了用户操作的便捷性、正确性。
附图说明
图1为本发明用于移动终端的文字转译方法的整体流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明公开的一种用于移动终端的文字转译方法,能够实现用户在移动终端进行表单填写时,实现对已输入的文本信息进行自动分段、转译后填入相应的填写框。降低了用户的输入难度以及输入出错率。
如图1所示,用于移动终端的文字转译方法包含:
S0,输入文本信息,并判断文本信息是否符合书写要求。当不符合书写要求时,重新执行步骤S0;在符合书写要求时,当存在转译需求时,执行步骤S1。
本实施例中,用户在移动终端进行表单填写时,先在一个填写框内输入文本信息,并且自动验证文本信息是否符合该表单的书写要求。当符合时,执行步骤S1,否则重新输入文本信息至该填写框。
本发明公开的用于移动终端的文字转译方法还可以包含:
S01,输入并识别语音信息,将语音信息转换为所述文本信息,并判断所述文本信息是否符合书写要求。当不符合书写要求时,重写执行步骤S01;当符合书写要求时,执行所述步骤S1。
S1,根据原语言库对文本信息进行自动分段,形成至少两段子文本信息。该步骤S1包含:
S1.1,根据原语言库对文本信息进行自动分段时,判断是否存在至少两种分段方式。
在上述步骤S1.1中:
将文本信息按照原语言读写习惯顺序调用原语言库进行逐字逐句匹配。
当文本信息的任一部分内容匹配成功时,则在已匹配内容末尾处进行分段。
当文本信息出现至少两种匹配结果时,判断存在多种分段方式;否则,仅存在一种分段方式。
本实施例以填入的文本信息是姓名为例进行说明,需要说明的是,姓名信息仅仅是本发明一个实施例,而不是全部的实施例。
根据中文的读写习惯顺序从左至有调用中文语言库作为原语言库进行逐字翻译;文本信息内左侧信息为姓氏、右侧信息为名。能够利用中文语言库中的百家姓将名字中的姓氏与名进行匹配。当在识别过程中出现多种匹配结果时,例如:一种匹配结果包含姓氏为复姓、名,另一种匹配结果包含姓氏为单姓、名时;则判断存在多种分段方式。
S1.2,当存在至少两种分段方式时,选择适合当前场景的最优分段方式对文本信息进行分段,形成至少两段子文本信息,执行步骤S2。
当用户判断输入姓名中包含复姓时,选择复姓、名这种分段方式,对姓名信息进行分段。
或当用户判断输入姓名中包含单姓时,选择单姓、名这种分段方式,对姓名信息进行分段。
S1.3,当仅存在一种分段方式时,采用分段方式对文本信息进行分段,形成至少两段子文本信息,执行步骤S2。
在步骤S1之后,本方法还包含:
当形成的至少两段子文本信息不能满足分段要求时,根据分段要求对文本信息进行手动分段,将文字信息划分为符合分段要求的至少两段子文本信息。
本发明中,当用户需要手动分段时,用户能够手动选择在文本信息的具***置进行分段。
将每段子文本信息根据转译要求进行手动转译,并将转译结果填写于相应填写框,结束。
本实施例中,当用户输入的姓名信息不能够得到正确分段时,则用户根据实际分段要求、转译要求,在相应的填写框内分别填入用目标语言输入的姓与名。
S2,当形成的至少两段子文本信息满足分段要求时,根据转译对照语言库对每段子文本信息进行目标语言的转译,并将转译结果显示于相应填写框。
在步骤S2中,具体包含:
S2.1,当根据转译对照语言库对每段子文本信息进行转译时,判断是否存在多种可能的译文。
在本实施例中,由于中文存在大量多音字,所有在对已分段的姓、名进行转译时,根据查找转译对照语言库时,判断是否在每段子文本信息中存在多音字或多种转译方式。
S2.2,当存在多种可能的译文时,判断是否存在符合转译要求的译文;当存在时,选择符合转译要求的译文作为转译结果显示于相应填写框;否则,用户手动输入译文作为转译结果填写于相应填写框。
当用户输入的姓名中包含多音字的姓或名时,用户根据实际需求选择合适的转译结果填入并显示在对应的填写框。
S2.2,当仅存在一种译文时,判断译文是否符合转译要求;符合时,将译文作为转译结果显示于相应填写框;否则,用户手动输入译文作为转译结果填写于相应填写框。
当转译对照语言库查找的对应译文不符合用户要求时,用户手动输入正确的译文至对应的填写框内。
本发明还包含如下实施例:
例1:
用户语音输入要求查询信息,例如,交通工具以及乘车信息查询时,用户语音输入出发日期、出发地、目的地等,如:“xx年xx月xx日,从A地出发至B地”。
首先,将语音信息识别为文字信息。也即,本例中将上述语音信息识别为具体文字信息“xx年xx月xx日,从A地出发至B地”。
其次,根据原语言库对文本信息进行自动分段,形成至少两段子文本信息。本例中,识别的子文本信息包含:“xx年xx月xx日”、“从A地出发”、“至B地”。
再次,当形成的多段子文本信息满足分段要求时,根据转译对照语言库对每段子文本信息进行目标语言的转译,并将转译结果显示于相应填写框。
本例中,根据转译对照语言库,对上述每段子文本信息进行目标语言的转译,最终填入多个填写框的信息分别是“xx年xx月xx日”、“A地”、“B地”。
例2:
首先,用户输入文本信息“上海市长宁区D路yy号”。
其次,根据原语言库对文本信息进行自动分段,形成至少两段子文本信息。本例中,识别的子文本信息包含:“上海市”、“长宁区”、“D路”、“yy号”。
再次,当形成的多段子文本信息满足分段要求时,根据转译对照语言库对每段子文本信息进行目标语言的转译。当目标语言为英语时,并将转译结果显示于相应填写框,具体为:
Address:No.yy,D Road
District:C1 District
City:Shanghai本发明中,原语言库包含文本信息相应领域的所有专业术语;转译对照语言库包含与原语言库中所有词语对应的目标语言的词语。例如,当原语言库为中文语言库时,根据输入文本信息的不同查找对应中文语言库中与该文本信息相关的所有专业术语的术语库;当要求的转译文为英文或日文时,转译对照语言库包含与中文该文本信息相关的所有专业术语英文或日文术语库。
根据上述实施例可知,本发明公开的一种用于移动终端的文字转译方法,能够提升同一文本信息多种语言版本输入的效率,改善输入的单一性,同时提高了输入的正确率,降低了用户操作移动终端的操作难度,提高了用户体验满意度。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (8)

1.一种用于移动终端的文字转译方法,其特征在于,方法包含:
S1,根据原语言库对文本信息进行自动分段,形成至少两段子文本信息;
S2,当形成的至少两段所述子文本信息满足分段要求时,根据转译对照语言库对每段所述子文本信息进行目标语言的转译,并将转译结果显示于相应填写框。
2.如权利要求1所述的用于移动终端的文字转译方法,其特征在于,在所述步骤S1之前;所述方法还包含:
输入所述文本信息,并判断所述文本信息是否符合书写要求;
当不符合书写要求时,重写输入所述文本信息;
当符合书写要求时,执行所述步骤S1。
3.如权利要求1所述的用于移动终端的文字转译方法,其特征在于,所述步骤S1包含:
根据所述原语言库对所述文本信息进行自动分段时,判断是否存在至少两种分段方式;
当存在至少两种所述分段方式时,选择适合当前场景的所述分段方式对所述文本信息进行分段,形成至少两段所述子文本信息,执行步骤S2;
当仅存在一种所述分段方式时,采用所述分段方式对所述文本信息进行分段,形成至少两段所述子文本信息,执行步骤S2。
4.如权利要求1所述的用于移动终端的文字转译方法,其特征在于,在所述步骤S1之后,所述方法还包含:
当形成的至少两段所述子文本信息不能满足所述分段要求时,根据所述分段要求对所述文本信息进行手动分段,将所述文字信息划分为符合所述分段要求的至少两段所述子文本信息;
将每段所述子文本信息根据转译要求进行手动转译,并将所述转译结果填写于所述相应填写框,结束。
5.如权利要求1所述的用于移动终端的文字转译方法,其特征在于,在所述步骤S2中,具体包含:
当根据所述转译对照语言库对每段所述子文本信息进行转译时,判断是否存在多种可能的译文;
当存在多种可能的译文时,判断是否存在符合转译要求的译文;当存在时,选择符合所述转译要求的译文作为所述转译结果显示于相应所述填写框;否则,用户手动输入译文作为所述转译结果填写于相应所述填写框;
当仅存在一种译文时,判断译文是否符合所述转译要求;符合时,将译文作为所述转译结果显示于相应所述填写框;否则,用户手动输入译文作为所述转译结果填写于相应所述填写框。
6.如权利要求3所述的用于移动终端的文字转译方法,其特征在于,在所述步骤S1中:
将所述文本信息按照原语言读写习惯顺序调用所述原语言库进行逐字逐句匹配;当所述文本信息的任一部分内容匹配成功时,则在已匹配内容末尾处进行分段;当所述文本信息出现至少两种匹配结果时,判断存在多种所述分段方式;否则,仅存在一种所述分段方式。
7.如权利要求1所述的用于移动终端的文字转译方法,其特征在于,所述原语言库包含所述文本信息相应领域的所有专业术语;所述转译对照语言库包含与所述原语言库中所有词语对应的目标语言的词语。
8.如权利要求1所述的用于移动终端的文字转译方法,其特征在于,在所述步骤S1之前;所述方法还包含:
输入并识别语音信息,将所述语音信息转换为所述文本信息,并判断所述文本信息是否符合书写要求;
当不符合书写要求时,重写输入所述语音信息;
当符合书写要求时,执行所述步骤S1。
CN201710005334.1A 2017-01-04 2017-01-04 用于移动终端的文字转译方法 Pending CN106649295A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710005334.1A CN106649295A (zh) 2017-01-04 2017-01-04 用于移动终端的文字转译方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710005334.1A CN106649295A (zh) 2017-01-04 2017-01-04 用于移动终端的文字转译方法

Publications (1)

Publication Number Publication Date
CN106649295A true CN106649295A (zh) 2017-05-10

Family

ID=58844103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710005334.1A Pending CN106649295A (zh) 2017-01-04 2017-01-04 用于移动终端的文字转译方法

Country Status (1)

Country Link
CN (1) CN106649295A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108182183A (zh) * 2017-12-27 2018-06-19 北京百度网讯科技有限公司 图片文字翻译方法、应用及计算机设备
CN109656510A (zh) * 2017-10-11 2019-04-19 腾讯科技(深圳)有限公司 一种网页中语音输入的方法及终端

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1282932A (zh) * 1999-07-29 2001-02-07 松下电器产业株式会社 汉字分段装置
CN101008942A (zh) * 2006-01-25 2007-08-01 北京金远见电脑技术有限公司 机器翻译装置和机器翻译方法
CN101216819A (zh) * 2007-12-28 2008-07-09 北京邮电大学 基于领域本体的名片信息中译英自动翻译方法
CN101256559A (zh) * 2007-02-27 2008-09-03 株式会社东芝 用于处理输入语音的装置和方法
CN102663016A (zh) * 2012-03-21 2012-09-12 上海汉翔信息技术有限公司 电子设备上输入候选框进行输入信息扩展的***及其方法
CN104252861A (zh) * 2014-09-11 2014-12-31 百度在线网络技术(北京)有限公司 视频语音转换方法、装置和服务器
CN104346151A (zh) * 2013-07-30 2015-02-11 联想(北京)有限公司 一种信息处理方法及电子设备
CN104391840A (zh) * 2014-11-24 2015-03-04 上海迈外迪网络科技有限公司 翻译方法及装置
CN104754536A (zh) * 2013-12-27 2015-07-01 ***通信集团公司 一种不同语言间实现通信的方法和***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1282932A (zh) * 1999-07-29 2001-02-07 松下电器产业株式会社 汉字分段装置
CN101008942A (zh) * 2006-01-25 2007-08-01 北京金远见电脑技术有限公司 机器翻译装置和机器翻译方法
CN101256559A (zh) * 2007-02-27 2008-09-03 株式会社东芝 用于处理输入语音的装置和方法
CN101216819A (zh) * 2007-12-28 2008-07-09 北京邮电大学 基于领域本体的名片信息中译英自动翻译方法
CN102663016A (zh) * 2012-03-21 2012-09-12 上海汉翔信息技术有限公司 电子设备上输入候选框进行输入信息扩展的***及其方法
CN104346151A (zh) * 2013-07-30 2015-02-11 联想(北京)有限公司 一种信息处理方法及电子设备
CN104754536A (zh) * 2013-12-27 2015-07-01 ***通信集团公司 一种不同语言间实现通信的方法和***
CN104252861A (zh) * 2014-09-11 2014-12-31 百度在线网络技术(北京)有限公司 视频语音转换方法、装置和服务器
CN104391840A (zh) * 2014-11-24 2015-03-04 上海迈外迪网络科技有限公司 翻译方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109656510A (zh) * 2017-10-11 2019-04-19 腾讯科技(深圳)有限公司 一种网页中语音输入的方法及终端
CN109656510B (zh) * 2017-10-11 2021-12-07 腾讯科技(深圳)有限公司 一种网页中语音输入的方法及终端
CN108182183A (zh) * 2017-12-27 2018-06-19 北京百度网讯科技有限公司 图片文字翻译方法、应用及计算机设备
CN108182183B (zh) * 2017-12-27 2021-09-17 北京百度网讯科技有限公司 图片文字翻译方法、应用及计算机设备

Similar Documents

Publication Publication Date Title
CN103123618B (zh) 文本相似度获取方法和装置
CN101950284B (zh) 中文分词方法及***
CN107463553A (zh) 针对初等数学题目的文本语义抽取、表示与建模方法和***
CN110232186A (zh) 融合实体描述、层次化类型和文本关系信息的知识图谱表示学习方法
CN105976818A (zh) 指令识别的处理方法及装置
CN101458681A (zh) 语音翻译方法和语音翻译装置
CN101950285A (zh) 利用统计学方法对汉字的本国语读音串转换***及其方法
CN108021552A (zh) 一种电力***操作票内容提取方法及***
CN108052499A (zh) 基于人工智能的文本纠错方法、装置及计算机可读介质
CN106557777B (zh) 一种基于SimHash改进的Kmeans文档聚类方法
CN106407235B (zh) 一种基于点评数据的语义词典构建方法
CN101937430A (zh) 一种汉语句子中事件句式的抽取方法
CN110457689A (zh) 语义处理方法及相关装置
CN109165273A (zh) 一种面向大数据环境的通用中文地址匹配方法
CN106777118B (zh) 一种基于模糊字典树的地理词汇快速抽取方法
CN108932233B (zh) 翻译文生成方法、翻译文生成装置以及翻译文生成程序
CN106155998B (zh) 一种数据处理方法及装置
CN106649295A (zh) 用于移动终端的文字转译方法
CN115438197B (zh) 一种基于双层异质图的事理知识图谱关系补全方法及***
CN105956158A (zh) 基于海量微博文本和用户信息的网络新词自动提取的方法
CN107256212A (zh) 中文搜索词智能切分方法
CN103853792A (zh) 一种图片语义自动标注方法与***
CN110210041A (zh) 互译句对齐方法、装置及设备
CN102023854B (zh) 一种基于模板的语义变量抽取方法
CN105468792B (zh) 一种基于大数据的模糊查询方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170510