CN103914446A - 翻译方法及翻译*** - Google Patents
翻译方法及翻译*** Download PDFInfo
- Publication number
- CN103914446A CN103914446A CN201310005842.1A CN201310005842A CN103914446A CN 103914446 A CN103914446 A CN 103914446A CN 201310005842 A CN201310005842 A CN 201310005842A CN 103914446 A CN103914446 A CN 103914446A
- Authority
- CN
- China
- Prior art keywords
- translation
- image
- unit
- data
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开了一种翻译方法及翻译***,翻译***连接至少两个翻译服务提供商,包含:一影像撷取单元用以撷取原稿文件的影像数据,一影像辨识单元接收原稿文件的影像数据并转换为文字数据,文字数据分别传递到至少两个翻译服务提供商进行翻译,以及一比对单元接收翻译服务提供商产生的翻译结果,并选出最佳的翻译结果。藉此,使用者无需自行将文件输入亦可进行全文翻译,且借着自动比对以及同步显示各个翻译结果,能让使用者能够以最短的时间了解最佳翻译的结果。
Description
技术领域
本发明涉及一种使用机器进行翻译的***,特别是一种利用云端服务器进行全文翻译的***及其方法。
背景技术
在国际化的趋势下,全世界的资料交流日趋频繁。因此在现今的社会环境下常需接触各种国外文件,但对于许多外语能力较差的使用者而言,阅读国外文件之前需要花费相当多的时间进行查询及翻译以了解文件的内容。
为了提升用户查询及翻译的速度,市面上已有多种辅助工具可供使用者利用。例如扫描式翻译笔便可对文件加以扫描,并利用翻译笔内建的光学文字辨识模块以及字典数据库来提供逐字翻译功能。而在智能型手机逐渐普及后也有利用智能型手机拍摄要翻译的文件页面并进行光学文字辨识后,接着上传到云端服务器查询翻译者。
通过上述扫描或摄影的手段自动撷取文件内容,可以有效提升用户翻译文件的速度。但手持式的装置受限于其数据储存量或是运算效能等因素;因此所能提供的翻译语言有限,且普遍缺乏全文翻译功能,使用上仍有诸多不便。
另外,许多网络服务提供者都有提供在线的翻译服务,不但可以进行全文翻译,更可以根据输入的文字自行判断该以何种语言进行翻译。但是使用者就必须自行输入要翻译的内容,当使用者对该份国外文件所使用的语言不熟悉时将花费相当多的时间进行输入。且机器进行全文翻译的准确度仍有加强空间,因此在机器翻译之后使用者仍需花费许多时间反复校阅才能了解文件的内容。
有鉴于上述缺点,既有的翻译装置实有必要加以改良。
发明内容
本发明的目的在提供一种快速令使用者了解最佳翻译结果的翻译***及其翻译方法。
为了达成所述目的,本发明的翻译***连接至少两个位于云端的翻译服务提供商,其包含一影像撷取单元,撷取一原稿文件的影像数据;一数据传输单元,与翻译服务提供商之间传递或接收数据;一比对单元,比对由多个翻译服务提供商产生的翻译结果并选出最佳的翻译结果;及一显示单元,显示原稿文件的影像数据,各个翻译结果以及最佳翻译。
翻译***还包括一影像接合单元,拼合由影像撷取单元逐步取得的影像内容以成一完整的图文件影像。
在一可行实施例中,翻译***还包括一影像辨识单元,设置于云端的服务器中以接收影像数据并转换为文字数据。
在另一可行实施例中,翻译***还包括一影像辨识单元,设置于客户端的个人运算装置中以接收影像数据并转换为文字数据。
在又一可行实施例中,所述影像撷取单元为扫描装置、摄影装置或鼠标其中之一。
为了达成上述目的,本发明的翻译方法包含以下步骤:使用影像撷取单元撷取原稿文件的影像数据;将原稿文件的影像数据传递至影像辨识单元,使影像数据转换为文字数据;将转换后的文字数据分别传递至多个翻译服务提供商进行翻译;比对多个翻译服务提供商产生的翻译结果,并选出最佳的翻译结果。
翻译方法还包含;将文件原文、各个翻译结果以及最佳翻译同时显示在显示单元。
决定最佳翻译的方法包含以下步骤:将各个翻译结果以标点符号为依据分成数个句子,并依照句子出现在翻译结果中的顺序加以编号;接着将不同翻译结果中编号相同的句子互相比对,并统计相同字词出现在不同翻译结果之间的次数;将具有较多关键词重复出现次数的翻译结果定为最佳翻译。
显示翻译结果的方式是将各个翻译结果以并列的方式共同显示于显示单元的中央区段,而文件原文以及最佳翻译则分别显示在显示单元的上方区段以及下方区段。
本发明的特点在于以扫描或摄影等方式撷取原稿文件的影像数据并进行光学文字辨识(OCR)后,上传至多个不同的全文翻译服务提供商的网络服务器进行全文翻译,以节省使用者输入及查询单字的时间。而且在接收各组翻译数据后予以互相比对,以从中选择出最佳翻译。并将各个翻译结果以水平并列的方式共同显示于屏幕中央区段,方便使用者相互比对。而文件原文以及最佳翻译则分别显示在屏幕的上方区段及下方区段,让使用者能够以最短的时间了解最佳翻译的结果。
附图说明
图1是本发明的组件方块图。
图2是以本发明撷取原稿文件影像的示意图本发明一实施例的组件示意图。
图3是本发明另一实施例的组件方块图。
图4是本发明的步骤流程图。
图5是将翻译结果分段为句子的示意图。
图6是本发明显示翻译结果的接口示意图。
其中,附图标记说明如下:
具体实施方式
为详细说明本发明的技术内容、构造特征、所达成目的及功效,以下兹举例并配合图式详予说明。
请参阅图1与图2,是本发明翻译***的第一实施例,其包含影像撷取单元10、影像接合单元60、影像辨识单元20、数据传输单元30、比对单元70及多个翻译服务提供商40。影像撷取单元10设为具扫描功能的鼠标11。在该鼠标11底部设有接近式影像扫描模块(图未示)以及一启动开关12,当使用者触动启动开关12后,该接近式影像扫描装置便开始撷取影像。此时用户可移动鼠标11通过原稿文件90表面,并逐步取得原稿文件90的影像内容。
由鼠标11扫描取得的影像内容将被传送到影像接合单元60之中以拼合成完整的图文件影像,接着再利用影像辨识单元20进行光学文字识别(OCR),将图文件影像转换为文字数据。在本实施例中,影像接合单元60及影像辨识单元20皆设置于一个人计算机内,且鼠标11以有线或无线的方式连接个人计算机,以传送扫描取得的影像内容。
待整份原稿文件完成转换后,再通过内建于个人计算机中的数据传输单元30将扫描取得的文字数据上传至位在云端的多个翻译服务提供商40以进行全文翻译。通过翻译服务提供商辨识原稿文件中的语言类型并加以翻译,而翻译完成的翻译结果再通过通讯网络回传至个人计算机,经由比对单元70进行比对后显示于个人计算机的显示单元50(屏幕)上。
然而,本发明中的影像撷取单元10并不限制为鼠标11或扫描装置,且影像辨识单元20设置于一云端的服务器中或是一客户端的个人运算装置中以接收影像数据并转换为文字数据,亦不以设置于个人计算机等客户端的个人运算装置内为限。如图3所示,在第二实施例中,上述影像撷取单元10为一摄影模块。该摄影模块装设于一手持电子装置70上,并能够将原稿文件拍摄为图文件影像。由于手持电子装置可能受限于运算能力不足而不便于进行光学文字识别,因此将图文件影像通过手持电子装置70内建的数据传输单元30上传至一具有影像辨识单元20的服务器,通过该服务器将图文件影像转换为文字数据,接着再将文字数据分别传送至不同翻译服务提供商40进行全文翻译。以取得不同的翻译结果。
请参阅图4,本发明的翻译方法包含以下步骤:
首先,使用影像撷取单元10撷取原稿文件的影像数据。接着将原稿文件的影像数据传递至影像辨识单元20进行辨识,通过影像辨识单元20将图文件格式的影像数据转换为文字数据。接着将文字数据分别传递至多个翻译服务提供商40,所述各翻译服务提供商40分别具有不同的翻译数据库,因此将取得不同的翻译结果。待取得各个翻译服务提供商40的翻译结果之后,最后再经由比对单元70比对多个翻译服务提供商40产生的翻译结果,并推选出最佳翻译。并将原稿影像,各种不同的翻译结果以及最佳翻译结果一并显示在显示单元50上供用户确认。藉此,使用者能够简单而快速的将一份文件全文翻译为熟悉的语言。
请参阅图5,在上述翻译方法中,将所有翻译结果相互比对并推选出最佳翻译的一可行步骤如下:在接收到各个翻译服务提供商40的翻译结果之后,首先以标点符号91为依据,将各个翻译结果的整篇文章断成数个句子,并对句子编号排序。在本实施例中利用标点符号91进行断句后,产生一第一句子92以及一第二句子93。
接着将不同翻译结果中编号相同的句子互相比对,并统计相同字词出现在不同翻译结果之间的次数。则具有最多相同字词出现次数的翻译结果便是最佳翻译。最后,把文件原文,不同的翻译结果以及最佳翻译一并显示以供用户确认。
请参阅图6,在显示翻译结果时,为了方便使用者比对不同的翻译结果,回传至个人计算机的各个翻译结果以水平并列的方式共同显示于显示单元50的中央区段52,以方便使用者相互比对。而文件原文则显示在显示单元的上方区段51,并把最佳翻译显示在显示单元的下方区段53,让使用者能够以最短的时间了解翻译的结果。
综上所述,本发明特点在于以扫描或摄影等方式撷取原稿文件的影像数据并进行光学文字辨识(OCR)后,上传至多个不同的全文翻译服务提供商40的网络服务器进行全文翻译,以节省使用者输入单字及查询单字的时间。而且在接收各组翻译数据后予以互相比对,以从中选择出最佳翻译。并将各个翻译结果以水平并列的方式共同显示于显示单元50的中央区段52,方便使用者相互比对。而文件原文以及最佳翻译则分别显示在显示单元的上方区段51以及下方区段53,让使用者能够以最短的时间了解最佳翻译的结果。
Claims (9)
1.一种翻译方法,其特征在于,包含下列步骤:
使用影像撷取单元撷取原稿文件的影像数据;
将原稿文件的影像数据传递至影像辨识单元,使影像数据转换为文字数据;
将转换后的文字数据分别传递至多个翻译服务提供商进行翻译;及
比对多个翻译服务提供商产生的翻译结果,并选出最佳翻译。
2.如权利要求1所述的翻译方法,其特征在于:还包括将文件原文、各个翻译结果以及最佳翻译同时显示在显示单元。
3.如权利要求2所述的翻译方法,其特征在于:决定最佳翻译的方法包含以下步骤:
将各个翻译结果以标点符号为依据分成数个句子,并依照句子出现在翻译结果中的顺序加以编号;
接着将不同翻译结果中编号相同的句子互相比对,并统计相同字词出现在不同翻译结果之间的次数;及
将具有较多关键词重复出现次数的翻译结果定为最佳翻译。
4.如权利要求2所述的翻译方法,其特征在于:显示翻译结果的方式是将各个翻译结果以并列的方式共同显示于显示单元的中央区段,而文件原文以及最佳翻译则分别显示在显示单元的上方区段以及下方区段。
5.一种翻译***,连接至少两个位于云端的翻译服务提供商,其特征在于,包含:
一影像撷取单元,撷取一原稿文件的影像数据;
一数据传输单元,与翻译服务提供商之间传递或接收数据;
一比对单元,比对由多个翻译服务提供商产生的翻译结果并选出最佳的翻译结果;及
一显示单元,显示原稿文件的影像数据,各个翻译结果以及最佳翻译。
6.如权利要求5所述的翻译***,其特征在于:其中还包括一影像接合单元,拼合由影像撷取单元逐步取得的影像内容以形成一完整的图文件影像。
7.如权利要求5所述的翻译***,其特征在于:其中还包括一影像辨识单元,设置于一云端的服务器中以接收影像数据并转换为文字数据。
8.如权利要求5所述的翻译***,其特征在于:其中还包括一影像辨识单元,设置于一客户端的个人运算装置中以接收影像数据并转换为文字数据。
9.如权利要求5所述的翻译***,其特征在于:其中所述影像撷取单元设为一扫描装置或一摄影装置或一鼠标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310005842.1A CN103914446A (zh) | 2013-01-08 | 2013-01-08 | 翻译方法及翻译*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310005842.1A CN103914446A (zh) | 2013-01-08 | 2013-01-08 | 翻译方法及翻译*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103914446A true CN103914446A (zh) | 2014-07-09 |
Family
ID=51040140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310005842.1A Pending CN103914446A (zh) | 2013-01-08 | 2013-01-08 | 翻译方法及翻译*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103914446A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740239A (zh) * | 2016-02-01 | 2016-07-06 | 中译语通科技(北京)有限公司 | 一种网页上文字的翻译方法及*** |
CN106021239A (zh) * | 2016-04-29 | 2016-10-12 | 北京创鑫旅程网络技术有限公司 | 一种翻译质量实时评价方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007122559A (ja) * | 2005-10-31 | 2007-05-17 | Matsushita Electric Ind Co Ltd | 文字認識印刷システム、印刷装置、印刷方法、印刷プログラム、テレビジョン装置および画像再生装置 |
CN101127036A (zh) * | 2006-08-14 | 2008-02-20 | 英华达股份有限公司 | 影像识别翻译装置及方法 |
TW200910875A (en) * | 2007-08-29 | 2009-03-01 | Inventec Appliances Corp | Method and system for instantly translating text within an image |
TW200917060A (en) * | 2007-08-29 | 2009-04-16 | Microsoft Corp | Validation of the consistency of automatic terminology translation |
CN102479178A (zh) * | 2010-11-29 | 2012-05-30 | 英业达股份有限公司 | 地方方言翻译方法 |
-
2013
- 2013-01-08 CN CN201310005842.1A patent/CN103914446A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007122559A (ja) * | 2005-10-31 | 2007-05-17 | Matsushita Electric Ind Co Ltd | 文字認識印刷システム、印刷装置、印刷方法、印刷プログラム、テレビジョン装置および画像再生装置 |
CN101127036A (zh) * | 2006-08-14 | 2008-02-20 | 英华达股份有限公司 | 影像识别翻译装置及方法 |
TW200910875A (en) * | 2007-08-29 | 2009-03-01 | Inventec Appliances Corp | Method and system for instantly translating text within an image |
TW200917060A (en) * | 2007-08-29 | 2009-04-16 | Microsoft Corp | Validation of the consistency of automatic terminology translation |
CN102479178A (zh) * | 2010-11-29 | 2012-05-30 | 英业达股份有限公司 | 地方方言翻译方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740239A (zh) * | 2016-02-01 | 2016-07-06 | 中译语通科技(北京)有限公司 | 一种网页上文字的翻译方法及*** |
CN106021239A (zh) * | 2016-04-29 | 2016-10-12 | 北京创鑫旅程网络技术有限公司 | 一种翻译质量实时评价方法 |
CN106021239B (zh) * | 2016-04-29 | 2018-10-26 | 北京创鑫旅程网络技术有限公司 | 一种翻译质量实时评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8989431B1 (en) | Ad hoc paper-based networking with mixed media reality | |
CN101751667B (zh) | 图像处理装置及图像处理方法 | |
KR20160124182A (ko) | 연락처들을 그룹화하기 위한 방법 및 장치 | |
US9378427B2 (en) | Displaying handwritten strokes on a device according to a determined stroke direction matching the present direction of inclination of the device | |
Li et al. | Interactive multimodal visual search on mobile device | |
US20130311506A1 (en) | Method and apparatus for user query disambiguation | |
CN104537339A (zh) | 信息识别方法和信息识别*** | |
JP2010531010A (ja) | 画像と形状記述子とのマッチング | |
JP6287373B2 (ja) | 画像保存検索システム | |
CN102750366A (zh) | 基于自然交互输入的视频搜索***及方法和视频搜索服务器 | |
US10460192B2 (en) | Method and system for optical character recognition (OCR) of multi-language content | |
KR100648161B1 (ko) | 협력적인 수기 입력을 위한 시스템 및 방법 | |
US9558400B2 (en) | Search by stroke | |
US20140249798A1 (en) | Translation system and translation method thereof | |
CN115661829A (zh) | 图文识别方法及图文识别模型的数据处理方法 | |
CN103914446A (zh) | 翻译方法及翻译*** | |
CN113869063A (zh) | 数据推荐方法、装置、电子设备及存储介质 | |
CN106515258B (zh) | 笔记本、智能终端及笔记本内容索引创建方法 | |
JP2014137654A (ja) | 翻訳システム及びその翻訳方法 | |
Park et al. | A study on the automatic digital DB of boring log using AI | |
KR20200098933A (ko) | 펜 타입 텍스트 번역 장치 및 방법 | |
US20150199450A1 (en) | Systems and Methods for Associating User Sketches with Resources | |
KR20100124952A (ko) | 문자인식을 이용한 휴대형 단말기의 증강현실 기반 실시간 ar컨텐츠 제공시스템 및 그 방법 | |
CN112287131A (zh) | 信息交互方法、信息交互装置 | |
JP5371926B2 (ja) | 手書きデータの清書テキスト化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140709 |