CN105740239A - 一种网页上文字的翻译方法及*** - Google Patents

一种网页上文字的翻译方法及*** Download PDF

Info

Publication number
CN105740239A
CN105740239A CN201610068883.9A CN201610068883A CN105740239A CN 105740239 A CN105740239 A CN 105740239A CN 201610068883 A CN201610068883 A CN 201610068883A CN 105740239 A CN105740239 A CN 105740239A
Authority
CN
China
Prior art keywords
translation
content
webpage
client
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610068883.9A
Other languages
English (en)
Inventor
宗浩
程国艮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mandarin Technology (beijing) Co Ltd
Original Assignee
Mandarin Technology (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mandarin Technology (beijing) Co Ltd filed Critical Mandarin Technology (beijing) Co Ltd
Priority to CN201610068883.9A priority Critical patent/CN105740239A/zh
Publication of CN105740239A publication Critical patent/CN105740239A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种网页上文字的翻译方法及***,涉及机器翻译技术领域;解决了不能在网页中划词翻译的技术问题;该技术方案包括:在客户端解析网页内容,将解析后的文字内容传送到服务器端的翻译***,翻译***对传送的字符进行翻译,将翻译结果传送回客户端并在网页上显示。

Description

一种网页上文字的翻译方法及***
技术领域
本发明涉及机器翻译技术领域,特别涉及一种网页上文字的翻译方法及***。
背景技术
随着人们的浏览网页的范围扩大,不免有时候遇见一些自己不懂的外文。这就需要对不认识的几个词或者一段话进行翻译,才能很好的理解阅读内容,这就迫切需要网页划词技术。传统的翻译软件需要下载一个安装包,下载之后需要安装并启用划词功能,且划词功能只能在文档中使用,例如Office软件。但不能在网页中使用。
查看现在的网页翻译的一些技术,都是对网页的标签内容一个和多个的进行传输到服务器然后回传到客户端,这样就会产生很繁琐的客户端和服务端的交互,导致翻译速度慢,而且大部分时间用在了客户端和服务端的数据传输上,在网速不好的情况下用户体验性会很差。在客户端翻译网页较大的情况下翻译页面可能会延迟出现,这样就会有不好的用户体验。解决了网页翻译速度慢的问题。传统的技术手段是获取网页中全部的文本类标签的文本内容,逐条远程调用机器翻译,这样存在一个问题即翻译过程中需要频繁与翻译服务器交互,交互的次数越多,翻译完成的时间越晚,整体翻译是速度就越慢。
发明内容
本发明要解决的是不能在网页中划词翻译的技术问题。
为了解决上述问题,本发明提供了一种网页上文字的翻译方法,在客户端解析网页内容,将解析后的文字内容传送到服务器端的翻译***,翻译***对传送的字符进行翻译,将翻译结果传送回客户端并在网页上显示。
本发明还提供了一种网页上文字的翻译***,包括客户端和服务器端,所述客户端包括一个解析及传输模块,用于在客户端解析网页内容,将解析后的文字内容传送到服务器端的翻译***,翻译***对传送的字符进行翻译,将翻译结果传送回客户端并在网页上显示。
本发明的技术方案实现了一种网页上文字的翻译方法及***,使用户在原页面就能看到翻译结果,而不用粘贴复制到翻译工具中翻译实现了网页端的划词功能,为用户节省了宝贵的时间。
附图说明
图1一种网页上文字的翻译方法流程示意图;
图2划词翻译方法流程示意图;
图3网页翻译方法流程示意图;
图4一种网页上文字的翻译***示意图。
具体实施方式
下面将结合附图及实施例对本发明的技术方案进行更详细的说明。
需要说明的是,如果不冲突,本发明实施例以及实施例中的各个特征可以相互结合,均在本发明的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一,一种网页上文字的翻译方法,如图1所示,包括:在客户端解析网页内容,将解析后的内容传送到服务器端翻译***,翻译***对传送的字符进行翻译,将翻译结果传送回客户端并在网页上显示。翻译结果可以显示在需要翻译的网页内容的边上。本技术方案,用户在浏览网页时选中一段文字,即可进行对应的翻译。
实施例二,一种网页上文字的翻译方法,如图2所示,包括:在实施例一的基础上,所述在客户端解析网页内容之前,通过选中一段文本或几个文字,利用JavaScript获取划词选中的需要翻译的文字内容。
具体为:首先用户浏览网页,产生划词动作,即鼠标选中一段文本。利用JavaScript(一种脚本语言)获取用户划词选中的需要翻译的内容传送到翻译***。其次,翻译***对传送的字符进行翻译并产生翻译结果。最后,翻译结果传送到用户浏览页面并显示给用户。
用户对于需要翻译的词或者段落可以在当前页面直接进行局部的划词翻译,这样可以省去用户打开其他翻译工具、复制、粘贴的时间。使用户使用的更加方便。增加用户的体验度。
实施例三,一种网页上文字的翻译方法,如图3所示,包括:
在实施例一的基础上,所述在客户端解析网页内容之前,全选整个网页,之后对所有内容解析,将其中需要翻译的文本内容编号列表存储,将解析后列表存储的内容传送到服务器端的翻译***,在翻译量较大的情况下,对列表分组处理。
将所有需要翻译的文本存储成一个列表,一次传输给服务端,翻译完成后一次传回,减少与服务器交互次数。在客户端翻译量较大的情况下,对翻译网页进行分组处理,一次传输列表的一部分,尽可能减少客户端和服务端的交互次数,更大的优化用户体验。
本技术方案旨在减少网页翻译插件客户端和服务器端的网络通信次数和减少不必要的翻译内容,以达到加快网页翻译整体速度的目的。例如网页页面有100条需要翻译的文本,传统的翻译策略采用逐条远程调用机器翻译,拿到翻译结果再替换页面的对应文本。假设网络通信一次需要100毫秒,传统的翻译需要100毫秒乘以100次通信,等于10秒钟才能翻译完,通过DOM,解析后,直接传送所有需要翻译的100条文本的列表只通信一次,100毫秒就能返回翻译结果,比传统方式快100倍。所述DOM为网页的文档对象模型(DocumentObjectModel,以下简称DOM)。
更优的,在所述对所有内容解析时,剔除不需要翻译的内容。网页DOM解析,提取出所有显示出的需要翻译的文本。剔除不需要的翻译的文本内容,例如编程代码,不显示给用户的文本内容等。本发明的技术方案减少不必要的翻译内容,是只网页中存在的不需要翻译的内容,例如编程代码部分往往是不需要翻译的内容,此外还有一些未展示在页面中的内容也不需要翻译,通过剔除这部分不需要翻译的内容,既能减少翻译服务器的翻译压力,也能加快整体的页面翻译速度。
更优的,客户端收到翻译后的列表后,按照编号替换网页上的内容。
具体步骤为:
1、用户浏览网页,即用浏览器打开任意一个外文网页进行浏览。
2、打开网页翻译插件,点击翻译按钮。
3、点击翻译按钮后,在客户端运行的插件程序会将当前浏览的页面的所有内容解析。
4、将其中需要翻译的文本型的内容全部存储成一个列表。
5、网络通信,将需要翻译的文本列表传输给浏览器插件的服务端。
6、服务端调用译库机器翻译对需要翻译的文本列表内的所有文本进行逐条翻译。
7、网络通信,将翻译后的列表传输给网页翻译插件的客户端。
8、网页翻译插件客户端收到翻译后的文本列表后,替换原来列表的文本,使得用户当前浏览的网页变化成翻译后的网页。
所述翻译插件具有解析及传输功能,本发明的解析及传输模块中的翻译插件特别轻便,直接在浏览器应用商店即可安装,无需下载安装。安装之后就可以启用划词功能,实现了网页端的划词功能。
本技术方案通过DOM解析的技术,剔除掉网页中不需要翻译的部分(例如编程代码,页面中不显示在界面中的内容等),减少了翻译的总量,同时,利用将所有翻译内容作为一个整体传输给翻译的服务端以减少与服务端的交互次数,达到整体翻译加速的目的。
实施例四,一种网页上文字的翻译***,如图4所示,包括:包括客户端和服务器端,所述客户端包括一个解析及传输模块,用于在客户端解析网页内容,将解析后的内容传送到服务器端的翻译模块,翻译模块对传送的字符进行翻译,将翻译结果传送回客户端并在网页上显示。所述解析及传输模块包括具有解析和传输功能的翻译插件。
所述在客户端解析网页内容之前,通过选中一段文本或几个文字,利用JavaScript获取划词选中的需要翻译的文字内容。
所述在客户端解析网页内容之前,全选整个网页,之后对所有内容解析,将其中需要翻译的文本内容编号列表存储,将解析后列表存储的内容传送到服务器端的翻译模块,在翻译量较大的情况下,对列表分组处理。
在所述对所有内容解析时,剔除不需要翻译的内容。
客户端收到翻译后的列表后,按照编号替换网页上的内容。
***与方法内容基本一一对应,具体参考实施例一至三。
本技术方案利用用户在哪里划词就可以在哪里翻译的技术方案,方便用户翻译,增加用户良好使用体验。改进了老套的复制,打开网页翻译***,粘贴,翻译等多步骤耗时的方法。
为了减少客户端和服务端的交互次数,本发明实现了网页整体传送的技术方案,加快了翻译速度技术。本技术方案可以一次传送客户端的网页信息在服务端进行翻译处理,然后整体返回处理后的信息。达到一次交互整体翻译的效果。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明的权利要求的保护范围。

Claims (10)

1.一种网页上文字的翻译方法,其特征在于,在客户端解析网页内容,将解析后的内容传送到服务器端翻译***,翻译***对传送的字符进行翻译,将翻译结果传送回客户端并在网页上显示。
2.如权利要求1所述的翻译方法,其特征在于,所述在客户端解析网页内容之前,通过选中一段文本或几个文字,利用JavaScript获取划词选中的需要翻译的文字内容。
3.如权利要求1所述的翻译方法,其特征在于,所述在客户端解析网页内容之前,全选整个网页,之后对所有内容解析,将其中需要翻译的文本内容编号列表存储,将解析后列表存储的内容传送到服务器端的翻译***,在翻译量较大的情况下,对列表分组处理。
4.如权利要求3所述的翻译方法,其特征在于,在所述对所有内容解析时,剔除不需要翻译的内容。
5.如权利要求3所述的翻译方法,其特征在于,客户端收到翻译后的列表后,按照编号替换网页上的内容。
6.一种网页上文字的翻译***,其特征在于,包括客户端和服务器端,所述客户端包括一个解析及传输模块,用于在客户端解析网页内容,将解析后的内容传送到服务器端的翻译模块,翻译模块对传送的字符进行翻译,将翻译结果传送回客户端并在网页上显示。
7.如权利要求6所述的翻译***,其特征在于,所述在客户端解析网页内容之前,通过选中一段文本或几个文字,利用JavaScript获取划词选中的需要翻译的文字内容。
8.如权利要求6所述的翻译***,其特征在于,所述在客户端解析网页内容之前,全选整个网页,之后对所有内容解析,将其中需要翻译的文本内容编号列表存储,将解析后列表存储的内容传送到服务器端的翻译模块,在翻译量较大的情况下,对列表分组处理。
9.如权利要求8所述的翻译***,其特征在于,在所述对所有内容解析时,剔除不需要翻译的内容。
10.如权利要求8所述的翻译***,其特征在于,客户端收到翻译后的列表后,按照编号替换网页上的内容。
CN201610068883.9A 2016-02-01 2016-02-01 一种网页上文字的翻译方法及*** Pending CN105740239A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610068883.9A CN105740239A (zh) 2016-02-01 2016-02-01 一种网页上文字的翻译方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610068883.9A CN105740239A (zh) 2016-02-01 2016-02-01 一种网页上文字的翻译方法及***

Publications (1)

Publication Number Publication Date
CN105740239A true CN105740239A (zh) 2016-07-06

Family

ID=56242036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610068883.9A Pending CN105740239A (zh) 2016-02-01 2016-02-01 一种网页上文字的翻译方法及***

Country Status (1)

Country Link
CN (1) CN105740239A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111552527A (zh) * 2020-04-02 2020-08-18 支付宝实验室(新加坡)有限公司 用户界面内文字翻译方法、装置、***及存储介质
WO2020248849A1 (zh) * 2019-06-14 2020-12-17 平安科技(深圳)有限公司 一种网页语言的切换方法、装置及终端设备
CN113438542A (zh) * 2021-05-28 2021-09-24 北京智慧星光信息技术有限公司 字幕实时翻译方法、***、电子设备及存储介质
CN113536811A (zh) * 2021-07-14 2021-10-22 杭州隆埠科技有限公司 富文本文档的翻译方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209643A (ja) * 2000-01-25 2001-08-03 Joyport Kk 機械翻訳システムとその翻訳サーバ及びそのクライアント
CN103914446A (zh) * 2013-01-08 2014-07-09 崴强科技股份有限公司 翻译方法及翻译***
CN104021127A (zh) * 2013-03-01 2014-09-03 联想(北京)有限公司 信息处理方法及电子设备
CN104462074A (zh) * 2014-12-26 2015-03-25 北京奇虎科技有限公司 一种进行网页数据翻译的方法、装置和浏览器客户端
US20150356074A1 (en) * 2014-03-28 2015-12-10 Alibek ISSAEV Machine Translation System and Method
CN105243057A (zh) * 2015-09-30 2016-01-13 北京奇虎科技有限公司 一种翻译网页内容的方法及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209643A (ja) * 2000-01-25 2001-08-03 Joyport Kk 機械翻訳システムとその翻訳サーバ及びそのクライアント
CN103914446A (zh) * 2013-01-08 2014-07-09 崴强科技股份有限公司 翻译方法及翻译***
CN104021127A (zh) * 2013-03-01 2014-09-03 联想(北京)有限公司 信息处理方法及电子设备
US20150356074A1 (en) * 2014-03-28 2015-12-10 Alibek ISSAEV Machine Translation System and Method
CN104462074A (zh) * 2014-12-26 2015-03-25 北京奇虎科技有限公司 一种进行网页数据翻译的方法、装置和浏览器客户端
CN105243057A (zh) * 2015-09-30 2016-01-13 北京奇虎科技有限公司 一种翻译网页内容的方法及电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020248849A1 (zh) * 2019-06-14 2020-12-17 平安科技(深圳)有限公司 一种网页语言的切换方法、装置及终端设备
CN111552527A (zh) * 2020-04-02 2020-08-18 支付宝实验室(新加坡)有限公司 用户界面内文字翻译方法、装置、***及存储介质
CN113438542A (zh) * 2021-05-28 2021-09-24 北京智慧星光信息技术有限公司 字幕实时翻译方法、***、电子设备及存储介质
CN113438542B (zh) * 2021-05-28 2022-11-08 北京智慧星光信息技术有限公司 字幕实时翻译方法、***、电子设备及存储介质
CN113536811A (zh) * 2021-07-14 2021-10-22 杭州隆埠科技有限公司 富文本文档的翻译方法及装置

Similar Documents

Publication Publication Date Title
CN106371844B (zh) 一种用原生用户界面组件展示网页的方法及***
CN109408783B (zh) 电子文档在线编辑方法及***
CN100535900C (zh) 用于提供异步门户页的方法和***
CN105824787B (zh) 一种html模板动态配置的控制方法及***
US7496497B2 (en) Method and system for selecting web site home page by extracting site language cookie stored in an access device to identify directional information item
CN100565524C (zh) 一种保存网页内容的***、方法及浏览器
CN104866512B (zh) 提取网页内容的方法、装置及***
US20010014900A1 (en) Method and system for separating content and layout of formatted objects
US20100205524A1 (en) Extensible stylesheet designs using meta-tag information
CN106293675B (zh) ***静态资源加载方法及装置
CN103166981A (zh) 一种无线网页转码方法及装置
CN105740239A (zh) 一种网页上文字的翻译方法及***
CN102831190B (zh) 一种在低端设备上浏览cml文件的方法
GB2423387A (en) Application-Generic Sequence Diagram Generator Driven by a Non-Proprietary Language
CN103389895A (zh) 一种前端页面的生成方法及***
CN103383687A (zh) 一种页面处理方法和装置
CN106886551A (zh) 一种利用标记语言显示图像的方法及装置
WO2014153457A1 (en) Merging web page style addresses
CN106547511A (zh) 一种语音播读网页信息的方法、浏览器客户端及服务器
CN109033282A (zh) 一种基于抽取模板的网页正文抽取方法及装置
CN109976840A (zh) 一种基于前后台分离平台下实现多语言自动适配的方法及***
CN107545058A (zh) 一种页面加载方法、服务器及浏览器
CN105224544A (zh) 一种数据库的数据编辑方法及装置
CN104090869B (zh) 一种翻译网络信息的方法及翻译***
CN112765516A (zh) 页面内容的展示方法和装置、存储介质、电子装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100040 Shijingshan District railway building, Beijing, the 16 floor

Applicant after: Chinese translation language through Polytron Technologies Inc

Address before: 100040 Shijingshan District railway building, Beijing, the 16 floor

Applicant before: Mandarin Technology (Beijing) Co., Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160706