CN103914539A - 信息查询方法和装置 - Google Patents

信息查询方法和装置 Download PDF

Info

Publication number
CN103914539A
CN103914539A CN201410128777.6A CN201410128777A CN103914539A CN 103914539 A CN103914539 A CN 103914539A CN 201410128777 A CN201410128777 A CN 201410128777A CN 103914539 A CN103914539 A CN 103914539A
Authority
CN
China
Prior art keywords
content
user
target photo
text
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410128777.6A
Other languages
English (en)
Inventor
丁二锐
和为
邵英杰
王帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410128777.6A priority Critical patent/CN103914539A/zh
Publication of CN103914539A publication Critical patent/CN103914539A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)

Abstract

本发明提出一种信息查询方法和装置,该信息查询方法包括将获取的用户母语文本形式的检索词,翻译成目标语种词汇;对采用所述目标语种的目标对象进行拍摄,得到目标图片,并对所述目标图片进行文字识别,得到识别后的文本;在识别后的文本中查找,获取识别后的文本中包含目标语种词汇的内容;将目标语种词汇的内容翻译成用户的母语翻译结果,给用户显示查询结果。该方法能够降低用户操作的繁琐度,提升用户体验。

Description

信息查询方法和装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种信息查询方法和装置。
背景技术
在一些场合下,用户需要在非母语的信息中获取自身需要的信息,例如,用户在异国他乡,需要主动获取那些用异国文字表示的信息。具体如,到国外的餐馆,面对满目不认识的菜单需要的定位到自己想吃的菜,又如,在地铁站,想要去机场时,需要在不认识的站名中定位出机场的名字。
传统的做法是采用电子词典进行翻译,这种方式通常需要将所有信息都进行翻译,之后在翻译后的信息中查找用户所需的信息。
相关技术中,采用翻译***翻译完成后还需要用户去查找和比对,才能获取到用户感兴趣的信息。增加了用户操作的繁琐度,降低了用户体验。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种信息查询方法,该方法可以降低用户操作的繁琐度,提升用户体验。
本发明的另一个目的在于提出一种信息查询装置,该装置可以降低用户操作的繁琐度,提升用户体验。
本发明的另一个目的在于提出一种移动终端,以实现获取用户母语文本形式的检索词以及对采用所述目标语种的目标对象进行拍摄。
为达到上述目的,本发明第一方面实施例提出的信息查询方法,包括:将获取的用户母语文本形式的检索词,翻译成目标语种词汇;对采用所述目标语种的目标对象进行拍摄,得到目标图片,并对所述目标图片进行文字识别,得到识别后的文本;在所述识别后的文本中查找,获取第一内容,所述第一内容为所述识别后的文本中包含所述目标语种词汇的内容;将所述第一内容翻译成所述用户的母语翻译结果,并向所述用户显示查询结果。
本发明第一方面实施例提出的信息查询方法,通过将检索词翻译成目标语种词汇,并在对目标图片识别后的文本中查找目标语种词汇,得到包含目标语种词汇的第一内容,之后向用户显示的查询结果中包括对第一内容的翻译结果,可以直接查找用户感兴趣的内容,并直接将用户感兴趣的信息显示给用户,不需要用户在多个翻译结果中再次查找比对,可以降低用户操作繁琐性,提高用户体验,并且通过用户以母语输入且向用户显示母语结果,可以进一步方便用户操作及提高用户体验。
为达到上述目的,本发明第二方面实施例提出的信息查询装置,包括:翻译模块,用于将获取的用户母语文本形式的检索词,翻译成目标语种词汇;识别模块,用于对采用所述目标语种的目标对象进行拍摄,得到目标图片,并对所述目标图片进行文字识别,得到识别后的文本;查询模块,用于在所述识别后的文本中查找,获取第一内容,所述第一内容为所述识别后的文本中包含所述目标语种词汇的内容;显示模块,用于将所述第一内容翻译成所述用户的母语翻译结果,并向所述用户显示查询结果,所述查询结果包括所述用户的母语翻译结果。
本发明第二方面实施例提出的信息查询装置,通过将检索词翻译成目标语种词汇,并在对目标图片识别后的文本中查找目标语种词汇,得到包含目标语种词汇的第一内容,之后向用户显示的查询结果中包括对第一内容的翻译结果,可以直接查找用户感兴趣的内容,并直接将用户感兴趣的信息显示给用户,不需要用户在多个翻译结果中再次查找比对,可以降低用户操作繁琐性,提高用户体验,并且通过用户以母语输入且向用户显示母语结果,可以进一步方便用户操作及提高用户体验。
为达到上述目的,本发明第三方面实施例提出的移动终端,包括:壳体、处理器、存储器、电路板和电源电路,其中,所述电路板安置在所述壳体围成的空间内部,所述处理器和所述存储器设置在所述电路板上;所述电源电路,用于为所述移动终端的各个电路或器件供电;所述存储器用于存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于:将获取的用户母语文本形式的检索词,翻译成目标语种词汇;对采用所述目标语种的目标对象进行拍摄,得到目标图片,并对所述目标图片进行文字识别,得到识别后的文本;在所述识别后的文本中查找,获取第一内容,所述第一内容为所述识别后的文本中包含所述目标语种词汇的内容;将所述第一内容翻译成所述用户的母语翻译结果,并向所述用户显示查询结果。
本发明第三方面实施例提出的移动终端,通过将检索词翻译成目标语种词汇,并在对目标图片识别后的文本中查找目标语种词汇,得到包含目标语种词汇的第一内容,之后向用户显示的查询结果中包括对第一内容的翻译结果,可以直接查找用户感兴趣的内容,并直接将用户感兴趣的信息显示给用户,不需要用户在多个翻译结果中再次查找比对,可以降低用户操作繁琐性,提高用户体验,并且通过用户以母语输入且向用户显示母语结果,可以进一步方便用户操作及提高用户体验。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一实施例提出的一种信息查询方法的流程示意图;
图2是本发明另一实施例提出的信息查询方法的流程示意图;
图3是本发明另一实施例提出的信息查询装置的结构示意图;
图4是本发明另一实施例提出的信息查询装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本发明一实施例提出的信息查询方法的流程示意图,该方法包括:
S11:移动设备将获取的用户母语文本形式的检索词,翻译成目标语种词汇。
例如,用户在国外的餐馆想点与鸡肉相关的菜时,用户可以以母语输入检索词“鸡肉”。
其中,用户可以采用文本方式输入,或者,用户也可以采用语音方式输入。在语音方式输入时,移动设备还可以进一步对语音进行识别,得到文本形式的检索词。
另外,目标语种可以是根据用户选择确认的,例如,移动终端可以向用户显示选择项,由用户选择目标语种;或者,目标语种也可以根据对目标对象的识别确定,将目标语种确定为与目标对象的语种相同。
例如,用户选择或者目标对象的语种为英文时,移动设备中的翻译***可以将检索词“鸡肉”翻译成目标语种词汇“chicken”。
可以理解的是,在翻译时,可能得到多个词汇,例如,用户输入的检索词为“肉”时,得到的翻译词可以包括“pork”、“chicken”等。
进一步的,翻译***得到的翻译后的检索词可以不需要展示给用户。
S12:移动设备对采用所述目标语种的目标对象进行拍摄,得到目标图片,并对所述目标图片进行文字识别,得到识别后的文本。
例如,目标对象可以是英文菜单。
移动设备在对英文菜单进行拍摄时,可以是实时的连续拍摄或者仅拍摄一张图像。
在得到目标图片后,移动设备中的文字识别***,例如,光学字符识别OCR(OpticalCharacter Recognition,OCR)***,可以对目标图片进行文字识别,得到目标对象中的每个字(或词)及其位置。
例如,对英文菜单对应的图片进行识别后,可以得到每个菜名。对每张图进行文字检测和识别,记录识别的每个字(词)和位置。基于场景文字的检测和识别已经有成熟技术,如百度翻译APP中就已经采用。假设英文菜单中有一条“Chicken Teriyaki”,经场景文字检测和识别后,可以得到每个字符的识别结果及其在图像中的位置。
S11和S12无时序限制关系。
S13:移动设备在所述识别后的文本中查找,获取第一内容,所述第一内容为所述识别后的文本中包含所述目标语种词汇的内容。
例如,在识别后的文本中有一个菜名为“Chicken Teriyaki”,由于其中包含目标语种词汇“chicken”,因此,可以将“Chicken Teriyaki”确定为第一内容。
其中,可以通过排版信息和/或自然语言处理的分词技术,对识别后的文本进行分词,以确定包含目标语种词汇的内容。例如,一个菜单名通常会写成一行,可以将包含该目标语种词汇的一行内容确定为上述的第一内容。
S14:移动设备将所述第一内容翻译成所述用户的母语翻译结果,并向所述用户显示查询结果,所述查询结果包括所述用户的母语翻译结果。
例如,查找到“Chicken Teriyaki”后,可以将其翻译成用户母语的“红烧鸡”。
在得到母语翻译结果,如“红烧鸡”后,可以有如下几种显示方式:
(1)向所述用户显示所述目标图片,在所述目标图片中所述第一内容的位置处,突出显示所述用户的母语翻译结果;
例如,在文字识别时,可以记录每个词汇的位置,之后在显示时,可以根据记录的“Chicken Teriyaki”的位置,在菜单的“Chicken Teriyaki”的位置处突出显示“红烧鸡”。或者,不仅显示母语翻译结果,还显示目标语种的菜名,例如,同时突出显示“红烧鸡”和对应的“Chicken Teriyaki”。
其中,可以用高亮、框选或者增加下划线等方式实现突出显示。
(2)向所述用户显示对所述目标图片截取后的图片,所述截取后的图片包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果;
例如,从目标图片中将“Chicken Teriyaki”位置处的图片截取下来,在截取后的图片中显示“红烧鸡”和对应的“Chicken Teriyaki”。
(3)向所述用户显示文本内容,所述文本内容包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果。
与(2)不同的是,(2)是图片形式,(3)是文本形式。
例如,该文本中显示“红烧鸡”和对应的“Chicken Teriyaki”。
本实施例通过将检索词翻译成目标语种词汇,并在对目标图片识别后的文本中查找目标语种词汇,得到包含目标语种词汇的第一内容,之后向用户显示的查询结果中包括对第一内容的翻译结果,可以直接查找用户感兴趣的内容,并直接将用户感兴趣的信息显示给用户,不需要用户在多个翻译结果中再次查找比对,可以降低用户操作繁琐性,提高用户体验,并且通过用户以母语输入且向用户显示母语结果,可以进一步方便用户操作及提高用户体验。
图2是本发明另一实施例提出的信息查询方法的流程示意图,该方法包括:
S21:用户以母语文本形式在移动设备中输入检索词。
例如,用户通过移动设备的键盘或者手写屏幕,输入检索词。
S22:用户在移动设备提供的可选语种中,选择目标语种。
例如,移动设备可以向用户提供多种可选语种,例如,可选语种包括英文、法文等。
用户在这些可选语种中可以根据自身需要选择合适的语种。
S23:移动设备中翻译***将检索词翻译成目标语种的词汇。
例如,用户输入的是中文词汇,选择的目标语种是英文,那么翻译***可以将检索词从中文翻译成英文。
S24:移动设备对目标对象进行拍摄,得到目标图片。
例如,移动设备可以内置摄像头,通过该摄像头可以拍摄得到目标图片。
S25:移动设备中的文字识别***对目标图片进行文字识别,得到识别后的文本。
例如,文字识别***为OCR***,通过OCR***可以将图片识别为文本。
另外,在识别时可以记录每个字或词的位置。
S21-S23与S24-S25无时序限制关系。
S26:移动设备中的检索***在对目标图片识别后的文本中,查找第一内容并确定第一内容的位置,第一内容为包含翻译后的检索词的内容。
通过检索***的查找比对,可以在识别后的文本中查找到包含翻译后的检索词的第一内容。
并且,根据文字识别时记录的位置信息可以确定第一内容的位置。
S27:移动设备将查找到的第一内容进行翻译,得到用户母语形式的对第一内容的翻译结果。
其中,移动设备中的翻译***将目标语种的第一内容翻译成用户母语。
S28:移动设备在第一内容的位置处高亮显示翻译结果。
通过突出显示翻译结果,可以方便用户定位到所需信息。
本实施例通过将用户母语输入的检索词翻译成目标语种词汇,在对目标图片识别后的文本中查找包含目标语种词汇的内容,并突出显示,可以方便用户定位到所需内容,不需要用户逐条进行查找,可以降低用户操作复杂度,并提升用户体验;通过在移动设备中植入上述翻译***、文字识别***、检索***,不需要分别配置专门工具,方便用户使用,降低成本,并且可以为用户主动提供所需信息。
图3是本发明另一实施例提出的信息查询装置的结构示意图,该装置30包括翻译模块31、识别模块32、查询模块33和显示模块34。
翻译模块31用于将获取的用户母语文本形式的检索词,翻译成目标语种词汇;
例如,用户在国外的餐馆想点与鸡肉相关的菜时,用户可以以母语输入检索词“鸡肉”。
其中,用户可以采用文本方式输入,或者,用户也可以采用语音方式输入。在语音方式输入时,移动设备还可以进一步对语音进行识别,得到文本形式的检索词。
另外,目标语种可以是根据用户选择确认的,例如,移动终端可以向用户显示选择项,由用户选择目标语种;或者,目标语种也可以根据对目标对象的识别确定,将目标语种确定为与目标对象的语种相同。
例如,用户选择或者目标对象的语种为英文时,移动设备中的翻译***可以将检索词“鸡肉”翻译成目标语种词汇“chicken”。
可以理解的是,在翻译时,可能得到多个词汇,例如,用户输入的检索词为“肉”时,得到的翻译词可以包括“pork”、“chicken”等。
进一步的,翻译***得到的翻译后的检索词可以不需要展示给用户。
识别模块32用于对采用所述目标语种的目标对象进行拍摄,得到目标图片,并对所述目标图片进行文字识别,得到识别后的文本;
例如,目标对象可以是英文菜单。
移动设备在对英文菜单进行拍摄时,可以是实时的连续拍摄或者仅拍摄一张图像。
在得到目标图片后,移动设备中的文字识别***,例如,光学字符识别OCR(OpticalCharacter Recognition,OCR)***,可以对目标图片进行文字识别,得到目标对象中的每个字(或词)及其位置。
例如,对英文菜单对应的图片进行识别后,可以得到每个菜名。对每张图进行文字检测和识别,记录识别的每个字(词)和位置。基于场景文字的检测和识别已经有成熟技术,如百度翻译APP中就已经采用。假设英文菜单中有一条“Chicken Teriyaki”,经场景文字检测和识别后,可以得到每个字符的识别结果及其在图像中的位置。
查询模块33用于在所述识别后的文本中查找,获取第一内容,所述第一内容为所述识别后的文本中包含所述目标语种词汇的内容;
例如,在识别后的文本中有一个菜名为“Chicken Teriyaki”,由于其中包含目标语种词汇“chicken”,因此,可以将“Chicken Teriyaki”确定为第一内容。
其中,可以通过排版信息和/或自然语言处理的分词技术,对识别后的文本进行分词,以确定包含目标语种词汇的内容。例如,一个菜单名通常会写成一行,可以将包含该目标语种词汇的一行内容确定为上述的第一内容。
显示模块34用于将所述第一内容翻译成所述用户的母语翻译结果,并向所述用户显示查询结果,所述查询结果包括所述用户的母语翻译结果。
例如,查找到“Chicken Teriyaki”后,可以将其翻译成用户母语的“红烧鸡”。
在得到母语翻译结果,如“红烧鸡”后,可以有如下几种显示方式:
(1)向所述用户显示所述目标图片,在所述目标图片中所述第一内容的位置处,突出显示所述用户的母语翻译结果;
例如,在文字识别时,可以记录每个词汇的位置,之后在显示时,可以根据记录的“Chicken Teriyaki”的位置,在菜单的“Chicken Teriyaki”的位置处突出显示“红烧鸡”。或者,不仅显示母语翻译结果,还显示目标语种的菜名,例如,同时突出显示“红烧鸡”和对应的“Chicken Teriyaki”。
其中,可以用高亮、框选或者增加下划线等方式实现突出显示。
(2)向所述用户显示对所述目标图片截取后的图片,所述截取后的图片包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果;
例如,从目标图片中将“Chicken Teriyaki”位置处的图片截取下来,在截取后的图片中显示“红烧鸡”和对应的“Chicken Teriyaki”。
(3)向所述用户显示文本内容,所述文本内容包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果。
与(2)不同的是,(2)是图片形式,(3)是文本形式。
例如,该文本中显示“红烧鸡”和对应的“Chicken Teriyaki”。
本实施例通过将用户母语输入的检索词翻译成目标语种词汇,在对目标图片识别后的文本中查找包含目标语种词汇的内容,并突出显示,可以方便用户定位到所需内容,不需要用户逐条进行查找,可以降低用户操作复杂度,并提升用户体验;通过在移动设备中植入上述翻译***、文字识别***、检索***,不需要分别配置专门工具,方便用户使用,降低成本,并且可以为用户主动提供所需信息。
图4是本发明另一实施例提出的信息查询装置的结构示意图,该装置40在上一实施例的基础上还包括:获取模块35。
获取模块35用于获取所述用户母语文本形式的检索词;
具体地,所述获取模块35具体用于:接收所述用户以母语文本形式输入的检索词;或者,接收所述用户以母语语音形式输入的检索词,并将所述语音形式输入的检索词识别为母语文本形式。
例如,用户通过移动设备的键盘或者手写屏幕,输入检索词。
另一个实施例中,所述翻译模块具体用于:
确定目标语种,所述确定目标语种包括:将用户在可选的语种中选择的语种,确定为所述目标语种,或者,将所述识别后的文本采用的语种确定为所述目标语种;
根据所述目标语种,对所述用户母语文本形式的检索词,翻译成所述目标语种词汇。
例如,移动设备可以向用户提供多种可选语种,例如,可选语种包括英文、法文等。用户在这些可选语种中可以根据自身需要选择合适的语种。
例如,用户输入的是中文词汇,选择的目标语种是英文,那么翻译***可以将检索词从中文翻译成英文。
另一个实施例中,所述显示模块具体用于:
向所述用户显示所述目标图片,在所述目标图片中突出显示所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果;或者,
向所述用户显示对所述目标图片截取后的图片,所述截取后的图片包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果;或者,
向所述用户显示文本内容,所述文本内容包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果。
另一个实施例中,所述显示模块还具体用于:
在所述目标图片中高亮显示所述第一内容;或者,
在所述目标图片中框选显示所述第一内容;或者,
在所述目标图片中对所述第一内容增加下划线后显示。
另一个实施例中,所述查询模块还用于在文字识别时记录所述第一内容在所述目标图片中的位置信息;所述显示模块还具体用于在所述目标图片中突出显示所述位置信息对应的内容,以在所述目标图片中突出显示所述第一内容。
本实施例的装置可以具体为执行上述方法的装置,因此,本实施例中的装置的具体功能和参数可以参见上述方法中的描述,在此不再赘述。
本实施例通过将用户母语输入的检索词翻译成目标语种词汇,在对目标图片识别后的文本中查找包含目标语种词汇的内容,并突出显示,可以方便用户定位到所需内容,不需要用户逐条进行查找,可以降低用户操作复杂度,并提升用户体验;通过在移动设备中植入上述翻译***、文字识别***、检索***,不需要分别配置专门工具,方便用户使用,降低成本,并且可以为用户主动提供所需信息。
本发明实施例还提供了一种移动设备,该移动设备包括壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为移动设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:
S11’:将获取的用户母语文本形式的检索词,翻译成目标语种词汇。
例如,用户在国外的餐馆想点与鸡肉相关的菜时,用户可以以母语输入检索词“鸡肉”。
其中,用户可以采用文本方式输入,或者,用户也可以采用语音方式输入。在语音方式输入时,移动设备还可以进一步对语音进行识别,得到文本形式的检索词。
另外,目标语种可以是根据用户选择确认的,例如,移动终端可以向用户显示选择项,由用户选择目标语种;或者,目标语种也可以根据对目标对象的识别确定,将目标语种确定为与目标对象的语种相同。
例如,用户选择或者目标对象的语种为英文时,移动设备中的翻译***可以将检索词“鸡肉”翻译成目标语种词汇“chicken”。
可以理解的是,在翻译时,可能得到多个词汇,例如,用户输入的检索词为“肉”时,得到的翻译词可以包括“pork”、“chicken”等。
进一步的,翻译***得到的翻译后的检索词可以不需要展示给用户。
S12’:对采用所述目标语种的目标对象进行拍摄,得到目标图片,并对所述目标图片进行文字识别,得到识别后的文本。
例如,目标对象可以是英文菜单。
移动设备在对英文菜单进行拍摄时,可以是实时的连续拍摄或者仅拍摄一张图像。
在得到目标图片后,移动设备中的文字识别***,例如,光学字符识别OCR(OpticalCharacter Recognition,OCR)***,可以对目标图片进行文字识别,得到目标对象中的每个字(或词)及其位置。
例如,对英文菜单对应的图片进行识别后,可以得到每个菜名。对每张图进行文字检测和识别,记录识别的每个字(词)和位置。基于场景文字的检测和识别已经有成熟技术,如百度翻译APP中就已经采用。假设英文菜单中有一条“Chicken Teriyaki”,经场景文字检测和识别后,可以得到每个字符的识别结果及其在图像中的位置。
S11’和S12’无时序限制关系。
S13’:在所述识别后的文本中查找,获取第一内容,所述第一内容为所述识别后的文本中包含所述目标语种词汇的内容。
例如,在识别后的文本中有一个菜名为“Chicken Teriyaki”,由于其中包含目标语种词汇“chicken”,因此,可以将“Chicken Teriyaki”确定为第一内容。
其中,可以通过排版信息和/或自然语言处理的分词技术,对识别后的文本进行分词,以确定包含目标语种词汇的内容。例如,一个菜单名通常会写成一行,可以将包含该目标语种词汇的一行内容确定为上述的第一内容。
S14’:将所述第一内容翻译成所述用户的母语翻译结果,并向所述用户显示查询结果,所述查询结果包括所述用户的母语翻译结果。
例如,查找到“Chicken Teriyaki”后,可以将其翻译成用户母语的“红烧鸡”。
在得到母语翻译结果,如“红烧鸡”后,可以有如下几种显示方式:
(1)向所述用户显示所述目标图片,在所述目标图片中所述第一内容的位置处,突出显示所述用户的母语翻译结果;
例如,在文字识别时,可以记录每个词汇的位置,之后在显示时,可以根据记录的“Chicken Teriyaki”的位置,在菜单的“Chicken Teriyaki”的位置处突出显示“红烧鸡”。或者,不仅显示母语翻译结果,还显示目标语种的菜名,例如,同时突出显示“红烧鸡”和对应的“Chicken Teriyaki”。
其中,可以用高亮、框选或者增加下划线等方式实现突出显示。
(2)向所述用户显示对所述目标图片截取后的图片,所述截取后的图片包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果;
例如,从目标图片中将“Chicken Teriyaki”位置处的图片截取下来,在截取后的图片中显示“红烧鸡”和对应的“Chicken Teriyaki”。
(3)向所述用户显示文本内容,所述文本内容包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果。
与(2)不同的是,(2)是图片形式,(3)是文本形式。
例如,该文本中显示“红烧鸡”和对应的“Chicken Teriyaki”。
本实施例通过将检索词翻译成目标语种词汇,并在对目标图片识别后的文本中查找目标语种词汇,得到包含目标语种词汇的第一内容,之后向用户显示的查询结果中包括对第一内容的翻译结果,可以直接查找用户感兴趣的内容,并直接将用户感兴趣的信息显示给用户,不需要用户在多个翻译结果中再次查找比对,可以降低用户操作繁琐性,提高用户体验,并且通过用户以母语输入且向用户显示母语结果,可以进一步方便用户操作及提高用户体验。
另一实施例中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:
S21’:接收用户以母语文本形式在移动设备中输入检索词。
例如,用户通过移动设备的键盘或者手写屏幕,输入检索词。
S22’:确定用户在移动设备提供的可选语种中,选择的目标语种。
例如,移动设备可以向用户提供多种可选语种,例如,可选语种包括英文、法文等。
用户在这些可选语种中可以根据自身需要选择合适的语种。
S23’:通过翻译***将检索词翻译成目标语种的词汇。
例如,用户输入的是中文词汇,选择的目标语种是英文,那么翻译***可以将检索词从中文翻译成英文。
S24’:对目标对象进行拍摄,得到目标图片。
例如,移动设备可以内置摄像头,通过该摄像头可以拍摄得到目标图片。
S25’:通过文字识别***对目标图片进行文字识别,得到识别后的文本。
例如,文字识别***为OCR***,通过OCR***可以将图片识别为文本。
S21’-S23’与S24’-S25’无时序限制关系。
S26’:通过检索***在对目标图片识别后的文本中,查找第一内容,第一内容为包含翻译后的检索词的内容。
通过检索***的查找比对,可以在识别后的文本中查找到包含翻译后的检索词的第一内容。
S27’:将查找到的第一内容进行翻译,得到用户母语形式的对第一内容的翻译结果。
其中,移动设备中的翻译***将目标语种的第一内容翻译成用户母语。
S28’:在第一内容的位置处高亮显示翻译结果。
通过突出显示翻译结果,可以方便用户定位到所需信息。
本实施例通过将用户母语输入的检索词翻译成目标语种词汇,在对目标图片识别后的文本中查找包含目标语种词汇的内容,并突出显示,可以方便用户定位到所需内容,不需要用户逐条进行查找,可以降低用户操作复杂度,并提升用户体验;通过在移动设备中植入上述翻译***、文字识别***、检索***,不需要分别配置专门工具,方便用户使用,降低成本,并且可以为用户主动提供所需信息。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (12)

1.一种信息查询方法,其特征在于,包括:
将获取的用户母语文本形式的检索词,翻译成目标语种词汇;
对采用所述目标语种的目标对象进行拍摄,得到目标图片,并对所述目标图片进行文字识别,得到识别后的文本;
在所述识别后的文本中查找,获取第一内容,所述第一内容为所述识别后的文本中包含所述目标语种词汇的内容;
将所述第一内容翻译成所述用户的母语翻译结果,并向所述用户显示查询结果,所述查询结果包括所述用户的母语翻译结果。
2.根据权利要求1所述的方法,其特征在于,还包括:获取所述用户母语文本形式的检索词,所述获取所述用户母语文本形式的检索词,包括:
接收所述用户以母语文本形式输入的检索词;或者,
接收所述用户以母语语音形式输入的检索词,并将所述语音形式输入的检索词识别为母语文本形式。
3.根据权利要求1所述的方法,其特征在于,所述将获取的用户母语文本形式的检索词,翻译成目标语种词汇,包括:
确定目标语种,所述确定目标语种包括:将用户在可选的语种中选择的语种,确定为所述目标语种,或者,将所述识别后的文本采用的语种确定为所述目标语种;
根据所述目标语种,对所述用户母语文本形式的检索词,翻译成所述目标语种词汇。
4.根据权利要求1所述的方法,其特征在于,所述向所述用户显示查询结果,包括:
向所述用户显示所述目标图片,在所述目标图片中所述第一内容的位置处,突出显示所述用户的母语翻译结果;或者,
向所述用户显示对所述目标图片截取后的图片,所述截取后的图片包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果;或者,
向所述用户显示文本内容,所述文本内容包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果。
5.根据权利要求4所述的方法,其特征在于,所述在所述目标图片中突出显示所述第一内容,包括:
在所述目标图片中高亮显示所述第一内容;或者,
在所述目标图片中框选显示所述第一内容;或者,
在所述目标图片中对所述第一内容增加下划线后显示。
6.根据权利要求4所述的方法,其特征在于,所述在所述目标图片中突出显示所述第一内容,包括:
在文字识别时记录所述第一内容在所述目标图片中的位置信息;
在所述目标图片中突出显示所述位置信息对应的内容,以在所述目标图片中突出显示所述第一内容。
7.一种信息查询装置,其特征在于,包括:
翻译模块,用于将获取的用户母语文本形式的检索词,翻译成目标语种词汇;
识别模块,用于对采用所述目标语种的目标对象进行拍摄,得到目标图片,并对所述目标图片进行文字识别,得到识别后的文本;
查询模块,用于在所述识别后的文本中查找,获取第一内容,所述第一内容为所述识别后的文本中包含所述目标语种词汇的内容;
显示模块,用于将所述第一内容翻译成所述用户的母语翻译结果,并向所述用户显示查询结果,所述查询结果包括所述用户的母语翻译结果。
8.根据权利要求7所述的装置,其特征在于,还包括:
获取模块,用于获取所述用户母语文本形式的检索词;
所述获取模块具体用于:
接收所述用户以母语文本形式输入的检索词;或者,
接收所述用户以母语语音形式输入的检索词,并将所述语音形式输入的检索词识别为母语文本形式。
9.根据权利要求7所述的装置,其特征在于,所述翻译模块具体用于:
确定目标语种,所述确定目标语种包括:将用户在可选的语种中选择的语种,确定为所述目标语种,或者,将所述识别后的文本采用的语种确定为所述目标语种;
根据所述目标语种,对所述用户母语文本形式的检索词,翻译成所述目标语种词汇。
10.根据权利要求7所述的装置,其特征在于,所述显示模块具体用于:
向所述用户显示所述目标图片,在所述目标图片中所述第一内容的位置处,突出显示所述用户的母语翻译结果;或者,
向所述用户显示对所述目标图片截取后的图片,所述截取后的图片包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果;或者,
向所述用户显示文本内容,所述文本内容包括所述第一内容,并显示所述第一内容对应的所述用户的母语翻译结果。
11.根据权利要求10所述的装置,其特征在于,所述显示模块还具体用用于:
在所述目标图片中高亮显示所述第一内容;或者,
在所述目标图片中框选显示所述第一内容;或者,
在所述目标图片中对所述第一内容增加下划线后显示。
12.根据权利要求10所述的装置,其特征在于,
所述查询模块还用于在文字识别时记录所述第一内容在所述目标图片中的位置信息;
所述显示模块还具体用于在所述目标图片中突出显示所述位置信息对应的内容,以在所述目标图片中突出显示所述第一内容。
CN201410128777.6A 2014-04-01 2014-04-01 信息查询方法和装置 Pending CN103914539A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410128777.6A CN103914539A (zh) 2014-04-01 2014-04-01 信息查询方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410128777.6A CN103914539A (zh) 2014-04-01 2014-04-01 信息查询方法和装置

Publications (1)

Publication Number Publication Date
CN103914539A true CN103914539A (zh) 2014-07-09

Family

ID=51040219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410128777.6A Pending CN103914539A (zh) 2014-04-01 2014-04-01 信息查询方法和装置

Country Status (1)

Country Link
CN (1) CN103914539A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834924A (zh) * 2015-06-02 2015-08-12 广东欧珀移动通信有限公司 一种防错填信息的方法、***及移动终端
CN105447109A (zh) * 2015-11-13 2016-03-30 小米科技有限责任公司 关键字词搜索方法及装置
CN105607852A (zh) * 2015-12-18 2016-05-25 北京奇虎科技有限公司 输入文本的方法及电子设备
CN106325750A (zh) * 2016-08-26 2017-01-11 曹蕊 一种应用于终端设备的文字识别方法及***
CN106909270A (zh) * 2016-07-20 2017-06-30 阿里巴巴集团控股有限公司 聊天数据输入方法、装置及通讯终端
CN107273106A (zh) * 2016-04-08 2017-10-20 北京三星通信技术研究有限公司 物体信息翻译、以及衍生信息获取方法和装置
CN107480145A (zh) * 2017-08-07 2017-12-15 中译语通科技(青岛)有限公司 一种基于互联网的多语菜单翻译方法
CN107609914A (zh) * 2017-09-22 2018-01-19 上海爱优威软件开发有限公司 一种智能菜单设计方法及***
CN107729325A (zh) * 2017-08-29 2018-02-23 捷开通讯(深圳)有限公司 一种智能翻译方法、存储设备及智能终端
CN108182183A (zh) * 2017-12-27 2018-06-19 北京百度网讯科技有限公司 图片文字翻译方法、应用及计算机设备
CN108345839A (zh) * 2018-01-22 2018-07-31 维沃移动通信有限公司 一种关键词定位的方法及移动终端
CN108491839A (zh) * 2018-03-27 2018-09-04 北京小米移动软件有限公司 信息获取方法及装置
CN109002239A (zh) * 2018-06-22 2018-12-14 维沃移动通信有限公司 一种信息显示方法及终端设备
CN113168514A (zh) * 2018-11-25 2021-07-23 谷歌有限责任公司 查找和过滤视觉场景的元素

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1685341A (zh) * 2002-09-30 2005-10-19 陈宁萍 跨语言搜索结果的闪烁注释标注加亮
CN101082956A (zh) * 2006-06-02 2007-12-05 英华达(上海)电子有限公司 手持设备上基于图片进行外文翻译的装置及方法
CN101464903A (zh) * 2009-01-09 2009-06-24 江阴明伦科技有限公司 一种利用web方式进行OCR图文识别检索方法和***
CN101743544A (zh) * 2007-05-16 2010-06-16 谷歌公司 跨语言信息检索
US20130211816A1 (en) * 2006-10-10 2013-08-15 Abbyy Infopoisk Llc Deep Model Statistics Method for Machine Translation
CN103294665A (zh) * 2012-02-22 2013-09-11 汉王科技股份有限公司 电子阅读器文本翻译的方法及电子阅读器
CN103353884A (zh) * 2013-06-18 2013-10-16 西北农林科技大学 速查词典

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1685341A (zh) * 2002-09-30 2005-10-19 陈宁萍 跨语言搜索结果的闪烁注释标注加亮
CN101082956A (zh) * 2006-06-02 2007-12-05 英华达(上海)电子有限公司 手持设备上基于图片进行外文翻译的装置及方法
US20130211816A1 (en) * 2006-10-10 2013-08-15 Abbyy Infopoisk Llc Deep Model Statistics Method for Machine Translation
CN101743544A (zh) * 2007-05-16 2010-06-16 谷歌公司 跨语言信息检索
CN101464903A (zh) * 2009-01-09 2009-06-24 江阴明伦科技有限公司 一种利用web方式进行OCR图文识别检索方法和***
CN103294665A (zh) * 2012-02-22 2013-09-11 汉王科技股份有限公司 电子阅读器文本翻译的方法及电子阅读器
CN103353884A (zh) * 2013-06-18 2013-10-16 西北农林科技大学 速查词典

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834924A (zh) * 2015-06-02 2015-08-12 广东欧珀移动通信有限公司 一种防错填信息的方法、***及移动终端
CN105447109A (zh) * 2015-11-13 2016-03-30 小米科技有限责任公司 关键字词搜索方法及装置
CN105607852A (zh) * 2015-12-18 2016-05-25 北京奇虎科技有限公司 输入文本的方法及电子设备
CN107273106A (zh) * 2016-04-08 2017-10-20 北京三星通信技术研究有限公司 物体信息翻译、以及衍生信息获取方法和装置
CN107273106B (zh) * 2016-04-08 2021-07-06 北京三星通信技术研究有限公司 物体信息翻译、以及衍生信息获取方法和装置
CN106909270A (zh) * 2016-07-20 2017-06-30 阿里巴巴集团控股有限公司 聊天数据输入方法、装置及通讯终端
CN106325750A (zh) * 2016-08-26 2017-01-11 曹蕊 一种应用于终端设备的文字识别方法及***
CN107480145A (zh) * 2017-08-07 2017-12-15 中译语通科技(青岛)有限公司 一种基于互联网的多语菜单翻译方法
CN107729325A (zh) * 2017-08-29 2018-02-23 捷开通讯(深圳)有限公司 一种智能翻译方法、存储设备及智能终端
CN107609914A (zh) * 2017-09-22 2018-01-19 上海爱优威软件开发有限公司 一种智能菜单设计方法及***
CN108182183A (zh) * 2017-12-27 2018-06-19 北京百度网讯科技有限公司 图片文字翻译方法、应用及计算机设备
CN108182183B (zh) * 2017-12-27 2021-09-17 北京百度网讯科技有限公司 图片文字翻译方法、应用及计算机设备
CN108345839A (zh) * 2018-01-22 2018-07-31 维沃移动通信有限公司 一种关键词定位的方法及移动终端
CN108491839A (zh) * 2018-03-27 2018-09-04 北京小米移动软件有限公司 信息获取方法及装置
CN109002239A (zh) * 2018-06-22 2018-12-14 维沃移动通信有限公司 一种信息显示方法及终端设备
CN109002239B (zh) * 2018-06-22 2021-05-11 维沃移动通信有限公司 一种信息显示方法及终端设备
CN113168514A (zh) * 2018-11-25 2021-07-23 谷歌有限责任公司 查找和过滤视觉场景的元素

Similar Documents

Publication Publication Date Title
CN103914539A (zh) 信息查询方法和装置
US10409488B2 (en) Intelligent virtual keyboards
KR101667463B1 (ko) 콘텍스트 정보를 이용한 모바일 디바이스 상에서의 광학적 문자 인식
US10789078B2 (en) Method and system for inputting information
US8943092B2 (en) Digital ink based contextual search
US9965569B2 (en) Truncated autosuggest on a touchscreen computing device
CN111782977B (zh) 兴趣点处理方法、装置、设备及计算机可读存储介质
US20170351371A1 (en) Touch interaction based search method and apparatus
US11361002B2 (en) Method and apparatus for recognizing entity word, and storage medium
US20140320413A1 (en) Multimodal text input by a keyboard/camera text input module replacing a conventional keyboard text input module on a mobile device
US20140081619A1 (en) Photography Recognition Translation
CN107562735A (zh) 用于应用的自动语言转化的***和方法
CN108369585B (zh) 用于提供翻译服务的方法及其电子装置
CN104808806A (zh) 根据不确定性信息实现汉字输入的方法和装置
CN107861753B (zh) App生成索引、检索方法和***及可读存储介质
CN111737430B (zh) 实体链接方法、装置、设备以及存储介质
CN111309200B (zh) 一种扩展阅读内容的确定方法、装置、设备及存储介质
CN110705226A (zh) 电子表格的创建方法、装置及计算机设备
CN114595686A (zh) 知识抽取方法、知识抽取模型的训练方法及装置
US10409623B2 (en) Graphical user interface for localizing a computer program using context data captured from the computer program
US9405744B2 (en) Method and apparatus for managing image data in electronic device
KR20210050484A (ko) 정보 처리 방법, 장치 및 저장 매체
CN102479177A (zh) 移动装置的实时翻译方法
CN102722490B (zh) 一种电子阅读器的取词方法、取词装置及电子阅读器
CN114490986A (zh) 计算机实施的数据挖掘方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140709