CN104462186A - 一种语音搜索方法及装置 - Google Patents

一种语音搜索方法及装置 Download PDF

Info

Publication number
CN104462186A
CN104462186A CN201410553763.9A CN201410553763A CN104462186A CN 104462186 A CN104462186 A CN 104462186A CN 201410553763 A CN201410553763 A CN 201410553763A CN 104462186 A CN104462186 A CN 104462186A
Authority
CN
China
Prior art keywords
url
character information
search results
browser
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410553763.9A
Other languages
English (en)
Inventor
陈本东
谢文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410553763.9A priority Critical patent/CN104462186A/zh
Publication of CN104462186A publication Critical patent/CN104462186A/zh
Priority to PCT/CN2015/084121 priority patent/WO2016058425A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种语音搜索方法及装置。一方面,本发明实施例通过依据采集的语音信息,获得对应的字符信息;从而,获得与所述字符信息相匹配的搜索结果的统一资源定位符URL;进而,可以将所述URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。因此,本发明实施例提供的技术方案能够实现语音搜索功能,以提高搜索效率。

Description

一种语音搜索方法及装置
【技术领域】
本发明涉及互联网应用技术领域,尤其涉及一种语音搜索方法及装置。
【背景技术】
随着浏览器技术的快速发展,浏览器已被用户广泛使用。用户可以控制浏览器来执行浏览器能够支持的操作,还可以控制浏览器来访问网页页面等。
目前,利用计算机上的浏览器软件或者手机上安装的浏览器客户端实现搜索是浏览器可以支持的功能之一,其搜索方法是:用户在浏览器软件或者手机上安装的浏览器客户端上所显示的搜索页面中输入查询词,然后点击搜索按键,以触发服务器依据该查询词进行搜索,以获得搜索结果,最后由浏览器显示搜索结果。
然而,对于不会输入法的用户或者利用手机输入查询词的用户而言,输入查询词比较困难,导致目前的搜索方法效率比较低。
【发明内容】
有鉴于此,本发明实施例提供了一种语音搜索方法及装置,可以实现语音搜索功能,以提高搜索效率。
本发明实施例的一方面,提供一种语音搜索方法,包括:
依据采集的语音信息,获得对应的字符信息;
获得与所述字符信息相匹配的搜索结果的统一资源定位符URL;
将所述URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述依据采集的语音信息,获得对应的字符信息,包括:
获得采集的语音信息;
利用语音识别模型对所述采集的语音信息进行语音识别处理,以获得所述语音信息所对应的字符信息。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得与所述字符信息相匹配的搜索结果的URL,包括:
获得当前语音状态;
若所述当前语音状态为搜索状态,获得与所述字符信息相匹配的搜索结果的URL。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得与所述字符信息相匹配的搜索结果的URL,包括:
利用分词词典对所述字符信息进行切词,以获得至少一个分词;
依据所述至少一个分词,获得与所述字符信息相匹配的搜索结果的URL。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述依据所述至少一个分词,获得与所述字符信息相匹配的搜索结果的URL,包括:
利用分类词典对所述至少一个分词进行分类,以获得分类结果;
若所述分类结果为所述至少一个分词中包含网站名称和物体名称,依据所述物体名称,获得所述物体名称在所述网站名称所指示的网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中只包含网站名称,获得所述网站名称所指示的网站的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中包含物品名称和动词,获得所述物品名称在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL;或者,依据所述物品名称获得对应的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中不包含网站名称、物品名称和动词,依据所述字符信息获得查询词,以及获得所述查询词在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述将所述URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果,包括:
确定所述URL所对应的浏览器,以及向所述浏览器发送所述URL,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果;或者,
接收所述浏览器发送的获取请求,以及依据所述获取请求将所述浏览器对应的URL发送给所述浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
本发明实施例的一方面,提供一种语音搜索装置,包括:
语音识别单元,用于依据采集的语音信息,获得对应的字符信息;
信息处理单元,用于获得与所述字符信息相匹配的搜索结果的统一资源定位符URL;
信息存储单元,用于将所述URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述语音识别单元,包括:
获得采集的语音信息;
利用语音识别模型对所述采集的语音信息进行语音识别处理,以获得所述语音信息所对应的字符信息。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述信息处理单元,具体用于:
获得当前语音状态;
若所述当前语音状态为搜索状态,获得与所述字符信息相匹配的搜索结果的URL。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述信息处理单元,具体用于:
利用分词词典对所述字符信息进行切词,以获得至少一个分词;
依据所述至少一个分词,获得与所述字符信息相匹配的搜索结果的URL。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述依据所述至少一个分词,获得与所述字符信息相匹配的搜索结果的URL,具体包括:
利用分类词典对所述至少一个分词进行分类,以获得分类结果;
若所述分类结果为所述至少一个分词中包含网站名称和物体名称,依据所述物体名称,获得所述物体名称在所述网站名称所指示的网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中只包含网站名称,获得所述网站名称所指示的网站的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中包含物品名称和动词,获得所述物品名称在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL;或者,依据所述物品名称获得对应的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中不包含网站名称、物品名称和动词,依据所述字符信息获得查询词,以及获得所述查询词在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述信息存储单元,具体用于:
确定所述URL所对应的浏览器,以及向所述浏览器发送所述URL,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果;或者,
接收所述浏览器发送的获取请求,以及依据所述获取请求将所述浏览器对应的URL发送给所述浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
由以上技术方案可以看出,本发明实施例具有以下有益效果:
本发明实施例通过依据采集的语音信息,获得对应的字符信息;从而,获得与所述字符信息相匹配的搜索结果的统一资源定位符URL;进而,可以将所述URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。因此,与现有技术相比,本发明实施例提供的技术方案在不需要用户手动输入查询词并点击搜索按键的情况下,也可以实现搜索功能,可以提高搜索效率。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例所提供的技术方案使用的***示意图;
图2是本发明实施例所提供的语音搜索方法的流程示意图;
图3是本发明实施例所提供的语音搜索装置的功能方块图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
本发明实施例所提供的技术方案使用的***如图1所示,该***包括采集装置、语音搜索装置和浏览器。
本发明实施例给出一种语音搜索方法,请参考图2,其为本发明实施例所提供的语音搜索方法的流程示意图,如图所示,该方法包括以下步骤:
S201,依据采集的语音信息,获得对应的字符信息。
具体的,本发明实施例中,依据采集的语音信息,获得对应的字符信息的方法可以包括但不限于:如图1所示,首先,语音识别单元可以从采集装置获得该采集装置所采集的用户的语音信息。然后,语音识别单元利用语音识别模型对该采集装置所采集的语音信息进行语音识别处理,以获得所述语音信息所对应的字符信息。
优选的,如图1所示,所述采集装置可以包括但不限于:耳机或者麦克风。
其中,所述耳机可以包括但不限于通过有线方式或者无线方式与终端连接的耳机,如有线耳机、蓝牙耳机等。
其中,所述麦克风可以包括但不限于终端自身的麦克风、终端上***的外设麦克风或者音箱的麦克风。
需要说明的是,所述语音识别单元可以位于所述终端中,或者,还可以位于服务器侧。
如图1所示,例如,若所述采集装置位于所述终端中,语音识别单元位于服务器侧,则终端的采集装置在采集到用户的语音信息后,终端的无线通信单元可以通过无线网络将该语音信息发送给服务器侧的语音识别单元,这样,语音识别单元就可以获得采集的语音信息。
再例如,若所述采集装置位于所述终端中,语音识别单元也位于终端中,则终端的采集装置在采集到用户的语音信息后,可以将该语音信息发送给终端的语音识别单元,这样,语音识别单元就可以获得采集的语音信息。
因此,本发明实施例中的语音识别单元可以位于服务器侧,利用语音识别服务器实现,或者,也可以位于终端。
举例说明,语音识别单元利用语音识别模型对该采集装置所采集的语音信息进行语音识别处理,以获得所述语音信息所对应的字符信息的方法可以包括但不限于:在训练阶段,将用户的语音信息的特征矢量作为模板存储在语音识别模型,在进行语音识别处理时,提取采集装置所采集的语音信息的特征矢量,将该特征矢量依次与语音识别模型中的每个模板进行相似度计算,将相似度最高的模板作为语音识别结果输出,从而实现将语音信息转化为对应的字符信息。
S202,获得与所述字符信息相匹配的搜索结果的统一资源定位符URL。
具体的,如图1所示,语音识别单元在获得语音信息所对应的字符信息后,可以将该字符信息发送给信息处理单元,信息处理单元可以获得与该字符信息相匹配的搜索结果的统一资源定位符(Uniform Resource Locator,URL)。
本发明实施例中,信息处理单元可以位于服务器侧,利用信息处理服务器实现,可以与语音识别单元设置于不同服务器上。或者,信息处理单元还可以位于服务器侧,与语音识别单元位于同一服务器上,属于该服务器的不同处理单元。
优选的,信息处理单元获得与所述字符信息相匹配的搜索结果的URL的方法可以包括但不限于:
首先,信息处理单元获得当前语音状态。然后,若所述当前语音状态为搜索状态,获得与所述字符信息相匹配的搜索结果的URL。
其中,所述当前语音状态可以包括但不限于搜索状态或者非搜索状态。在搜索状态下,信息处理单元才会获得与所述字符信息相匹配的搜索结果的URL。
举例说明,信息处理单元获得当前语音状态的方法可以包括但不限于以下几种:
第一种:若语音识别单元位于终端,可以由语音识别单元检测终端内语音搜索状态值,若语音搜索状态值指示语音搜索功能开启,则语音识别单元确定当前语音状态为搜索状态,若语音搜索状态值指示语音搜索功能关闭,则语音识别单元确定当前语音状态为非搜索状态。语音识别单元可以在向信息处理单元提供字符信息时,将当前语音状态也提供给信息处理单元,这样,信息处理单元就可以获得当前语音状态。
第二种:若语音识别单元位于服务器侧,可以由采集装置检测自身的语音搜索状态值或者终端的语音搜索状态值,若语音搜索状态值指示语音搜索功能开启,则采集装置确定当前语音状态为搜索状态,若语音搜索状态值指示语音搜索功能关闭,则采集装置确定当前语音状态为非搜索状态。采集装置可以向语音识别单元提供该当前语音状态,以使得语音识别单元向信息处理单元提供该当前语音状态,这样,信息处理单元就可以获得当前语音状态。
第三种:信息处理单元可以预先存储采集装置或者终端的当前语音状态,然后当信息处理单元收到语音识别单元提供的字符信息后,依据提供该字符信息的采集装置或者终端,在本地查询该采集装置或者终端的当前语音状态。例如,用户通过采集装置或者终端登录该信息处理单元所在的服务器,并开启语音搜索功能,这样,信息处理单元收到该采集装置或者终端提供的字符信息后,就可以获知该采集装置或者终端的语音搜索功能开启,从而确定当前语音状态是搜索状态。
第四种:终端判断当前开启的浏览器是否打开搜索页面或者终端中是否开启搜索客户端,若浏览器打开搜索页面或者终端运行搜索客户端,都可以认为终端的当前语音状态为搜索状态。然后,终端的采集装置将当前语音状态可以提供给语音识别单元,以便于语音识别单元提供给信息处理单元,或者终端内的语音识别单元将当前语音状态提供给信息处理单元。
其中,浏览器打开搜索页面可以包括但不限于:浏览器当前显示的页面是搜索页面,或者,浏览器已打开的至少两个页面中包含搜索页面。
其中,终端运行搜索客户端可以包括但不限于:终端正在运行搜索客户端,或者,终端后台运行搜索客户端。
需要说明的是,现有技术中,如果浏览器正在显示其他页面,用户需要进行搜索或者语音搜索,必须要回到或者开启搜索页面,以使得浏览器显示搜索页面,才能输入字符信息或者语音信息,以触发搜索操作。然而,本说明实施例所提供的技术方案中,只需要确定当前语音状态是搜索状态,即使没有正在显示搜索页面或者运行搜索客户端,也可以输入语音信息,从而触发语音搜索操作,因此,可以大大减少操作成本,提高语音搜索效率。
举例说明,信息处理单元获得与该字符信息相匹配的搜索结果的URL的方法可以包括但不限于:首先,信息处理单元利用分词词典对所述字符信息进行切词,以获得至少一个分词。然后,信息处理单元依据该至少一个分词,获得与该字符信息相匹配的搜索结果的URL。
其中,所述信息处理单元依据所述至少一个分词,获得与所述字符信息相匹配的搜索结果的URL的方法可以包括但不限于:
首先,信息处理单元利用分类词典对所述至少一个分词进行分类,以获得分类结果。
然后,信息处理单元若确定所述分类结果为所述至少一个分词中包含网站名称和物体名称,信息处理单元依据所述物体名称,获得所述物体名称在所述网站名称所指示的网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL。
例如,语音识别单元对采集到得语音信息进行语音识别处理后,获得对应的字符信息为“我想在淘宝网买衣服”,信息处理单元对“我想在淘宝网买衣服”进行切词处理,获得分词“我”、“想”、“在”、“淘宝网”、“买”和“衣服”。分类词典中包含至少一个网站名称和至少一个物体名称,表示用户的搜索意图是希望在“淘宝网”上购买“衣服”,用户的搜索意图十分明确,因此,利用分类词典对获得的分词进行分类,获得包含网站名称“淘宝网”和物体名称“衣服”的分类结果,信息处理单元依据“衣服”,获得“衣服”在“淘宝网”的搜索结果的URL。其中,信息处理单元可以依据网站名称的URL格式生成该URL,如“淘宝网”的搜索结果的URL格式为“http://s.taobao.com/search?q=XXX”,因此,信息处理单元可以获得URL“http://s.taobao.com/search?q=衣服”,将该URL作为与“我想在淘宝网买衣服”相匹配的搜索结果的URL。
或者,信息处理单元若确定所述分类结果为所述至少一个分词中只包含网站名称,获得所述网站名称所指示的网站的URL,以作为与所述字符信息相匹配的搜索结果的URL。
例如,语音识别单元对采集到得语音信息进行语音识别处理后,获得对应的字符信息为“打开新浪网”,信息处理单元对“打开新浪网”进行切词处理,获得分词“打开”和“新浪网”。利用分类词典对获得的分词进行分类,获得包含网站名称“新浪网”的分类结果,表示用户的搜索意图是希望浏览“新浪网”,用户的搜索意图十分明确,信息处理单元获得“新浪网”的URL,即“http://sina.com.cn”,将该URL作为与“打开新浪网”相匹配的搜索结果的URL。
或者,信息处理单元若确定所述分类结果为所述至少一个分词中包含物品名称和动词,获得所述物品名称在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL;或者,依据所述物品名称获得对应的URL,以作为与所述字符信息相匹配的搜索结果的URL。
例如,语音识别单元对采集到得语音信息进行语音识别处理后,获得对应的字符信息为“我想买衣服”,信息处理单元对“我想买衣服”进行切词处理,获得分词“我”、“想”、“买”和“衣服”。利用分类词典对获得的分词进行分类,发现该字符信息中包含物体名称“衣服”和动词“买”,表示用户想在购物网站买衣服,则信息处理单元可以依据预设的购物网站的URL格式生成URL,如“淘宝网”的搜索结果的URL格式为“http://s.taobao.com/search?q=XXX”,因此,信息处理单元可以获得URL“http://s.taobao.com/search?q=衣服”,将该URL作为与“我想买衣服”相匹配的搜索结果的URL。或者,信息处理单元也可以依据物体名称获得对应的URL,如物体是图书,对应的URL是“当当网”的URL,或者,物体是电子产品,对应的URL是“京东网”的URL,从而实现向用户推荐URL。
或者,信息处理单元若确定所述分类结果为所述至少一个分词中不包含网站名称、物品名称和动词,信息处理单元依据所述字符信息获得查询词,以及获得所述查询词在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL。
例如,语音识别单元对采集到得语音信息进行语音识别处理后,获得对应的字符信息为“支付宝密码锁定了怎么办”,信息处理单元对“支付宝密码锁定了怎么办”进行切词处理,获得分词“支付宝”、“密码”、“锁定”、“了”和“怎么办”。利用分类词典对获得的分词进行分类,发现该字符信息中没有包含网站名称和物体名称,则表示用户是普通搜索意图,希望获得“支付宝密码锁定了怎么办”的搜索结果。信息处理单元将该字符信息作为查询词,以及获得“支付宝密码锁定了怎么办”在预设的搜索网站的搜索结果的URL。其中,信息处理单元可以依据预设的搜索网站的URL格式生成该URL。例如,百度搜索的搜索结果的URL格式为https://www.***.com/s?ie=utf-8&wd=XXX,则信息处理单元可以获得URL“https://www.***.com/s?ie=utf-8&wd=支付宝密码锁定了怎么办”,将该URL作为与“支付宝密码锁定了怎么办”相匹配的搜索结果的URL。
例如,上述物体名称可以包括“蓝牙耳机”、“衣服”,或者还可以包括具有限定词的物体名称,如“头戴式蓝牙耳机”、“婴儿衣服”等。
S203,将所述URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
具体的,信息处理单元在获得与字符信息相匹配的搜索结果的URL后,进一步将该URL提供给信息存储单元,信息存储单元可以将该URL提供给浏览器,以便于浏览器依据该URL显示与字符信息相匹配的搜索结果。
本发明实施例中,信息存储单元位于服务器侧,可以与信息处理单元和/或语音识别单元都位于同一服务器,或者,也可以与信息处理单元和/或语音识别单元分别位于不同服务器。
举例说明,信息存储单元将URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果的方法可以包括但不限于以下两种:
第一种:信息存储单元先存储获得的URL。然后,依据采集该字符信息对应的语音信息的采集装置的标识,确定与该采集装置绑定的浏览器,以作为该URL所对应的浏览器,从而信息存储单元就可以确定该URL所对应的浏览器。最后,信息存储单元可以向确定的浏览器发送该URL,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
可以理解的是,该方法中,信息存储单元主动将获得的URL提供给对应的浏览器,以使得浏览器可以及时获得URL。
第二种:信息存储单元先存储获得的URL,并在接收到浏览器发送的获取请求时,依据所述获取请求,获得与该浏览器绑定的采集装置,从而将依据该采集装置采集的语音信息对应的字符信息获得的URL作为该浏览器对应的URL,将该浏览器对应的URL发送给该浏览器,以便于该浏览器依据URL显示与该字符信息相匹配的搜索结果。
可以理解的是,该方法中,信息存储单元在收到浏览器的请求后,才将获得的URL提供给对应的浏览器,以使得浏览器可以获得URL。
举例说明,浏览器可以启动异步Javascript和可扩展标记语言(Asynchronous Javascript And Extensible Markup Language,AJAX)界面,从而可以依据预设的时间间隔(如每间隔0.5秒)与信息存储单元进行交互,以从信息存储单元获得该浏览器所需要的URL。
需要说明的是,上述两种方法中,信息存储单元将浏览器对应的URL发送给该浏览器的方法可以包括但不限于:信息存储单元将URL直接发送给浏览器;或者,信息存储单元将该URL分成M个字符串,并分N次将该M个字符串发送给浏览器,以便于浏览器对收到的字符串进行拼接,以获得该URL;其中,M为大于0的整数,N为大于0且小于或者等于M的整数。
另外,信息存储单元在将URL提供给浏览器之后,可以将该URL置为无效URL,以避免浏览器再次发送获取请求时,将该URL再次发送给浏览器所带来的浏览器重复获取的问题。
优选的,上述浏览器可以位于上述终端中。或者,还可以位于其他终端中。
可以理解的是,若上述浏览器位于其他终端,例如,手机的麦克风采集语音信息,语音搜索装置对该语音信息进行语音识别,以获得字符信息,进而获得与该字符信息相匹配的搜索结果的URL,将该URL提供给PC的浏览器,说明采集装置与浏览器可以不位于同一终端中,从而可以实现通过在手机上输入语音来控制PC的浏览器的搜索行为,方便快捷的实现语音搜索功能。
举例说明,浏览器依据获得的URL显示与字符信息相匹配的搜索结果的方法可以包括但不限于:浏览器发送针对该URL的超文本传送协议(Hypertexttransfer protocol,HTTP)请求给HTTP服务器。HTTP服务器在收到HTTP请求后,向浏览器发送HTTP响应,该HTTP响应中携带与字符信息相匹配的搜索结果的页面内容,浏览器利用页面模板对该页面内容进行渲染,从而可以显示与字符信息相匹配的搜索结果。
需要说明的是,现有技术中,谷歌搜索引擎能够支持语音搜索功能,其实现语音搜索时是由浏览器对语音信息进行语音识别等操作,目前,除了Chrome浏览器以外的其他浏览器都不具有语音识别功能,因此谷歌搜索引擎只能依赖Chrome浏览器才实现语音搜索功能。与现有技术相比,本发明实施例中的不需要浏览器对语音信息进行语音识别,也能够实现语音搜索功能,因此摆脱了语言搜索技术对浏览器的依赖,使得语音搜索技术可以应用于多种浏览器,扩展语音搜索功能的应用场景。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer,PC)、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。
需要说明的是,S201~S203的执行主体可以为语音搜索装置,该装置可以部分位于本地终端,部分位于服务器侧,或者,也可以全部位于服务器侧,本发明实施例对此不进行特别限定。
本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
请参考图3,其为本发明实施例所提供的语音搜索装置的功能方块图。如图所示,该装置包括:
语音识别单元30,用于依据采集的语音信息,获得对应的字符信息;
信息处理单元31,用于获得与所述字符信息相匹配的搜索结果的统一资源定位符URL;
信息存储单元32,用于将所述URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
优选的,所述语音识别单元30,包括:
获得采集的语音信息;
利用语音识别模型对所述采集的语音信息进行语音识别处理,以获得所述语音信息所对应的字符信息。
优选的,所述信息处理单元31,具体用于:
获得当前语音状态;
若所述当前语音状态为搜索状态,获得与所述字符信息相匹配的搜索结果的URL。
优选的,所述信息处理单元31,具体用于:
利用分词词典对所述字符信息进行切词,以获得至少一个分词;
依据所述至少一个分词,获得与所述字符信息相匹配的搜索结果的URL。
优选的,所述依据所述至少一个分词,获得与所述字符信息相匹配的搜索结果的URL,具体包括:
利用分类词典对所述至少一个分词进行分类,以获得分类结果;
若所述分类结果为所述至少一个分词中包含网站名称和物体名称,依据所述物体名称,获得所述物体名称在所述网站名称所指示的网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中只包含网站名称,获得所述网站名称所指示的网站的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中包含物品名称和动词,获得所述物品名称在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL;或者,依据所述物品名称获得对应的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中不包含网站名称、物品名称和动词,依据所述字符信息获得查询词,以及获得所述查询词在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL。
优选的,所述信息存储单元32,具体用于:
确定所述URL所对应的浏览器,以及向所述浏览器发送所述URL,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果;或者,
接收所述浏览器发送的获取请求,以及依据所述获取请求将所述浏览器对应的URL发送给所述浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
由于本实施例中的各单元能够执行图2所示的方法,本实施例未详细描述的部分,可参考对图2的相关说明。
本发明实施例的技术方案具有以下有益效果:
本发明实施例通过依据采集的语音信息,获得对应的字符信息;从而,获得与所述字符信息相匹配的搜索结果的统一资源定位符URL;进而,可以将所述URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。因此,与现有技术相比,本发明实施例提供的技术方案在不需要用户手动输入查询词并点击搜索按键的情况下,也可以实现搜索功能,可以提高搜索效率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (12)

1.一种语音搜索方法,其特征在于,所述方法包括:
依据采集的语音信息,获得对应的字符信息;
获得与所述字符信息相匹配的搜索结果的统一资源定位符URL;
将所述URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述依据采集的语音信息,获得对应的字符信息,包括:
获得采集的语音信息;
利用语音识别模型对所述采集的语音信息进行语音识别处理,以获得所述语音信息所对应的字符信息。
3.根据权利要求1所述的方法,其特征在于,所述获得与所述字符信息相匹配的搜索结果的URL,包括:
获得当前语音状态;
若所述当前语音状态为搜索状态,获得与所述字符信息相匹配的搜索结果的URL。
4.根据权利要求1或3所述的方法,其特征在于,所述获得与所述字符信息相匹配的搜索结果的URL,包括:
利用分词词典对所述字符信息进行切词,以获得至少一个分词;
依据所述至少一个分词,获得与所述字符信息相匹配的搜索结果的URL。
5.根据权利要器4所述的方法,其特征在于,所述依据所述至少一个分词,获得与所述字符信息相匹配的搜索结果的URL,包括:
利用分类词典对所述至少一个分词进行分类,以获得分类结果;
若所述分类结果为所述至少一个分词中包含网站名称和物体名称,依据所述物体名称,获得所述物体名称在所述网站名称所指示的网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中只包含网站名称,获得所述网站名称所指示的网站的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中包含物品名称和动词,获得所述物品名称在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL;或者,依据所述物品名称获得对应的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中不包含网站名称、物品名称和动词,依据所述字符信息获得查询词,以及获得所述查询词在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL。
6.根据权利要求1所述的方法,其特征在于,所述将所述URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果,包括:
确定所述URL所对应的浏览器,以及向所述浏览器发送所述URL,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果;或者,
接收所述浏览器发送的获取请求,以及依据所述获取请求将所述浏览器对应的URL发送给所述浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
7.一种语音搜索装置,其特征在于,所述装置包括:
语音识别单元,用于依据采集的语音信息,获得对应的字符信息;
信息处理单元,用于获得与所述字符信息相匹配的搜索结果的统一资源定位符URL;
信息存储单元,用于将所述URL提供给浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
8.根据权利要求7所述的装置,其特征在于,所述语音识别单元,包括:
获得采集的语音信息;
利用语音识别模型对所述采集的语音信息进行语音识别处理,以获得所述语音信息所对应的字符信息。
9.根据权利要求7所述的装置,其特征在于,所述信息处理单元,具体用于:
获得当前语音状态;
若所述当前语音状态为搜索状态,获得与所述字符信息相匹配的搜索结果的URL。
10.根据权利要求7或9所述的装置,其特征在于,所述信息处理单元,具体用于:
利用分词词典对所述字符信息进行切词,以获得至少一个分词;
依据所述至少一个分词,获得与所述字符信息相匹配的搜索结果的URL。
11.根据权利要求10所述的装置,其特征在于,所述依据所述至少一个分词,获得与所述字符信息相匹配的搜索结果的URL,具体包括:
利用分类词典对所述至少一个分词进行分类,以获得分类结果;
若所述分类结果为所述至少一个分词中包含网站名称和物体名称,依据所述物体名称,获得所述物体名称在所述网站名称所指示的网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中只包含网站名称,获得所述网站名称所指示的网站的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中包含物品名称和动词,获得所述物品名称在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL;或者,依据所述物品名称获得对应的URL,以作为与所述字符信息相匹配的搜索结果的URL;
若所述分类结果为所述至少一个分词中不包含网站名称、物品名称和动词,依据所述字符信息获得查询词,以及获得所述查询词在预设的搜索网站的搜索结果的URL,以作为与所述字符信息相匹配的搜索结果的URL。
12.根据权利要求7所述的装置,其特征在于,所述信息存储单元,具体用于:
确定所述URL所对应的浏览器,以及向所述浏览器发送所述URL,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果;或者,
接收所述浏览器发送的获取请求,以及依据所述获取请求将所述浏览器对应的URL发送给所述浏览器,以便于所述浏览器依据所述URL显示与所述字符信息相匹配的搜索结果。
CN201410553763.9A 2014-10-17 2014-10-17 一种语音搜索方法及装置 Pending CN104462186A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410553763.9A CN104462186A (zh) 2014-10-17 2014-10-17 一种语音搜索方法及装置
PCT/CN2015/084121 WO2016058425A1 (zh) 2014-10-17 2015-07-15 一种语音搜索方法、装置、设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410553763.9A CN104462186A (zh) 2014-10-17 2014-10-17 一种语音搜索方法及装置

Publications (1)

Publication Number Publication Date
CN104462186A true CN104462186A (zh) 2015-03-25

Family

ID=52908222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410553763.9A Pending CN104462186A (zh) 2014-10-17 2014-10-17 一种语音搜索方法及装置

Country Status (2)

Country Link
CN (1) CN104462186A (zh)
WO (1) WO2016058425A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105161106A (zh) * 2015-08-20 2015-12-16 深圳Tcl数字技术有限公司 智能终端的语音控制方法、装置及电视机***
WO2016058425A1 (zh) * 2014-10-17 2016-04-21 百度在线网络技术(北京)有限公司 一种语音搜索方法、装置、设备和计算机存储介质
CN106571144A (zh) * 2016-11-08 2017-04-19 广东小天才科技有限公司 一种基于语音识别的搜索方法及装置
CN108615527A (zh) * 2018-05-10 2018-10-02 腾讯科技(深圳)有限公司 基于同声传译的数据处理方法、装置和存储介质
CN108881507A (zh) * 2018-03-01 2018-11-23 赵建文 一种语音浏览器
CN110222266A (zh) * 2019-05-31 2019-09-10 江苏三六五网络股份有限公司 一种基于语音识别的房产专业语音搜索***及方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818212B (zh) * 2020-04-23 2023-10-13 腾讯科技(深圳)有限公司 语料数据采集方法、装置、计算机设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080153465A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Voice search-enabled mobile device
US20110145214A1 (en) * 2009-12-16 2011-06-16 Motorola, Inc. Voice web search
CN102591932A (zh) * 2011-12-23 2012-07-18 优视科技有限公司 语音搜索方法及***、移动终端、中转服务器
CN102629246A (zh) * 2012-02-10 2012-08-08 北京百纳信息技术有限公司 识别浏览器语音命令的服务器及浏览器语音命令识别方法
CN102968493A (zh) * 2012-11-27 2013-03-13 上海量明科技发展有限公司 通过输入法工具执行语音搜索的方法、客户端及***
CN104077105A (zh) * 2013-03-29 2014-10-01 联想(北京)有限公司 一种信息处理方法以及一种电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003515832A (ja) * 1999-11-25 2003-05-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声ナビゲーションのためのカテゴリーによるウェブページの参照
US20020072916A1 (en) * 2000-12-08 2002-06-13 Philips Electronics North America Corporation Distributed speech recognition for internet access
CN101751401A (zh) * 2008-12-19 2010-06-23 英业达股份有限公司 计算机装置、语音搜寻***及其方法
CN103020165B (zh) * 2012-11-26 2016-06-22 北京奇虎科技有限公司 可进行语音识别处理的浏览器及处理方法
CN103945044A (zh) * 2013-01-22 2014-07-23 中兴通讯股份有限公司 一种信息处理方法和移动终端
CN104462186A (zh) * 2014-10-17 2015-03-25 百度在线网络技术(北京)有限公司 一种语音搜索方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080153465A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Voice search-enabled mobile device
US20110145214A1 (en) * 2009-12-16 2011-06-16 Motorola, Inc. Voice web search
CN102591932A (zh) * 2011-12-23 2012-07-18 优视科技有限公司 语音搜索方法及***、移动终端、中转服务器
CN102629246A (zh) * 2012-02-10 2012-08-08 北京百纳信息技术有限公司 识别浏览器语音命令的服务器及浏览器语音命令识别方法
CN102968493A (zh) * 2012-11-27 2013-03-13 上海量明科技发展有限公司 通过输入法工具执行语音搜索的方法、客户端及***
CN104077105A (zh) * 2013-03-29 2014-10-01 联想(北京)有限公司 一种信息处理方法以及一种电子设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016058425A1 (zh) * 2014-10-17 2016-04-21 百度在线网络技术(北京)有限公司 一种语音搜索方法、装置、设备和计算机存储介质
CN105161106A (zh) * 2015-08-20 2015-12-16 深圳Tcl数字技术有限公司 智能终端的语音控制方法、装置及电视机***
CN106571144A (zh) * 2016-11-08 2017-04-19 广东小天才科技有限公司 一种基于语音识别的搜索方法及装置
CN108881507A (zh) * 2018-03-01 2018-11-23 赵建文 一种语音浏览器
CN108881507B (zh) * 2018-03-01 2021-08-31 赵建文 一种包括语音浏览器和区块链语音dns单元的***
CN108615527A (zh) * 2018-05-10 2018-10-02 腾讯科技(深圳)有限公司 基于同声传译的数据处理方法、装置和存储介质
CN110222266A (zh) * 2019-05-31 2019-09-10 江苏三六五网络股份有限公司 一种基于语音识别的房产专业语音搜索***及方法

Also Published As

Publication number Publication date
WO2016058425A1 (zh) 2016-04-21

Similar Documents

Publication Publication Date Title
CN104462186A (zh) 一种语音搜索方法及装置
US9251786B2 (en) Method, medium and apparatus for providing mobile voice web service
KR20180087456A (ko) 브라우징 액티비티에 기초하여 정합 애플리케이션을 식별하는 기법
CN101636735A (zh) 网站集成搜索的设备和方法
CN102880723A (zh) 一种识别用户检索意图的搜索方法和***
CN106663100B (zh) 多域查询补全
CN104899220A (zh) 应用程序推荐方法和***
CN102664925B (zh) 一种展现搜索结果的方法及装置
JP2008077227A (ja) リンク生成装置、ブラウザプログラム、リンク生成システム
US11526575B2 (en) Web browser with enhanced history classification
CN110990696B (zh) 搜索意图推荐的方法及装置
JP2008186452A (ja) 検索システム及び検索方法
EP3149616A1 (en) Federated search
CN102722501A (zh) 搜索引擎及其实现方法
US20170351706A1 (en) Method and system for matching images with content using whitelists and blacklists in response to a search query
CN104090887A (zh) 歌曲搜索方法及装置
CN107491465A (zh) 用于搜索内容的方法和装置以及数据处理***
CN105354318A (zh) 一种文件查找方法及装置
CN104142831A (zh) 应用程序搜索方法及装置
US10303747B2 (en) Method, apparatus and system for controlling address input
WO2017054716A1 (zh) 识别被劫持浏览器的方法及浏览器
CN104933099B (zh) 一种为用户提供目标搜索结果的方法与装置
CN105630987A (zh) 自适应用户代理的统一资源定位符前缀挖掘方法和装置
CN104704495B (zh) 一种信息搜索的方法以及装置
CN104731918A (zh) 一种语音搜索方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150325