CN110928999B - 目的地确定方法、装置、电子设备及存储介质 - Google Patents
目的地确定方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110928999B CN110928999B CN201911252473.XA CN201911252473A CN110928999B CN 110928999 B CN110928999 B CN 110928999B CN 201911252473 A CN201911252473 A CN 201911252473A CN 110928999 B CN110928999 B CN 110928999B
- Authority
- CN
- China
- Prior art keywords
- destination
- information
- candidate
- voice
- voice information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
- G01C21/3608—Destination input or retrieval using speech input, e.g. using speech recognition
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3626—Details of the output of route guidance instructions
- G01C21/3629—Guidance using speech or audio output, e.g. text-to-speech
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Automation & Control Theory (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Navigation (AREA)
Abstract
本公开提供了一种目的地确定方法、装置、电子设备及存储介质,属于计算机技术领域。该方法包括:获取输入的第一目的地关键词;获取所述第一目的地关键词对应的至少一个第一候选目的地;基于问答模型,生成包括所述至少一个第一候选目的地的第一语音信息,播放所述第一语音信息,无需用户查看该至少一个候选目的地,仅根据语音信息即可获知至少一个候选目的地,获取所述第一语音信息的第一回复信息,将所述第一回复信息指示的目的地确定为目标目的地,无需用户查看至少一个候选目的地后手动选择任一个候选目的地作为目标目的地,操作简便,耗费时间短,提高了效率。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种目的地确定方法、装置、电子设备及存储介质。
背景技术
随着人们生活水平的日益攀升,人们出行的方式也越来越多,当人们需要到达某一目的地时,通常需要根据目的地规划导航路线,因此终端如何快速确定用户的目的地成为亟需解决的问题。
相关技术中,用户输入目的地的关键词,终端接收该关键词,获取与该关键词匹配的至少一个候选目的地,显示该至少一个候选目的地,用户查看至少一个候选目的地,从该至少一个候选目的地中选中需要前往的目的地,终端将用户选中的目的地确定为用户需要前往的目的地。
但是,由于用户需要查看该至少一个候选目的地,操作繁琐,耗费时间长,效率低下。
发明内容
为克服相关技术中存在的问题,本公开提供一种目的地确定方法、装置、电子设备及存储介质,所述技术方案如下:
根据本公开实施例的第一方面,提供了一种目的地确定方法,所述方法包括:
获取输入的第一目的地关键词;
获取所述第一目的地关键词对应的至少一个第一候选目的地;
基于问答模型,生成包括所述至少一个第一候选目的地的第一语音信息,播放所述第一语音信息;
获取所述第一语音信息的第一回复信息,将所述第一回复信息指示的目的地确定为目标目的地。
在一种可能实现方式中,所述第一语音信息中包括多个第一候选目的地,所述将所述第一回复信息指示的目的地确定为目标目的地,包括:
当所述第一回复信息中包括所述多个第一候选目的地中的任一个第一候选目的地时,将所述第一回复信息中包括的候选目的地作为所述目标目的地。
在另一种可能实现方式中,所述第一语音信息中包括一个第一候选目的地,所述将所述第一回复信息指示的目的地确定为目标目的地,包括:
当所述第一回复信息中包括确认关键词时,确定所述第一候选目的地为所述目标目的地。
在另一种可能实现方式中,所述第一回复信息为文本信息;所述将所述第一回复信息指示的目的地确定为目标目的地,包括:
对所述第一回复信息进行分词处理,得到多个关键词;
确定与所述多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
在另一种可能实现方式中,所述第一回复信息为语音信息;所述将所述第一回复信息指示的目的地确定为目标目的地,包括:
对所述第一回复信息进行语音转换,得到所述第一回复信息对应的第一文本信息;
对所述第一文本信息进行分词处理,得到多个关键词;
确定与所述多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
在另一种可能实现方式中,所述基于问答模型,生成包括所述至少一个第一候选目的地的第一语音信息,包括:
将所述至少一个第一候选目的地输入至问答模型中,基于所述问答模型对所述至少一个第一候选目的地进行处理,得到用于询问是否去往所述至少一个第一候选目的地的语音信息,作为所述第一语音信息。
在另一种可能实现方式中,所述基于问答模型,生成包括所述至少一个第一候选目的地的第一语音信息,包括:
将所述至少一个第一候选目的地输入至问答模型中,基于所述问答模型对所述至少一个第一候选目的地进行处理,得到用于询问是否去往所述至少一个第一候选目的地的第二文本信息;
将所述第二文本信息转换为所述第一语音信息。
在另一种可能实现方式中,所述获取输入的第一目的地关键词,包括:
获取输入的第二语音信息;
将所述第二语音信息转换为第三文本信息;
对所述第三文本信息进行分词处理,得到至少一个关键词,识别所述至少一个关键词中的第一目的地关键词。
在另一种可能实现方式中,所述获取输入的第一目的地关键词,包括:
获取输入的第二语音信息;
获取所述第二语音信息与预设语音信息的相似度,所述预设语音信息为用于查询目的地的语音信息;
当所述相似度大于预设相似度时,获取所述第二语音信息中的第一目的地关键词。
在另一种可能实现方式中,所述获取所述第一目的地关键词对应的至少一个第一候选目的地,包括:
根据所述第一目的地关键词和预设对应关系,确定所述预设对应关系中,所述第一目的地关键词对应的至少一个第一候选目的地。
在另一种可能实现方式中,所述第一回复信息包括第二目的地关键词,所述将所述第一回复信息指示的目的地确定为目标目的地,包括:
获取所述第一回复信息中的第二目的地关键词;
获取所述第二目的地关键词对应的至少一个第二候选目的地;
基于所述问答模型,生成包括所述至少一个第二候选目的地的第二语音信息,播放所述第二语音信息;
获取所述第二语音信息的第二回复信息,将所述第二回复信息指示的目的地确定为目标目的地。
在另一种可能实现方式中,所述方法还包括:
根据当前位置及所述目标目的地,生成所述当前位置至所述目标目的地的导航路线。
根据本公开实施例的第二方面,提供了一种目的地确定装置,所述装置包括:
关键词获取模块,用于获取输入的第一目的地关键词;
目的地获取模块,用于获取所述第一目的地关键词对应的至少一个第一候选目的地;
语音信息生成模块,用于基于问答模型,生成包括所述至少一个第一候选目的地的第一语音信息,播放所述第一语音信息;
目的地确定模块,用于获取所述第一语音信息的第一回复信息,将所述第一回复信息指示的目的地确定为目标目的地。
在一种可能实现方式中,所述第一语音信息中包括多个第一候选目的地,所述目的地确定模块还用于当所述第一回复信息中包括所述多个第一候选目的地中的任一个第一候选目的地时,将所述第一回复信息中包括的候选目的地作为所述目标目的地。
在另一种可能实现方式中,所述第一语音信息中包括一个第一候选目的地,所述目的地确定模块还用于当所述第一回复信息中包括确认关键词时,确定所述第一候选目的地为所述目标目的地。
在另一种可能实现方式中,所述第一回复信息为文本信息;所述目的地确定模块,包括:
分词单元,用于对所述第一回复信息进行分词处理,得到多个关键词;
目的地确定单元,用于确定与所述多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
在另一种可能实现方式中,所述目的地确定模块,包括:
第一转换单元,用于对所述第一回复信息进行语音转换,得到所述第一回复信息对应的第一文本信息;
分词单元,用于对所述第一文本信息进行分词处理,得到多个关键词;
目的地确定单元,用于确定与所述多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
在另一种可能实现方式中,所述语音信息生成模块,还用于将所述至少一个第一候选目的地输入至问答模型中,基于所述问答模型对所述至少一个第一候选目的地进行处理,得到用于询问是否去往所述至少一个第一候选目的地的语音信息,作为所述第一语音信息。
在另一种可能实现方式中,所述语音信息生成模块,还用于将所述至少一个第一候选目的地输入至问答模型中,基于所述问答模型对所述至少一个第一候选目的地进行处理,得到用于询问是否去往所述至少一个第一候选目的地的第二文本信息;
所述语音信息生成模块,包括:
第二转换单元,用于将所述第二文本信息转换为所述第一语音信息。
在另一种可能实现方式中,所述关键词获取模块,包括:
信息获取单元,用于获取输入的第二语音信息;
第三转换单元,用于将所述第二语音信息转换为第三文本信息;
识别单元,用于对所述第三文本信息进行分词处理,得到至少一个关键词,识别所述至少一个关键词中的第一目的地关键词。
在另一种可能实现方式中,所述关键词获取模块,包括:
信息获取单元,用于获取输入的第二语音信息;
相似度获取单元,用于获取所述第二语音信息与预设语音信息的相似度,所述预设语音信息为用于查询目的地的语音信息;
第一关键词获取单元,用于当所述相似度大于预设相似度时,获取所述第二语音信息中的第一目的地关键词。
在另一种可能实现方式中,所述目的地获取模块,还用于根据所述第一目的地关键词和预设对应关系,确定所述预设对应关系中,所述第一目的地关键词对应的至少一个第一候选目的地。
在另一种可能实现方式中,所述第一回复信息包括第二目的地关键词,所述目的地确定模块,包括:
第二关键词获取单元,用于获取所述第一回复信息中的第二目的地关键词;
目的地获取单元,用于获取所述第二目的地关键词对应的至少一个第二候选目的地;
生成单元,用于基于所述问答模型,生成包括所述至少一个第二候选目的地的第二语音信息,播放所述第二语音信息;
目的地确定单元,用于获取所述第二语音信息的第二回复信息,将所述第二回复信息指示的目的地确定为目标目的地。
在另一种可能实现方式中,所述装置还包括:
路线生成模块,用于根据当前位置及所述目标目的地,生成所述当前位置至所述目标目的地的导航路线。
根据本公开实施例的第三方面,提供了一种目的地确定装置,所述装置包括:
一个或多个处理器;
用于存储所述一个或多个处理器可执行指令的易失性或非易失性存储器;
其中,所述一个或多个处理器被配置为执行如第一方面所述的目的地确定方法中所执行的操作。
根据本公开实施例提供的第四方面,所述计算机可读存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如第一方面所述的目的地确定方法中所执行的操作。
本公开实施例提供的技术方案带来的有益效果至少包括:
本公开实施例提供的目的地确定方法、装置、电子设备及存储介质,获取第一目的地关键词,再获取该第一目的地关键词对应的至少一个第一候选目的地,基于问答模型,生成包括该至少一个第一候选目的地的第一语音信息,播放该第一语音信息,无需用户查看该至少一个候选目的地,仅根据语音信息即可获知至少一个候选目的地,用户再向终端回复第一回复消息,终端即可获取该第一语音信息的第一回复信息,将该第一回复信息指示的目的地确定为目标目的地,无需用户查看至少一个候选目的地后手动选择任一个候选目的地作为目标目的地,操作简便,耗费时间短,提高了效率。
并且,当确定该第二语音信息为用于查询目的地的语音信息时,再根据该第二语音信息确定目标目的地,防止第二语音信息不是用于查询目的地的语音信息时仍执行后续过程,耗费时间短,更加智能化。
并且,用户和终端均采用语音的方式进行交互,无需用户查看至少一个候选目的地,提高了用户和终端之间的智能化交互。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种实施环境的示意图;
图2是根据一示例性实施例示出的一种目的地确定方法的流程图;
图3是根据一示例性实施例示出的一种目的地确定方法的流程图;
图4是根据一示例性实施例示出的一种确定目的地的过程示意图;
图5是根据一示例性实施例示出的一种确定目的地的过程示意图;
图6是根据一示例性实施例示出的一种目的地确定装置的结构示意图;
图7是根据一示例性实施例示出的另一种目的地确定装置的结构示意图;
图8是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
本公开实施例提供的方法,获取输入的第一目的地关键词,再获取该第一目的地关键词对应的至少一个第一候选目的地,基于问答模型,生成包括该至少一个候选目的地的第一语音信息,播放该第一语音信息,获取该第一语音信息的第一回复信息,将该第一回复信息指示的目的地确定为目标目的地。
本公开实施例提供的方法,可以应用于导航的场景中,当终端接收到用户输入的目的地关键词时,采用本公开实施例提供的方法,即可确定与该目的地关键词对应的目标目的地,再确定当前位置到目标目的地的导航路线,或者,仅根据目的地关键词确定目标目的地,播报该目标目的地即可。
或者,本公开实施例提供的方法,可以应用于汽车配置的车载终端中,当用户在驾驶汽车时,如果需要导航至某一目的地,则采用本公开实施例提供的方法,基于用户的语音信息和车载终端反馈的语音信息,确定目标目的地,生成当前位置至目标目的地的导航路线。用户和车载终端之间仅通过语音信息即可进行交互,确定目标目的地,无需用户再查看该车载终端显示的候选目的地,简化了操作,提高了效率,且保证了用户驾驶汽车的安全性,防止用户在驾驶汽车时查看车载终端的显示屏幕而发生意外。
本公开实施例提供的方法,可以由终端执行,或者也可以由服务器执行。
在一种可能实现方式中,如图1所示,当本公开实施例提供的方法由服务器执行时,服务器101与终端102通过通信网络连接,终端102接收输入的信息,将该信息发送给服务器101,服务器101根据接收的信息,确定目标目的地,将该目标目的地发送给终端102,由终端102进行播报。
其中,该终端可以为手机、平板电脑、个人计算机、智能音箱等,该服务器可以为一台服务器,或者由若干服务器组成的服务器集群,或者是一个云计算服务中心。
图2是根据一示例性实施例示出的一种目的地确定方法的流程图,参见图2,应用于终端中,该方法包括:
在步骤201中,获取输入的第一目的地关键词;
在步骤202中,获取第一目的地关键词对应的至少一个第一候选目的地;
在步骤203中,基于问答模型,生成包括至少一个第一候选目的地的第一语音信息,播放第一语音信息;
在步骤204中,获取第一语音信息的第一回复信息,将第一回复信息指示的目的地确定为目标目的地。
本公开实施例提供的方法,获取第一目的地关键词,再获取该第一目的地关键词对应的至少一个第一候选目的地。基于问答模型,生成包括该至少一个第一候选目的地的第一语音信息,播放该第一语音信息,无需用户查看该至少一个候选目的地,仅根据语音信息即可获知至少一个候选目的地。用户再向终端回复第一回复消息,终端即可获取该第一语音信息的第一回复信息,将该第一回复信息指示的目的地确定为目标目的地。无需用户查看至少一个候选目的地后手动选择任一个候选目的地作为目标目的地,操作简便,耗费时间短,提高了效率。
在一种可能实现方式中,第一语音信息中包括多个第一候选目的地,将第一回复信息指示的目的地确定为目标目的地,包括:当第一回复信息中包括多个第一候选目的地中的任一个第一候选目的地时,将第一回复信息中包括的候选目的地作为目标目的地。例如,第一回复信息中包括候选目的地A、B、C中的目的地C,则将目的地C作为目标目的地,避免了用户手动选择带来的注意力分散的问题。
在另一种可能实现方式中,第一语音信息中包括一个第一候选目的地,将第一回复信息指示的目的地确定为目标目的地,包括:当第一回复信息中包括确认关键词时,确定第一候选目的地为目标目的地。
在另一种可能实现方式中,第一回复信息为文本信息;将第一回复信息指示的目的地确定为目标目的地,包括:对第一回复信息进行分词处理,得到多个关键词;确定与多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
在另一种可能实现方式中,第一回复信息为语音信息;将第一回复信息指示的目的地确定为目标目的地,包括:对第一回复信息进行语音转换,得到第一回复信息对应的第一文本信息;对第一文本信息进行分词处理,得到多个关键词;确定与多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
在另一种可能实现方式中,基于问答模型,生成包括至少一个第一候选目的地的第一语音信息,包括:将至少一个第一候选目的地输入至问答模型中,基于问答模型对至少一个第一候选目的地进行处理,得到用于询问是否去往至少一个第一候选目的地的语音信息,作为第一语音信息。
在另一种可能实现方式中,基于问答模型,生成包括至少一个第一候选目的地的第一语音信息,包括:将至少一个第一候选目的地输入至问答模型中,基于问答模型对至少一个第一候选目的地进行处理,得到用于询问是否去往至少一个第一候选目的地的第二文本信息;将第二文本信息转换为第一语音信息。
在另一种可能实现方式中,获取输入的第一目的地关键词,包括:
获取输入的第二语音信息;将第二语音信息转换为第三文本信息;对第三文本信息进行分词处理,得到至少一个关键词,识别至少一个关键词中的第一目的地关键词。
在另一种可能实现方式中,获取输入的第一目的地关键词,包括:
获取输入的第二语音信息;获取第二语音信息与预设语音信息的相似度,预设语音信息为用于查询目的地的语音信息;当相似度大于预设相似度时,获取第二语音信息中的第一目的地关键词。
在另一种可能实现方式中,获取第一目的地关键词对应的至少一个第一候选目的地,包括:
根据第一目的地关键词和预设对应关系,确定预设对应关系中,第一目的地关键词对应的至少一个第一候选目的地。
在另一种可能实现方式中,第一回复信息包括第二目的地关键词,将第一回复信息指示的目的地确定为目标目的地,包括:
获取第一回复信息中的第二目的地关键词;获取第二目的地关键词对应的至少一个第二候选目的地;基于问答模型,生成包括至少一个第二候选目的地的第二语音信息,播放第二语音信息;获取第二语音信息的第二回复信息,将第二回复信息指示的目的地确定为目标目的地。
通过该步骤,如果终端生成的语音信息中没有用户想要的目的地,则用户继续说出包含目的地的回复信息,终端继续根据回复信息查找候选目的地,直到确定目标目的地。
在另一种可能实现方式中,方法还包括:根据当前位置及目标目的地,生成当前位置至目标目的地的导航路线。
图3是根据一示例性实施例示出的一种目的地确定方法的流程图,应用于终端中,参见图3,该方法包括:
在步骤301中,获取输入的第二语音信息。
用户说出语音信息,终端即可检测到用户说出的语音信息,从而获取到了用户输入的第二语音信息。
在一种可能实现方式中,终端设置有开关按钮,当用户触发该开关按钮时,终端进入检测语音信息的状态,获取用户输入的第二语音信息。
该第二语音信息可以为询问天气类的信息、查询目的地类的信息、拨打电话号码类的信息、或者为其他类型的信息。
例如,当该第二语音信息为“查询去图书馆的路线”时,则该第二语音信息属于查询目的地类的信息,当该第二语音信息为“今天会下雨吗?”时,则该第二语音信息属于询问天气类的信息。
在步骤302中,获取该第二语音信息与预设语音信息的相似度。
其中,该预设语音信息为用于查询目的地的语音信息,也即是属于查询目的地类的信息。
获取第二语音信息与预设语音信息的相似度,该第二语音信息与预设语音信息的相似度越大,表示该第二语音信息与预设语音信息越相似,该第二语音信息属于查询目的地类的语音信息的概率越大,而当该第二语音信息与预设语音信息的相似度越小,表示该第二语音信息与预设语音信息越不相似,该第二语音信息属于查询目的地类的语音信息的概率越小。
在一种可能实现方式中,获取该第二语音信息的第一特征向量以及该预设语音信息的第二特征向量,获取该第一特征向量和该第二特征向量的相似度,将该第一特征向量和该第二特征向量的相似度作为第二语音信息与该预设语音信息的相似度。
其中,该相似度可以为余弦相似度、欧式距离、马氏距离或者其他用于表示相似度的数值。
在一种可能实现方式中,该预设语音信息存储在终端中,终端直接使用该预设语音信息即可。或者,该预设语音信息存储在服务器中,当终端需要获取第二语音信息与预设语音信息的相似度时,向服务器发送语音信息获取指令,当服务器接收到该语音信息获取指令时,将存储的预设语音信息发送给终端,再由终端获取该第二语音信息与预设语音信息的相似度。
在步骤303中,当相似度大于预设相似度时,获取第二语音信息中的第一目的地关键词。
获取到第二语音信息和预设语音信息的相似度后,判断该相似度是否大于预设相似度,当该相似度大于预设相似度时,表示该第二语音信息是查询目的地类的语音信息,即可从该第二语音信息中获取第一目的地关键词,而当该相似度不大于预设相似度时,表示该第二语音信息不是查询目的地的语音信息。
在一种可能实现方式中,将该第二语音信息和该预设语音信息均转换为文本信息后,根据该第二语音信息的文本信息和该预设语音信息的文本信息,确定该第二语音信息和该预设语音信息的相似度。
其中,该预设相似度可以由开发人员设置,也可以由终端设置。该预设相似度可以为60%、70%、80%或者其他数值。
在一种可能实现方式中,当确定第二语音信息和预设语音信息的相似度大于预设相似度后,将该第二语音信息转换为文本信息,对该文本信息进行分词处理,得到多个关键词,当该多个关键词中任一个关键词为预设数据库中已存储的目的地关键词时,将该关键词确定为第一目的地关键词。
其中,该预设数据库中存储有多个目的地关键词。该预设数据库可以存储在服务器中,也可以存储在终端中。
另外,终端中还可以存储有用户预先录制的预设语音信息,则终端还可以获取该第二语音信息的声纹特征和该预设语音信息的声纹特征之间的相似度,判断该相似度是否大于预设声纹相似度,当获取的相似度大于预设声纹相似度时,表示该第二语音信息和预设语音信息是由相同的用户发出的语音信息,也即是可以确定该第二语音信息是该用户发出的语音信息,则终端可以继续根据该第二语音信息执行后续操作。
通过判断该第二语音信息是否与预设语音信息一致,可以确定发出该第二语音信息的用户是否与发出预设语音信息的用户一致,当确定第二语音信息的声纹特征和预设语音信息的声纹特征相同时,才执行后续过程,可以保证其他用户无法使用该终端,提高了安全性。
需要说明的是,本公开实施例仅是以执行步骤301-303以获取第一目的地关键词为例进行说明。在另一实施例中,还可以不执行步骤301-303,获取输入的第二语音信息,将第二语音信息转换为第三文本信息,对第三文本信息进行分词处理,得到至少一个关键词,识别至少一个关键词中的第一目的地关键词。
其中,对文本信息进行分词处理时,可以采用结巴分词、HanLP(一种汉语言处理包),或者采用其他方式进行分词处理。
并且,识别第一目的地关键词的过程与上述实施例中确定第一目的地关键词的过程类似,在此不再赘述。
在另一实施例中,终端获取输入的文本信息,则直接对该文本信息进行分词,得到至少一个关键词,识别至少一个关键词中的第一目的地关键词即可。
终端当前显示查询目的地的界面,用户可以在该界面中直接输入文本信息,则终端可以获取输入的文本信息,且可以认为获取到的输入的文本信息为查询目的地类的信息,此时直接识别文本信息中的第一目的地关键词即可,无需再判断获取的文本信息是否为查询目的地类的信息。
在步骤304中,获取第一目的地关键词对应的至少一个第一候选目的地。
查询与该第一目的地关键词对应的至少一个目的地,作为第一候选目的地。
在一种可能实现方式中,根据第一目的地关键词和预设对应关系,确定预设对应关系中,第一目的地关键词对应的至少一个第一候选目的地。
其中,该预设对应关系包括目的地关键词和目的地的对应关系。
例如,该预设对应关系如下述表1所示:
表1
当获取的第一目的地关键词为AA学校时,根据该预设对应关系,即可确定该AA学校对应的至少一个第一候选目的地为AA学校北门、AA学校食堂以及AA学校南门。
该预设对应关系可以存储在终端中,或者,该预设对应关系可以存储在服务器中,终端向服务器发送关系获取请求,当服务器接收到该关系获取请求时,向终端发送该预设对应关系,终端即可接收该预设对应关系。
在步骤305中,基于问答模型,生成包括至少一个第一候选目的地的第一语音信息,播放第一语音信息。
其中,该问答模型用于根据该至少一个第一候选目的地,生成该综合该至少一个第一候选目的地的语音信息。该问答模型可以为神经网络模型、卷积神经网络模型,或者为其他类型的模型等。
该问答模型可以由终端训练,将训练好的问答模型存储。或者,该问答模型可以由训练装置训练,再将训练好的问答模型发送给终端,由终端存储。
在一种可能实现方式中,获取样本目的地关键词以及该样本目的地关键词对应的多个样本目的地,根据该样本目的地关键词和该多个样本目的地进行训练,得到训练后的问答模型。
当获取到第一目的地关键词对应的至少一个第一候选目的地后,将该至少一个第一候选目的地输入至问答模型中,基于该问答模型,即可生成该至少一个第一候选目的地的第一语音信息。再播放该第一语音信息,用户即可根据该第一语音信息获知第一目的地关键词对应的至少一个第一候选目的地。
例如,当第一目的地关键词为AA学校时,确定的至少一个第一候选目的地分别为AA学校北门、AA学校食堂以及AA学校南门,则基于该问答模型,生成的第一语音信息为“是要去AA学校的北门还是南门,还是要去学校食堂?”。
或者,当第一目的地关键词为BB公司时,确定的第一候选目的地仅为BB公司办公楼,则基于该问答模型,生成的第一语音信息为“是否要去BB公司的办公楼?”。
在一种可能实现方式中,将至少一个第一候选目的地输入至问答模型中,基于问答模型对至少一个第一候选目的地进行处理,得到用于询问是否去往至少一个第一候选目的地的语音信息,作为第一语音信息。第一语音信息中即可包括该至少一个第一候选目的地,用户通过该第一语音信息即可获知至少一个第一候选目的地,提高了交互效率。
例如,当第一目的地关键词为AA学校时,确定的至少一个第一候选目的地分别为AA学校北门、AA学校食堂以及AA学校南门,则基于该问答模型,生成的第一语音信息为“是要去AA学校的北门还是南门,还是要去学校食堂?”。
在另一种可能实现方式中,将至少一个第一候选目的地输入至问答模型中,基于问答模型对至少一个第一候选目的地进行处理,得到用于询问是否去往至少一个第一候选目的地的第二文本信息,将第二文本信息转换为第一语音信息。之后即可播放该第一语音信息。
需要说明的是,本公开实施例仅是以根据获取的至少一个第一候选目的地确定第一语音信息为例进行说明。
在另一实施例中,当第一候选目的地为多个时,先获取该多个第一候选目的地与第一目的地关键词之间的相似度,根据每个第一候选目的地与第一目的地关键词之间的相似度,选取相似度较高的至少一个第一候选目的地,再基于问答模型,生成该至少一个第一候选目的地的语音信息,作为第一语音信息。通过对得到的多个第一候选目的地进行筛选,将与第一目的地关键词相似度较低的第一候选目的地排除,从而减少第一候选目的地的数量,减少问答模型处理数据的数据量,进而减少第一语音信息中携带的候选目的地的数量,提高生成语音信息的效率。
在一种可能实现方式中,按照每个第一候选目的地与第一目的地关键词之间的相似度,对该多个第一候选目的地进行排序,再按照该多个第一候选目的地的排列顺序,选取预设数量的候选目的地。
其中,该预设数量可以由终端设置,或者由开发人员设置。该预设数量可以为1、2、3或者其他数值。
在另一种可能实现方式中,按照每个第一候选目的地与第一目的地关键词之间的相似度,选取相似度大于预设相似度的第一候选目的地,再基于问答模型,生成选取的第一候选目的地的语音信息,作为第一语音信息。
其中,该预设相似度可以由终端设置,或者由开发人员设置。该预设相似度可以为0.7、0.75、0.8或者其他数值。
在另一实施例中,当第一候选目的地为多个时,终端将该多个第一候选目的地播报给用户,则用户即可从多个候选目的地中选取任一个候选目的地作为目标目的地,当用户选取任一个候选目的地后,即可在该候选目的地之前统计的历史出现次数的基础上加1,采用上述方式即可更新每个候选目的地的历史出现次数,且统计过程针对的用户可以为任一个用户,每个用户对候选目的地的操作均计入对应的候选目的地的历史出现次数中。
获取该多个第一候选目的地的历史出现次数,根据每个第一候选目的地的历史出现次数,选取历史出现次数较大的至少一个第一候选目的地,再基于问答模型,生成该至少一个第一候选目的地的语音信息,作为第一语音信息。
在一种可能实现方式中,按照每个第一候选目的地的历史出现次数,对该多个第一候选目的地进行排序,再按照该多个第一候选目的地的排列顺序,选取预设数量的候选目的地。
其中,该预设数量可以由终端设置,或者由开发人员设置。该预设数量可以为1、2、3或者其他数值。
在另一种可能实现方式中,选取历史出现次数大于预设出现次数的第一候选目的地,再基于问答模型,生成选取的第一候选目的地的语音信息,作为第一语音信息。
其中,该预设出现次数可以由终端设置,或者由开发人员设置。该预设出现次数可以为1万、3万或者其他数值。
另外,随着时间的推移,每个候选目的地的历史出现次数都会随着用户对该候选目的地的选中操作的增多而增加,因此,当经过足够长的时间后,根据预设出现次数对候选目的地进行筛选时,每个候选目的地的历史出现次数均大于预设出现次数,则无法对候选目的地进行筛选。因此,随着时间的推移,需要将预设出现次数也提高,以使多个候选目的地中存在历史出现次数小于预设出现次数的候选目的地,能够实现对候选目的地的筛选。或者,划分出预设时间段,每隔该预设时间段统计一次每个第一候选目的地在该预设时间段内的历史出现次数,再根据每个第一候选目的地的历史出现次数进行筛选。
在步骤306中,获取第一语音信息的第一回复信息,将第一回复信息指示的目的地确定为目标目的地。
其中,该第一回复信息为用户根据第一语音信息,向终端回复的关于目的地的信息,且该第一回复信息中携带用户用于指示目的地的信息,因此,当终端获取该第一语音信息的第一回复信息后,即可获取该第一回复信息指示的目的地,将该目的地确定为目标目的地即可。
在一种可能实现方式中,第一语音信息中包括多个第一候选目的地,当第一回复信息中包括多个第一候选目的地中的任一个第一候选目的地时,将第一回复信息中包括的候选目的地作为目标目的地。
由于该第一语音信息中包括多个第一候选目的地,终端播放该多个第一候选目的地的第一语音信息后,后续等待接收用户反馈的回复信息,根据用户反馈的回复信息,确定目标目的地。因此,当终端接收到该第一语音信息的第一回复信息后,识别该第一回复信息,当该第一回复信息中包括该多个第一候选目的地中的任一个第一候选目的地时,将该第一回复信息中包括的候选目的地作目标目的地。
例如,当该第一语音信息为“是要去AA学校的北门还是南门,还是要去学校食堂?”时,获取的第一回复信息中包括“北门”时,则将AA学校的北门作为目标目的地。
又例如,第一回复信息中包括候选目的地A、B、C中的目的地C,则将目的地C作为目标目的地。
在另一种可能实现方式中,第一语音信息中包括一个第一候选目的地,当第一回复信息中包括确认关键词时,确定第一候选目的地为目标目的地。
本申请实施例通过确定第一回复信息中包括的第一候选目的地,避免了用户手动选择带来的注意力分散的问题。
由于第一语音信息中仅包括一个第一候选目的地,则终端等待是否要去该第一候选目的地的确认关键词即可,当接收到的第一回复信息中包括确认关键词时,确定该第一候选目的地为目标目的地。
例如,当该第一语音信息为“是否要去BB公司的办公楼?”时,获取的第一回复信息为“是,我要去”,则将BB公司的办公楼确定为目标目的地,或者,当获取的第一回复信息为“对”,同样是接收到了确认关键词,将BB公司的办公楼确定为目标目的地。
需要说明的是,该第一回复信息可以为文本信息,也可以为语音信息,当该第一回复信息的类型不同时,根据该第一回复信息确定指示的目标目的地的方式也不同。
在一种可能实现方式中,第一回复信息为文本信息,则根据该第一回复信息确定目标目的地时,对第一回复信息进行分词处理,得到多个关键词,确定与多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
由于该第一回复信息为文本信息,因此,可以直接对该第一回复信息进行分词处理,得到多个关键词,再获取该多个关键词中每个关键词的特征向量,再确定与该多个关键词的特征向量匹配的目的地特征向量,该目的地特征向量对应有目的地,因此将该目的地特征向量所属的目的地作为目标目的地即可。
在另一种可能实现方式中,第一回复信息为语音信息;对第一回复信息进行语音转换,得到第一回复信息对应的第一文本信息,对第一文本信息进行分词处理,得到多个关键词,确定与多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
由于该第一回复信息为语音信息,因此,当获取到该第一回复信息后,先将该第一回复信息进行转换,得到该第一回复信息对应的第一文本信息,再对该第一回复信息进行分词处理,得到多个关键词,获取该多个关键词中每个关键词的特征向量,再确定与该多个关键词的特征向量匹配的目的地特征向量,因此将该目的地特征向量所属的目的地作为目标目的地即可。
在步骤307中,根据当前位置及目标目的地,生成当前位置至目标目的地的导航路线。
终端根据上述步骤即可确定出目标目的地后,即可根据该目标目的地,以及终端当前的位置,生成当前位置至目标目的地的导航路线,后续用户根据终端的导航路线,即可到达目标目的地。
在一种可能实现方式中,根据当前位置及目标目的地,生成的导航路线仅为一条时,直接将该导航路线确定为目标导航路线即可。
在另一种可能实现方式中,根据当前位置及目标目的地,生成的导航路线包括多条,则播放该多条导航路线中每条导航路线的特征,用户根据每条导航路线的特征,说出包括任一条导航路线的特征的语音信息,当终端获取到用户的语音信息时,识别该语音信息中包括的特征对应的导航路线,将该导航路线确定为目标导航路线。
例如,终端生成了3条导航路线,其中,第1条导航路线在3条导航路线中时长最少,第2条导航路线在3条导航路线中路程最短,第3条导航路线在3条导航路线中红绿灯数量最少,当终端获取用户的语音信息为“选择路程最短的路线”时,则终端将第2条导航路线作为目标导航路线。
在本公开实施例中,步骤307为可选步骤。在另一实施例中,还可以不执行步骤307,终端确定第一目的地关键词对应的目标目的地后,播报该目标目的地即可。
本公开实施例仅是以第一回复信息中包括指示至少一个候选目的地的信息为例进行说明。在另一实施例中,当第一回复信息中包括第二目的地关键词时,获取该第一回复信息中的第二目的地关键词,再获取该第二目的地关键词对应的至少一个第二候选目的地,基于问答模型,生成包括至少一个第二候选目的地的第二语音信息,播放该第二语音信息,获取该第二语音信息的第二回复信息,将第二回复信息指示的目的地确定为目标目的地。
通过采用上述方式,当向用户推送的第一回复信息中没有用户所需要的目的地时,则用户可以继续说出包括另一目的地关键词的第二语音信息,终端根据该第二语音信息再次获取多个候选目的地,直至用户从多个候选目的地中确定目标目的地的位置。
其中,根据第二回复信息确定目标目的地的过程与根据第一回复信息确定目标目的地的过程类似,在此不再赘述。
在一种可能实现方式中,终端中包括四个子***,分别为语音识别子***、文本转语音子***、导航子***、对话子***。该语音识别子***用于将语音信息转换为文本信息,该文本转语音子***用于将文本信息转换为语音信息,该导航子***用于查询目的地关键词对应的候选目的地,该对话子***用于基于问答模型,生成语音信息。
则用户与终端进行交互,确定目标目的地的过程如图4和图5所示。
如图4所示,用户发出携带目的地关键词的语音信息,语音识别子***将语音信息转换为文本信息,导航子***根据文本信息检测目的地关键词对应的至少一个候选目的地,对话子***根据该至少一个候选目的地,生成用于询问是否去往候选目的地的提示性问句,文本转语音子***将该询问问句转换为语音信息,播放该语音信息,当满足用户需求时,则确定目标目的地,而当不满足用户需求时,继续执行上述过程,进一步判断候选目的地,直至满足用户需求时,确定目标目的地。
如图5所示,对话子***的处理过程为:对第一语音信息进行语义理解,通过问答模型与存储候选目的地的知识库进行交互,生成用于进行对话的语音信息,当用户发出的语音信息中包括目标目的地时,即满足用户的要求,则对话子***确定该目标目的地,而当用户发出的语音信息中包括目标目的地时,即不满足用户的要求,对话子***继续对第二语音信息进行语义理解,直至确定目标目的地为止。
本公开实施例仅是以终端为执行主体为例进行说明。在另一实施例中,执行主体还可以为服务器,且以服务器为执行主体执行的步骤与上述实施例类似,在此不再赘述。
本公开实施例提供的方法,获取第一目的地关键词,再获取该第一目的地关键词对应的至少一个第一候选目的地,基于问答模型,生成包括该至少一个第一候选目的地的第一语音信息,播放该第一语音信息,无需用户查看该至少一个候选目的地,仅根据语音信息即可获知至少一个候选目的地,用户再向终端回复第一回复消息,终端即可获取该第一语音信息的第一回复信息,将该第一回复信息指示的目的地确定为目标目的地,无需用户查看至少一个候选目的地后手动选择任一个候选目的地作为目标目的地,操作简便,耗费时间短,提高了效率。
并且,当确定该第二语音信息为用于查询目的地的语音信息时,再根据该第二语音信息确定目标目的地,防止第二语音信息不是用于查询目的地的语音信息时仍执行后续过程,耗费时间短,更加智能化。
并且,用户和终端均采用语音的方式进行交互,无需用户查看至少一个候选目的地,提高了用户和终端之间的智能化交互。
图6是根据一示例性实施例示出的一种目的地确定装置的结构示意图。参见图6,该装置包括:
关键词获取模块601,用于获取输入的第一目的地关键词。
目的地获取模块602,用于获取第一目的地关键词对应的至少一个第一候选目的地。
语音信息生成模块603,用于基于问答模型,生成包括至少一个第一候选目的地的第一语音信息,播放第一语音信息。
目的地确定模块604,用于获取第一语音信息的第一回复信息,将第一回复信息指示的目的地确定为目标目的地。
本公开实施例提供的装置,获取第一目的地关键词,再获取该第一目的地关键词对应的至少一个第一候选目的地,基于问答模型,生成包括该至少一个第一候选目的地的第一语音信息,播放该第一语音信息,无需用户查看该至少一个候选目的地,仅根据语音信息即可获知至少一个候选目的地,用户再向终端回复第一回复消息,终端即可获取该第一语音信息的第一回复信息,将该第一回复信息指示的目的地确定为目标目的地,无需用户查看至少一个候选目的地后手动选择任一个候选目的地作为目标目的地,操作简便,耗费时间短,提高了效率。
在一种可能实现方式中,第一语音信息中包括多个第一候选目的地,目的地确定模块604还用于当第一回复信息中包括多个第一候选目的地中的任一个第一候选目的地时,将第一回复信息中包括的候选目的地作为目标目的地。
在另一种可能实现方式中,第一语音信息中包括一个第一候选目的地,目的地确定模块604还用于当第一回复信息中包括确认关键词时,确定第一候选目的地为目标目的地。
在另一种可能实现方式中,第一回复信息为文本信息;参见图7,目的地确定模块604,包括:
分词单元6041,用于对第一回复信息进行分词处理,得到多个关键词;
目的地确定单元6042,用于确定与多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
在另一种可能实现方式中,参见图7,目的地确定模块604,包括:
第一转换单元6043,用于对第一回复信息进行语音转换,得到第一回复信息对应的第一文本信息;
分词单元6041,用于对第一文本信息进行分词处理,得到多个关键词;
目的地确定单元6042,用于确定与多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
在另一种可能实现方式中,语音信息生成模块603,还用于将至少一个第一候选目的地输入至问答模型中,基于问答模型对至少一个第一候选目的地进行处理,得到用于询问是否去往至少一个第一候选目的地的语音信息,作为第一语音信息。
在另一种可能实现方式中,语音信息生成模块603,还用于将至少一个第一候选目的地输入至问答模型中,基于问答模型对至少一个第一候选目的地进行处理,得到用于询问是否去往至少一个第一候选目的地的第二文本信息;
参见图7,语音信息生成模块603,包括:
第二转换单元6031,用于将第二文本信息转换为第一语音信息。
在另一种可能实现方式中,参见图7,关键词获取模块601,包括:
信息获取单元6011,用于获取输入的第二语音信息;
第三转换单元6012,用于将第二语音信息转换为第三文本信息;
识别单元6013,用于对第三文本信息进行分词处理,得到至少一个关键词,识别至少一个关键词中的第一目的地关键词。
在另一种可能实现方式中,参见图7,关键词获取模块601,包括:
信息获取单元6011,用于获取输入的第二语音信息;
相似度获取单元6014,用于获取第二语音信息与预设语音信息的相似度,预设语音信息为用于查询目的地的语音信息;
第一关键词获取单元6015,用于当相似度大于预设相似度时,获取第二语音信息中的第一目的地关键词。
在另一种可能实现方式中,目的地获取模块602,还用于根据第一目的地关键词和预设对应关系,确定预设对应关系中,第一目的地关键词对应的至少一个第一候选目的地。
在另一种可能实现方式中,第一回复信息包括第二目的地关键词,参见图7,目的地确定模块604,包括:
第二关键词获取单元6044,用于获取第一回复信息中的第二目的地关键词;
目的地获取单元6045,用于获取第二目的地关键词对应的至少一个第二候选目的地;
生成单元6046,用于基于问答模型,生成包括至少一个第二候选目的地的第二语音信息,播放第二语音信息;
目的地确定单元6042,用于获取第二语音信息的第二回复信息,将第二回复信息指示的目的地确定为目标目的地。
在另一种可能实现方式中,参见图7,装置还包括:
路线生成模块605,用于根据当前位置及目标目的地,生成当前位置至目标目的地的导航路线。
需要说明的是:上述实施例提供的目的地确定装置在执行操作时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将电子设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的目的地确定装置与目的地确定方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图8是根据一示例性实施例示出的一种电子设备的框图。例如,电子设备800可以是移动电话,计算机,数字广播装置,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图8,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理***,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如Wi-Fi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,通信组件816还包括近场通信(NFC)模块,以促进短程通信。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述目的地确定方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由电子设备800的处理器820执行以完成上述方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令,指令由处理器加载并执行以实现上述实施例的资源转移方法中所执行的操作。
本公开实施例还提供了一种计算机程序产品,该计算机程序产品中存储有至少一条指令,指令由处理器加载并执行以实现上述实施例的资源转移方法中所执行的操作。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (18)
1.一种目的地确定方法,其特征在于,所述方法包括:
获取输入的第二语音信息;
获取所述第二语音信息的声纹特征和预设语音信息的声纹特征之间的相似度,获取所述第二语音信息与预设语音信息之间的相似度,所述预设语音信息为用于查询目的地的语音信息;
当获取的所述第二语音信息的声纹特征和预设语音信息的声纹特征之间的相似度大于预设声纹相似度,且所述第二语音信息与预设语音信息之间的相似度大于预设相似度时,获取所述第二语音信息中的第一目的地关键词;
获取所述第一目的地关键词对应的至少一个第一候选目的地;
基于问答模型,生成包括所述至少一个第一候选目的地的第一语音信息,播放所述第一语音信息;
获取所述第一语音信息的第一回复信息以及所述第一回复信息中的第二目的地关键词;
获取所述第二目的地关键词对应的至少一个第二候选目的地;基于所述问答模型,生成包括所述至少一个第二候选目的地的第三语音信息,播放所述第三语音信息;获取所述第三语音信息的第二回复信息,将所述第二回复信息指示的目的地确定为目标目的地。
2.根据权利要求1所述的方法,其特征在于,所述第一语音信息中包括多个第一候选目的地,所述方法还包括:
当所述第一回复信息中包括所述多个第一候选目的地中的任一个第一候选目的地时,将所述第一回复信息中包括的候选目的地作为所述目标目的地。
3.根据权利要求1所述的方法,其特征在于,所述第一语音信息中包括一个第一候选目的地,所述方法还包括:
当所述第一回复信息中包括确认关键词时,确定所述第一候选目的地为所述目标目的地。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述第一回复信息为文本信息;所述方法还包括:
对所述第一回复信息进行分词处理,得到多个关键词;
确定与所述多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述第一回复信息为语音信息;所述方法还包括:
对所述第一回复信息进行语音转换,得到所述第一回复信息对应的第一文本信息;
对所述第一文本信息进行分词处理,得到多个关键词;
确定与所述多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
6.根据权利要求1所述的方法,其特征在于,所述基于问答模型,生成包括所述至少一个第一候选目的地的第一语音信息,包括:
将所述至少一个第一候选目的地输入至问答模型中,基于所述问答模型对所述至少一个第一候选目的地进行处理,得到用于询问是否去往所述至少一个第一候选目的地的语音信息,作为所述第一语音信息。
7.根据权利要求6所述的方法,其特征在于,所述基于问答模型,生成包括所述至少一个第一候选目的地的第一语音信息,包括:
将所述至少一个第一候选目的地输入至问答模型中,基于所述问答模型对所述至少一个第一候选目的地进行处理,得到用于询问是否去往所述至少一个第一候选目的地的第二文本信息;
将所述第二文本信息转换为所述第一语音信息。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述第二语音信息转换为第三文本信息;
对所述第三文本信息进行分词处理,得到至少一个关键词,识别所述至少一个关键词中的第一目的地关键词。
9.一种目的地确定装置,其特征在于,所述装置包括:
关键词获取模块,包括:
信息获取单元,用于获取输入的第二语音信息;
所述关键词获取模块还包括用于执行以下步骤的单元:获取所述第二语音信息的声纹特征和预设语音信息的声纹特征之间的相似度;
相似度获取单元,用于获取所述第二语音信息与预设语音信息之间的相似度,所述预设语音信息为用于查询目的地的语音信息;
第一关键词获取单元,用于当获取的所述第二语音信息的声纹特征和预设语音信息的声纹特征之间的相似度大于预设声纹相似度,且所述第二语音信息与预设语音信息之间的相似度大于预设相似度时,获取所述第二语音信息中的第一目的地关键词;
所述关键词获取模块,用于获取输入的第一目的地关键词;
目的地获取模块,用于获取所述第一目的地关键词对应的至少一个第一候选目的地;
语音信息生成模块,用于基于问答模型,生成包括所述至少一个第一候选目的地的第一语音信息,播放所述第一语音信息;
目的地确定模块,用于获取所述第一语音信息的第一回复信息;
所述装置还包括用于执行以下步骤的模块:获取所述第一回复信息中的第二目的地关键词;
第二关键词获取单元,用于获取所述第一回复信息中的第二目的地关键词;
目的地获取单元,用于获取所述第二目的地关键词对应的至少一个第二候选目的地;
生成单元,用于基于所述问答模型,生成包括所述至少一个第二候选目的地的第三语音信息,播放所述第三语音信息;
目的地确定单元,用于获取所述第三语音信息的第二回复信息,将所述第二回复信息指示的目的地确定为目标目的地。
10.根据权利要求9所述的装置,其特征在于,所述第一语音信息中包括多个第一候选目的地,所述目的地确定模块还用于当所述第一回复信息中包括所述多个第一候选目的地中的任一个第一候选目的地时,将所述第一回复信息中包括的候选目的地作为所述目标目的地。
11.根据权利要求9所述的装置,其特征在于,所述第一语音信息中包括一个第一候选目的地,所述目的地确定模块还用于当所述第一回复信息中包括确认关键词时,确定所述第一候选目的地为所述目标目的地。
12.根据权利要求9-11任一项所述的装置,其特征在于,所述第一回复信息为文本信息;所述目的地确定模块,包括:
分词单元,用于对所述第一回复信息进行分词处理,得到多个关键词;
目的地确定单元,用于确定与所述多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
13.根据权利要求9-11任一项所述的装置,其特征在于,所述目的地确定模块,包括:
第一转换单元,用于对所述第一回复信息进行语音转换,得到所述第一回复信息对应的第一文本信息;
分词单元,用于对所述第一文本信息进行分词处理,得到多个关键词;
目的地确定单元,用于确定与所述多个关键词的特征向量匹配的目的地特征向量所属的目标目的地。
14.根据权利要求9所述的装置,其特征在于,所述语音信息生成模块,还用于将所述至少一个第一候选目的地输入至问答模型中,基于所述问答模型对所述至少一个第一候选目的地进行处理,得到用于询问是否去往所述至少一个第一候选目的地的语音信息,作为所述第一语音信息。
15.根据权利要求14所述的装置,其特征在于,所述语音信息生成模块,还用于将所述至少一个第一候选目的地输入至问答模型中,基于所述问答模型对所述至少一个第一候选目的地进行处理,得到用于询问是否去往所述至少一个第一候选目的地的第二文本信息;
所述语音信息生成模块,包括:
第二转换单元,用于将所述第二文本信息转换为所述第一语音信息。
16.根据权利要求9所述的装置,其特征在于,所述关键词获取模块,包括:
信息获取单元,用于获取输入的第二语音信息;
第三转换单元,用于将所述第二语音信息转换为第三文本信息;
识别单元,用于对所述第三文本信息进行分词处理,得到至少一个关键词,识别所述至少一个关键词中的第一目的地关键词。
17.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
用于存储所述一个或多个处理器可执行指令的易失性或非易失性存储器;
其中,所述一个或多个处理器被配置为执行如权利要求1-8中任一项权利要求所述的目的地确定方法中所执行的操作。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如权利要求1-8任一权利要求所述的目的地确定方法中所执行的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911252473.XA CN110928999B (zh) | 2019-12-09 | 2019-12-09 | 目的地确定方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911252473.XA CN110928999B (zh) | 2019-12-09 | 2019-12-09 | 目的地确定方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110928999A CN110928999A (zh) | 2020-03-27 |
CN110928999B true CN110928999B (zh) | 2023-02-24 |
Family
ID=69858579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911252473.XA Active CN110928999B (zh) | 2019-12-09 | 2019-12-09 | 目的地确定方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110928999B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8331924B1 (en) * | 2007-07-03 | 2012-12-11 | Kyocera Corporation | Phone call by picture selection |
CN103217167A (zh) * | 2013-03-25 | 2013-07-24 | 深圳市凯立德科技股份有限公司 | 声控导航方法及设备 |
CN103943108A (zh) * | 2014-04-04 | 2014-07-23 | 广东翼卡车联网服务有限公司 | 通过方向盘控制器实现手机终端语音导航的方法及*** |
CN105004348A (zh) * | 2015-08-12 | 2015-10-28 | 深圳市艾米通信有限公司 | 一种语音导航方法和*** |
CN105261356A (zh) * | 2015-10-30 | 2016-01-20 | 桂林信通科技有限公司 | 一种语音识别***及方法 |
CN106570103A (zh) * | 2016-10-25 | 2017-04-19 | 北京奇虎科技有限公司 | 语音播报方法及装置 |
CN109145281A (zh) * | 2017-06-15 | 2019-01-04 | 北京嘀嘀无限科技发展有限公司 | 语音识别方法、装置及存储介质 |
CN110211587A (zh) * | 2019-06-03 | 2019-09-06 | 腾讯大地通途(北京)科技有限公司 | 排号信息获取方法、装置、设备及介质 |
-
2019
- 2019-12-09 CN CN201911252473.XA patent/CN110928999B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8331924B1 (en) * | 2007-07-03 | 2012-12-11 | Kyocera Corporation | Phone call by picture selection |
CN103217167A (zh) * | 2013-03-25 | 2013-07-24 | 深圳市凯立德科技股份有限公司 | 声控导航方法及设备 |
CN103943108A (zh) * | 2014-04-04 | 2014-07-23 | 广东翼卡车联网服务有限公司 | 通过方向盘控制器实现手机终端语音导航的方法及*** |
CN105004348A (zh) * | 2015-08-12 | 2015-10-28 | 深圳市艾米通信有限公司 | 一种语音导航方法和*** |
CN105261356A (zh) * | 2015-10-30 | 2016-01-20 | 桂林信通科技有限公司 | 一种语音识别***及方法 |
CN106570103A (zh) * | 2016-10-25 | 2017-04-19 | 北京奇虎科技有限公司 | 语音播报方法及装置 |
CN109145281A (zh) * | 2017-06-15 | 2019-01-04 | 北京嘀嘀无限科技发展有限公司 | 语音识别方法、装置及存储介质 |
CN110211587A (zh) * | 2019-06-03 | 2019-09-06 | 腾讯大地通途(北京)科技有限公司 | 排号信息获取方法、装置、设备及介质 |
Non-Patent Citations (1)
Title |
---|
"手机惯导与RFID的盲人导航***设计与实现";郇战 等;《智能***学报》;20180628;第14卷(第3期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110928999A (zh) | 2020-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105489220B (zh) | 语音识别方法及装置 | |
CN106128478B (zh) | 语音播报方法及装置 | |
US20220051668A1 (en) | Speech control method, terminal device, and storage medium | |
US11335348B2 (en) | Input method, device, apparatus, and storage medium | |
CN111831806A (zh) | 语义完整性确定方法、装置、电子设备和存储介质 | |
CN111199730B (zh) | 语音识别方法、装置、终端及存储介质 | |
CN106657543B (zh) | 语音信息处理方法及装置 | |
CN109274825B (zh) | 一种消息提醒方法及装置 | |
CN111061452A (zh) | 用户界面的语音控制方法和装置 | |
CN112489653B (zh) | 语音识别的方法、装置及存储介质 | |
US11354520B2 (en) | Data processing method and apparatus providing translation based on acoustic model, and storage medium | |
CN112309387A (zh) | 用于处理信息的方法和装置 | |
CN110928999B (zh) | 目的地确定方法、装置、电子设备及存储介质 | |
CN106098066B (zh) | 语音识别方法及装置 | |
CN113127613B (zh) | 聊天信息处理方法及装置 | |
CN110362760B (zh) | 一种智能提示搜索结果的方法、装置及介质 | |
CN115510336A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN110471538B (zh) | 一种输入预测方法及装置 | |
CN111816174A (zh) | 语音识别方法、装置及计算机可读存储介质 | |
CN112927033A (zh) | 数据处理方法及装置、电子设备和存储介质 | |
CN108173802B (zh) | 一种通讯处理方法、装置和终端 | |
CN112732098A (zh) | 一种输入的方法及相关装置 | |
CN112214114A (zh) | 一种输入方法、装置和电子设备 | |
CN114238728B (zh) | 车辆数据的处理方法、装置和设备 | |
WO2020224448A1 (zh) | 交互方法及装置、音箱、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |