CN108920541A

CN108920541A - 一种基于语音搜索的识别方法及家教机

Info

Publication number: CN108920541A
Application number: CN201810603485.1A
Authority: CN
Inventors: 徐杨
Original assignee: Guangdong Genius Technology Co Ltd
Current assignee: Guangdong Genius Technology Co Ltd
Priority date: 2018-06-12
Filing date: 2018-06-12
Publication date: 2018-11-30

Abstract

一种基于语音搜索的识别方法及家教机，包括：家教机检测是否接收到用户输入的第一语音信息；如果接收到第一语音信息，家教机根据第一语音信息，从预先获取到的总口音数据库中确定与输入第一语音信息的用户的口音所对应的目标口音数据库；总口音数据库是基于与预设统计维度相匹配的用户的口音形成的，预设统计维度包括区域；家教机根据目标口音数据库识别第一语音信息的语音内容，作为用户的待搜索内容。实施本发明实施例，能够提高家教机对语音问题的识别准确率，进而提高家教机针对语音问题的搜索结果的正确率。

Description

一种基于语音搜索的识别方法及家教机

技术领域

本发明涉及家教机技术领域，具体涉及一种基于语音搜索的识别方法及家教机。

背景技术

学生使用家教机学习时，经常会用到家教机的语音搜索功能，即，学生可以对家教机说出问题，进而，家教机可以识别问题并检索到与问题对应的答案。实践发现，学生在不同成长阶段的声音会发生变化，这会导致家教机对语音问题的识别准确率降低，进而导致家教机针对语音问题的搜索结果的正确率降低。

发明内容

本发明实施例公开了一种基于语音搜索的识别方法及家教机，能够提高家教机对语音问题的识别准确率，进而提高家教机针对语音问题的搜索结果的正确率。

本发明实施例第一方面公开了一种基于语音搜索的识别方法，所述方法包括：

家教机检测是否接收到用户输入的第一语音信息；

如果接收到所述第一语音信息，所述家教机根据所述第一语音信息，从预先获取到的总口音数据库中确定与输入所述第一语音信息的用户的口音所对应的目标口音数据库；所述总口音数据库是基于与预设统计维度相匹配的用户的口音形成的，所述预设统计维度包括区域；

所述家教机根据所述目标口音数据库识别所述第一语音信息的语音内容，作为用户的待搜索内容。

作为一种可选的实施方式，在本发明实施例第一方面中，所述预设统计维度还包括年龄以及性别；

所述家教机根据所述第一语音信息，从预先获取到的总口音数据库中确定与输入所述第一语音信息的用户的口音所对应的目标口音数据库，包括：

所述家教机根据所述第一语音信息确定用户年龄、用户性别以及用户所在区域；

所述家教机根据所述用户年龄、所述用户性别以及所述用户所在区域，从预先获取到的总口音数据库中确定与所述用户年龄、所述用户性别以及所述用户所在区域对应的目标口音数据库。

作为一种可选的实施方式，在本发明实施例第一方面中，所述家教机根据所述目标口音数据库识别所述第一语音信息的语音内容，作为用户的待搜索内容之后，所述方法还包括：

所述家教机从与所述用户所在区域、所述用户年龄以及所述用户性别对应的内容数据库中搜索与所述待搜索内容相匹配的内容作为目标内容，并输出所述目标内容；

以及，所述家教机输出所述目标内容之后，所述方法还包括：

所述家教机输出用于供用户输入针对所述目标内容的满意度等级的评价页面，并检测用户输入的目标满意度等级；

所述家教机判断所述目标满意度等级是否大于预设满意度等级，如果否，则将所述第一语音信息、所述待搜索内容以及所述目标内容上传至用户反馈平台。

作为一种可选的实施方式，在本发明实施例第一方面中，所述方法还包括：

所述家教机确定所述目标口音数据库对应的第一声音变化曲线；

所述家教机根据所述第一语音信息对应的第一声音数据优化所述第一声音变化曲线，得到用户的第二声音变化曲线，并存储所述第二声音变化曲线。

作为一种可选的实施方式，在本发明实施例第一方面中，所述家教机存储所述第二声音变化曲线之后，所述方法还包括：

所述家教机检测是否接收到用户输入的第二语音信息；

如果接收到所述第二语音信息，所述家教机确定所述第二语音信息对应的第二声音数据，并判断所述第二声音变化曲线中是否存在某声音数据与所述第二声音数据匹配；

如果存在所述某声音数据与所述第二声音数据匹配，所述家教机根据所述某声音数据和所述目标口音数据库识别所述第二语音信息的语音内容，并将所述第二语音信息的语音内容作为当前待搜索内容。

本发明实施例第二方面公开了一种家教机，所述家教机包括：

检测单元，用于检测是否接收到用户输入的第一语音信息；

第一确定单元，用于在所述检测单元接收到所述第一语音信息之后，根据所述第一语音信息，从预先获取到的总口音数据库中确定与输入所述第一语音信息的用户的口音所对应的目标口音数据库；所述总口音数据库是基于与预设统计维度相匹配的用户的口音形成的，所述预设统计维度包括区域；

识别单元，用于根据所述目标口音数据库识别所述第一语音信息的语音内容，作为用户的待搜索内容。

作为一种可选的实施方式，在本发明实施例第二方面中，所述预设统计维度还包括年龄以及性别；

所述第一确定单元根据所述第一语音信息，从预先获取到的总口音数据库中确定与输入所述第一语音信息的用户的口音所对应的目标口音数据库的方式具体为：

所述第一确定单元根据所述第一语音信息确定用户年龄、用户性别以及用户所在区域，再根据所述用户年龄、所述用户性别以及所述用户所在区域，从预先获取到的总口音数据库中确定与所述用户年龄、所述用户性别以及所述用户所在区域对应的目标口音数据库。

作为一种可选的实施方式，在本发明实施例第二方面中，所述家教机还包括：

搜索单元，用于在所述识别单元根据所述目标口音数据库识别所述第一语音信息的语音内容，作为用户的待搜索内容之后，从与所述用户所在区域、所述用户年龄以及所述用户性别对应的内容数据库中搜索与所述待搜索内容相匹配的内容作为目标内容，并输出所述目标内容；

输出内容，用于在所述搜索单元输出所述目标内容之后，输出用于供用户输入针对所述目标内容的满意度等级的评价页面，并检测用户输入的目标满意度等级；

判断单元，用于判断所述目标满意度等级是否大于预设满意度等级；

上传单元，用于在所述判断单元判断出所述目标满意度等级不大于预设满意度等级之后，将所述第一语音信息、所述待搜索内容以及所述目标内容上传至用户反馈平台。

第二确定单元，用于确定所述目标口音数据库对应的第一声音变化曲线；

优化存储单元，用于根据所述第一语音信息对应的第一声音数据优化所述第一声音变化曲线，得到用户的第二声音变化曲线，并存储所述第二声音变化曲线。

作为一种可选的实施方式，在本发明实施例第二方面中，所述检测单元，还用于在所述优化存储单元存储所述第二声音变化曲线之后，检测是否接收到用户输入的第二语音信息；

所述家教机还包括：

第三确定单元，用于在所述检测单元接收到所述第二语音信息之后，确定所述第二语音信息对应的第二声音数据；

所述判断单元，还用于判断所述第二声音变化曲线中是否存在某声音数据与所述第二声音数据匹配；

所述识别单元，还用于在所述判断单元判断出存在所述某声音数据与所述第二声音数据匹配之后，根据所述某声音数据和所述目标口音数据库识别所述第二语音信息的语音内容，并将所述第二语音信息的语音内容作为当前待搜索内容。

本发明实施例第三方面公开了一种家教机，包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明实施例第一方面公开的基于语音搜索的识别方法。

本发明实施例第四方面公开了一种计算机可读存储介质，其存储计算机程序，其中，所述计算机程序使得计算机执行本发明实施例第一方面公开的基于语音搜索的识别方法。

本发明实施例第五方面公开了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机执行第一方面公开的基于语音搜索的识别方法。

与现有技术相比，本发明实施例具有以下有益效果：

本发明实施例中，家教机可以检测用户输入的第一语音信息，当检测到第一语音信息时，家教机可以根据第一语音信息从预先获取到的总口音数据库(需要说明的是，总口音数据库是基于与预设统计维度相匹配的用户的口音形成的，预设统计维度包括区域)中获取输入该第一语音信息的用户的口音对应的目标口音数据库(例如，北京口音数据库)，家教机再根据目标口音数据库识别第一语音信息对应的语音内容(例如，朋友的朋字怎么写)，并将上述语音内容作为待搜索内容。综上所述，实施本发明实施例，能够提高家教机对语音问题的识别准确率，进而提高家教机针对语音问题的搜索结果的正确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种基于语音搜索的识别方法的流程示意图；

图2是本发明实施例公开的另一种基于语音搜索的识别方法的流程示意图；

图3是本发明实施例公开的又一种基于语音搜索的识别方法的流程示意图；

图4是本发明实施例公开的一种家教机的结构示意图；

图5是本发明实施例公开的另一种家教机的结构示意图；

图6是本发明实施例公开的又一种家教机的结构示意图；

图7是本发明实施例公开的又一种家教机的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明实施例及附图中的术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例公开了一种基于语音搜索的识别方法及家教机，能够提高家教机对语音问题的识别准确率，进而提高家教机针对语音问题的搜索结果的正确率。以下分别进行详细说明。

实施例一

请参阅图1，图1是本发明实施例公开的一种基于语音搜索的识别方法的流程示意图。如图1所示该基于语音搜索的识别方法可以包括以下步骤：

101、家教机检测是否接收到用户输入的第一语音信息，如果是，则执行步骤102，如果否，则执行步骤101。

本发明实施例中，可选的，家教机检测是否接收到用户输入的第一语音信息的方式具体可以为：

家教机开启用户语音实时检测功能，并在检测到第一语音信息时判断第一语音信息的内容是否包括目标口令(例如，小布小布)，如果包含目标口令，则将接收到的第一语音信息确定为用户输入的第一语音信息，如果不包含目标口令，则默认未接收到用户输入的第一语音信息。这样能够在检测到语音信息中包括目标口令时确定家教机接收到用户输入的第一语音信息，降低了家教机对未包含目标口令的语音信息的误识别机率，提高了家教机对用户输入的第一语音信息的响应机率，改善了用户对家教机的使用体验。

本发明实施例中，另一种可选的，家教机检测是否接收到用户输入的第一语音信息的方式具体可以为：

家教机检测是否接收到第一语音信息，如果接收到第一语音信息，则通过声纹识别功能判断第一语音信息对应的目标声纹特征是否与预存合法声纹匹配，如果匹配，则将接收到的第一语音信息确定为用户输入的第一语音信息，如果不匹配，则默认未接收到用户输入的第一语音信息。这样能够当第一语音信息不是合法用户输入时不对第一语音信息进行内容识别，以降低家教机的功耗。

102、家教机根据第一语音信息，从预先获取到的总口音数据库中确定与输入第一语音信息的用户的口音所对应的目标口音数据库；总口音数据库是基于与预设统计维度相匹配的用户的口音形成的，预设统计维度包括区域。

本发明实施例中，总口音数据库包括不同区域的子口音数据库(例如，广东口音数据库、北京口音数据库、上海口音数据库)。此外，目标口音数据库(例如，广东口音数据库)是基于大数据对目标口音数据库对应方言的发音、用词以及语序的分析得到的。

本发明实施例中，可选的，家教机根据第一语音信息，从预先获取到的总口音数据库中确定与输入第一语音信息的用户的口音所对应的目标口音数据库的方式具体可以为：

家教机检测预先获取到的总口音数据库是否为最新版本，如果不是最新版本，则对总口音数据库进行版本更新，再从版本更新后的总口音数据库中确定与输入第一语音信息的用户的口音(例如，广东口音)所对应的目标口音数据库(广东口音数据库)。这样能够通过对总口音数据库的更新确定出与用户口音匹配的口音数据库，以提高对用户输入的语音的识别准确率；此外，如果用户输入的第一语音信息的语音内容为问题内容，本发明实施例则能够提高家教机针对语音问题的搜索结果的正确率。

103、家教机根据目标口音数据库识别第一语音信息的语音内容，作为用户的待搜索内容。

作为一种可选的实施方式，家教机根据目标口音数据库识别第一语音信息的语音内容之后，家教机还可以执行以下操作：

判断语音内容是否包含问题内容，如果不包含问题内容(例如，语音内容为“陪我聊聊天吧”)，则以目标口音数据库对应的目标口音输出预设的目标内容(例如，“那我给你讲个故事吧”)；如果包含问题内容，则执行上述的将语音内容作为用户的待搜索内容。

可见，实施该可选的实施方式，能够实现在不借助搜索引擎的情况下与用户进行语音交互，进而改善用户体验。

作为另一种可选的实施方式，步骤103之后，家教机还可以执行以下步骤：

判断历史搜索记录中是否存在目标搜索内容与待搜索内容匹配(简单来说，家教机判断该待搜索内容是否为用户曾经搜索过的内容)；

如果不存在，则通过家教机的搜索引擎搜索待搜索内容，得到搜索结果；

输出搜索结果，并将搜索结果和待搜索内容作为目标历史搜索记录存储于历史搜索记录中；

如果存在，则输出目标搜索内容对应的搜索结果。

可见，实施该另一种可选的实施方式，能够通过将用户搜索过的内容存储以及当用户再次搜索该内容时，直接输出该内容对应的搜索结果，提高用户的搜索效率。

举例来说，当家教机检测到学生说出“小布小布，推荐一些描写春天的好句子”时，家教机可以根据预先获取到的总口音数据库判断说出这句话的学生所处的地域，并确定出用于识别该学生说的这句话的目标口音数据库，比如，广东口音数据库；进而，家教机可以根据广东口音数据库对学生说出的这句话进行识别，得到识别结果，并将该识别结果作为待搜索内容，以便家教机通过搜索引擎对该待搜索内容进行搜索。

可见，实施图1所描述的方法，能够提高家教机对语音问题的识别准确率，进而提高家教机针对语音问题的搜索结果的正确率；还能够当第一语音信息不是合法用户输入时不对第一语音信息进行内容识别，以降低家教机的功耗；还能够实现在不借助搜索引擎的情况下与用户进行语音交互，进而改善用户体验。

实施例二

请参阅图2，图2是本发明实施例公开的另一种基于语音搜索的识别方法的流程示意图。其中，预设统计维度还可以包括年龄以及性别，如图2所示，该基于语音搜索的识别方法可以包括以下步骤：

步骤201～步骤203，针对步骤201～步骤203的描述，请参照实施例一中针对步骤101～步骤103的详细描述，本发明实施例不再赘述。

204、家教机从与用户所在区域、用户年龄以及用户性别对应的内容数据库中搜索与待搜索内容相匹配的内容作为目标内容，并输出目标内容。

本发明实施例中，内容数据库至少可以包括不同科目和不同地域的电子教材、常识百科知识以及不同类型的故事。

本发明实施例中，可选的，家教机从与用户所在区域、用户年龄以及用户性别对应的内容数据库中搜索与待搜索内容相匹配的内容作为目标内容，并输出目标内容的方式具体可以为：

家教机检测与用户所在区域、用户年龄以及用户性别对应的内容数据库中是否存在与待搜索内容相匹配的内容，如果存在，则将与待搜索内容相匹配的内容作为目标内容并输出目标内容。

进一步地，如果内容数据库中不存在与待搜索内容相匹配的内容，家教机还可以执行以下操作：

家教机通过搜索引擎搜索与待搜索内容相匹配的线上内容，并输出线上内容。这样能够提高对用户的语音问题的响应速率，进而提高了对语音问题的搜索效率。

205、家教机输出用于供用户输入针对目标内容的满意度等级的评价页面，并检测用户输入的目标满意度等级。

本发明实施例中，所述评价页面中针对目标内容的满意度等级的输出形式可以为预设个数的五角星也可以为电子打分板，本发明实施例不作限定。其中，如果针对目标内容的满意度等级的输出形式为预设个数的五角星，那么，当家教机检测到用户点触一个空心的五角星时家教机可以将该空心五角星转换为实心五角星。当家教机检测到用户点触了全部的空心五角星时，则家教机默认用户对目标内容非常满意；当家教机检测到用户点触了一半以上的空心五角星时，则家教机默认用户对目标内容满意；当家教机检测到用户点触了一半及以下的空心五角星时，则家教机默认用户对目标内容不满意。此外，如果针对目标内容的满意度等级的输出形式为电子打分板，那么家教机可以检测到用户在打分班上输出的目标分数，如果目标分数大于总分数的70％，则默认用户对目标内容非常满意；如果目标分数大于总分数的40％且小于等于总分数的70％，则默认用户对目标内容满意；如果目标分数小于等于总分数的40％，则默认用户对目标内容不满意。这样对于学生用户来说，在增加了人机交互的乐趣之外，还为家教机的开发人员提供了用户反馈，以便开发人员根据用户反馈对家教机进一步进行优化，进而改善用户体验。

206、家教机判断目标满意度等级是否大于预设满意度等级，如果是，则结束本次流程，如果否，则执行步骤107。

207、家教机将第一语音信息、待搜索内容以及目标内容上传至用户反馈平台。

作为一种可选的实施方式，家教机根据第一语音信息，从预先获取到的总口音数据库中确定与输入第一语音信息的用户的口音所对应的目标口音数据库，可以包括以下步骤：

家教机根据第一语音信息确定用户年龄、用户性别以及用户所在区域；

家教机根据用户年龄、用户性别以及用户所在区域，从预先获取到的总口音数据库中确定与用户年龄、用户性别以及用户所在区域对应的目标口音数据库。

可见，实施该可选的实施方式，能够通过用户的年龄(例如，五岁)、性别(例如，女性)和所在区域(例如，广东)确定出对应的目标口音数据库(例如，广东&女性&五岁口音数据库)，这样确定出的目标口音数据库与用户的信息更匹配，在识别用户输入的语音信息时的识别准确率也更高，进而，能够提高与语音信息相关的搜索结果的搜索准确率。

作为另一种可选的实施方式，在步骤207之后，家教机还可以执行以下步骤：

向与该家教机连接的移动终端(例如，老师的手机)发送远程连接请求，并检测是否接收到移动终端对远程连接请求的响应；

如果接收到远程连接请求的响应，则与移动终端远程连接，并向移动终端传输第一语音信息，以便移动终端用户针对第一语音信息进行反馈。

可见，实施另一种可选的实施方式，用户能够在对家教机的搜索结果不满意时，求助于老师，增加了用户的提问途径，进而提高用户的学习效果。此外，家教机具有的满意度等级评价功能，能够督促用户进行思考以及判断家教机的搜索结果是否为自己想要的结果，以帮助用户提高学习能力。

可见，实施图2所描述的方法，能够提高家教机对语音问题的识别准确率，进而提高家教机针对语音问题的搜索结果的正确率；还能够当第一语音信息不是合法用户输入时不对第一语音信息进行内容识别，以降低家教机的功耗；还能够实现在不借助搜索引擎的情况下与用户进行语音交互，进而改善用户体验；还能够提高对用户的语音问题的响应速率，进而提高了对语音问题的搜索效率；还能够督促用户进行思考，帮助用户提高学习能力。

实施例三

请参阅图3，图3是本发明实施例公开的又一种基于语音搜索的识别方法的流程示意图。如图3所示该基于语音搜索的识别方法可以包括以下步骤：

步骤301～步骤307，针对步骤301～步骤307的描述，请参照实施例二中针对201～步骤207的详细描述，本发明实施例不再赘述。

308、家教机确定目标口音数据库对应的第一声音变化曲线。

本发明实施例中，可选的，家教机确定目标口音数据库对应的第一声音变化曲线的方式具体可以为：

家教机确定目标口音数据库对应的用户性别、用户所在区域；

家教机根据所述用户性别和所述用户所在区域从声音变化曲线数据库中获取第一声音变化曲线(例如，该第一声音变化曲线为广东女性的声音变化曲线，那么该声音变化曲线涵盖所有年龄段的广东女性)。这样能够通过用户的性别和所在区域确定第一声音变化曲线，以提高随着用户年龄的增长对用户输入的语音信息的识别准确率。

本发明实施例中，另一种可选的，家教机确定目标口音数据库对应的第一声音变化曲线的方式具体可以为：

家教机根据目标口音数据库以及第一语音信息确定用户的声纹特征，并基于口音大数据分析声纹特征，进而生成第一声音变化曲线。这样能够通过对用户输入的语音信息进行分析进而生成独一无二的针对该用户的第一声音变化曲线(需要说明的是，该第一声音变化曲线能够展示该用户的每个年龄对应的声纹特征)，提高了随着用户年龄的增长对用户输入的语音信息的识别准确率。

309、家教机根据第一语音信息对应的第一声音数据优化第一声音变化曲线，得到用户的第二声音变化曲线，并存储第二声音变化曲线。

本发明实施例中，第二声音变化曲线为优化后的第一声音变化曲线。

310、家教机检测是否接收到用户输入的第二语音信息，如果是，则执行步骤311，如果否，则执行步骤310。

311、家教机确定第二语音信息对应的第二声音数据，并判断第二声音变化曲线中是否存在某声音数据与第二声音数据匹配，如果是，则执行步骤312，如果否，则根据第二语音信息从预先获取到的总口音数据库中确定与输入第二语音信息的用户的口音所对应的目标口音数据库，并根据目标口音数据库识别第一语音信息的语音内容，作为用户的待搜索内容。

本发明实施例中，第二声音数据中包括第二声纹特征，且第二声纹特征为输入语音信息的用户的声纹特征。

312、家教机根据某声音数据和目标口音数据库识别第二语音信息的语音内容，并将第二语音信息的语音内容作为当前待搜索内容。

举例来说，如果家教机确定出五岁广东女性用户的第一声音变化曲线，家教机每次在检测到该用户输入语音信息时均可以对第一声音变化曲线进行优化，因此，第一声音变化曲线随着优化次数越来越多，该第一声音变化曲线也与该用户越来越匹配，进而，家教机对于该用户输入的语音信息的识别准确率也会越来越高。

可见，实施图3所描述的方法，能够提高家教机对语音问题的识别准确率，进而提高家教机针对语音问题的搜索结果的正确率；还能够当第一语音信息不是合法用户输入时不对第一语音信息进行内容识别，以降低家教机的功耗；还能够实现在不借助搜索引擎的情况下与用户进行语音交互，进而改善用户体验；还能够提高对用户的语音问题的响应速率，进而提高了对语音问题的搜索效率；还能够督促用户进行思考，帮助用户提高学习能力；还能够提高随着用户年龄的增长对用户输入的语音信息的识别准确率。

实施例四

请参阅图4，图4是本发明实施例公开的一种家教机的结构示意图。如图4所示，该家教机可以包括：检测单元401、第一确定单元402以及识别单元403，其中，

检测单元401，用于检测是否接收到用户输入的第一语音信息。

本发明实施例中，可选的，检测单元401检测是否接收到用户输入的第一语音信息的方式具体可以为：

检测单元401开启用户语音实时检测功能，并在检测到第一语音信息时判断第一语音信息的内容是否包括目标口令(例如，小布小布)，如果包含目标口令，则将接收到的第一语音信息确定为用户输入的第一语音信息。这样能够在检测到语音信息中包括目标口令时确定家教机接收到用户输入的第一语音信息，降低了家教机对未包含目标口令的语音信息的误识别机率，提高了家教机对用户输入的第一语音信息的响应机率，改善了用户对家教机的使用体验。

本发明实施例中，另一种可选的，检测单元401检测是否接收到用户输入的第一语音信息的方式具体可以为：

检测单元401检测是否接收到第一语音信息，如果接收到第一语音信息，则通过声纹识别功能判断第一语音信息对应的目标声纹特征是否与预存合法声纹匹配，如果匹配，则将接收到的第一语音信息确定为用户输入的第一语音信息。这样能够当第一语音信息不是合法用户输入时不对第一语音信息进行内容识别，以降低家教机的功耗。

第一确定单元402，用于在检测单元401接收到第一语音信息之后，根据第一语音信息，从预先获取到的总口音数据库中确定与输入第一语音信息的用户的口音所对应的目标口音数据库；总口音数据库是基于与预设统计维度相匹配的用户的口音形成的，预设统计维度包括区域。

本发明实施例中，可选的，第一确定单元402根据第一语音信息，从预先获取到的总口音数据库中确定与输入第一语音信息的用户的口音所对应的目标口音数据库的方式具体可以为：

第一确定单元402检测预先获取到的总口音数据库是否为最新版本，如果不是最新版本，则对总口音数据库进行版本更新，再从版本更新后的总口音数据库中确定与输入第一语音信息的用户的口音(例如，广东口音)所对应的目标口音数据库(广东口音数据库)。这样能够通过对总口音数据库的更新确定出与用户口音匹配的口音数据库，以提高对用户输入的语音的识别准确率；此外，如果用户输入的第一语音信息的语音内容为问题内容，本发明实施例则能够提高家教机针对语音问题的搜索结果的正确率。

本发明实施例中，在第一确定单元402根据第一语音信息，从预先获取到的总口音数据库中确定与输入第一语音信息的用户的口音所对应的目标口音数据库之后，触发识别单元403启动。

识别单元403，用于根据目标口音数据库识别第一语音信息的语音内容，作为用户的待搜索内容。

作为一种可选的实施方式，识别单元403，还可以用于在根据目标口音数据库识别第一语音信息的语音内容之后，

作为另一种可选的实施方式，识别单元403，还可以用于在根据目标口音数据库识别第一语音信息的语音内容，作为用户的待搜索内容之后：

如果存在，则输出目标搜索内容对应的搜索结果。

可见，实施图4所描述的家教机，能够提高家教机对语音问题的识别准确率，进而提高家教机针对语音问题的搜索结果的正确率；还能够当第一语音信息不是合法用户输入时不对第一语音信息进行内容识别，以降低家教机的功耗；还能够实现在不借助搜索引擎的情况下与用户进行语音交互，进而改善用户体验。

实施例五

请参阅图5，图5是本发明实施例公开的另一种家教机的结构示意图。其中，图5所示的家教机是由图4所示的家教机进行优化得到的；另外，预设统计维度还包括年龄以及性别。与图4所示的家教机相比较，图5所示的家教机还可以包括：搜索单元404、输出内容405、判断单元406以及上传单元407，其中，

搜索单元404，用于在识别单元403根据目标口音数据库识别第一语音信息的语音内容，作为用户的待搜索内容之后，从与用户所在区域、用户年龄以及用户性别对应的内容数据库中搜索与待搜索内容相匹配的内容作为目标内容，并输出目标内容。

本发明实施例中，可选的，搜索单元404从与用户所在区域、用户年龄以及用户性别对应的内容数据库中搜索与待搜索内容相匹配的内容作为目标内容，并输出目标内容的方式具体可以为：

搜索单元404检测与用户所在区域、用户年龄以及用户性别对应的内容数据库中是否存在与待搜索内容相匹配的内容，如果存在，则将与待搜索内容相匹配的内容作为目标内容并输出目标内容。

进一步地，如果，搜索单元404，还用于在内容数据库中不存在与待搜索内容相匹配的内容之后，

通过搜索引擎搜索与待搜索内容相匹配的线上内容，并输出线上内容。这样能够提高对用户的语音问题的响应速率，进而提高了对语音问题的搜索效率。

输出内容405，用于在搜索单元404输出目标内容之后，输出用于供用户输入针对目标内容的满意度等级的评价页面，并检测用户输入的目标满意度等级。

本发明实施例中，所述评价页面中针对目标内容的满意度等级的输出形式可以为预设个数的五角星也可以为电子打分板，本发明实施例不作限定。其中，如果针对目标内容的满意度等级的输出形式为预设个数的五角星，那么，当输出内容405检测到用户点触一个空心的五角星时家教机可以将该空心五角星转换为实心五角星。当输出内容405检测到用户点触了全部的空心五角星时，则输出内容405默认用户对目标内容非常满意；当输出内容405检测到用户点触了一半以上的空心五角星时，则输出内容405默认用户对目标内容满意；当输出内容405检测到用户点触了一半及以下的空心五角星时，则输出内容405默认用户对目标内容不满意。此外，如果针对目标内容的满意度等级的输出形式为电子打分板，那么输出内容405可以检测到用户在打分班上输出的目标分数，如果目标分数大于总分数的70％，则默认用户对目标内容非常满意；如果目标分数大于总分数的40％且小于等于总分数的70％，则默认用户对目标内容满意；如果目标分数小于等于总分数的40％，则默认用户对目标内容不满意。这样对于学生用户来说，在增加了人机交互的乐趣之外，还为家教机的开发人员提供了用户反馈，以便开发人员根据用户反馈对家教机进一步进行优化，进而改善用户体验。

本发明实施例中，在输出内容405输出用于供用户输入针对目标内容的满意度等级的评价页面，并检测用户输入的目标满意度等级之后，触发判断单元406启动。

判断单元406，用于判断目标满意度等级是否大于预设满意度等级。

本发明实施例中，在判断单元406判断目标满意度等级是否大于预设满意度等级之后，触发上传单元407启动。

上传单元407，用于在判断单元406判断出目标满意度等级不大于预设满意度等级之后，将第一语音信息、待搜索内容以及目标内容上传至用户反馈平台。

第一确定单元402根据第一语音信息，从预先获取到的总口音数据库中确定与输入第一语音信息的用户的口音所对应的目标口音数据库的方式具体为：

第一确定单元402根据第一语音信息确定用户年龄、用户性别以及用户所在区域，再根据用户年龄、用户性别以及用户所在区域，从预先获取到的总口音数据库中确定与用户年龄、用户性别以及用户所在区域对应的目标口音数据库。

作为一种可选的实施方式，上传单元407，还可以用于在将第一语音信息、待搜索内容以及目标内容上传至用户反馈平台之后，

可见，实施一种可选的实施方式，用户能够在对家教机的搜索结果不满意时，求助于老师，增加了用户的提问途径，进而提高用户的学习效果。此外，家教机具有的满意度等级评价功能，能够督促用户进行思考以及判断家教机的搜索结果是否为自己想要的结果，以帮助用户提高学习能力。

可见，实施图5所描述的家教机能够提高家教机对语音问题的识别准确率，进而提高家教机针对语音问题的搜索结果的正确率；还能够当第一语音信息不是合法用户输入时不对第一语音信息进行内容识别，以降低家教机的功耗；还能够实现在不借助搜索引擎的情况下与用户进行语音交互，进而改善用户体验；还能够提高对用户的语音问题的响应速率，进而提高了对语音问题的搜索效率；还能够督促用户进行思考，帮助用户提高学习能力。

实施例六

请参阅图6，图6是本发明实施例公开的又一种家教机的结构示意图。其中，图6所示的家教机是由图5所示的家教机进行优化得到的。与图5所示的家教机相比较，图6所示的家教机还可以包括：第二确定单元408、优化存储单元409以及第三确定单元410，其中，

第二确定单元408，用于确定目标口音数据库对应的第一声音变化曲线。

本发明实施例中，可选的，第二确定单元408确定目标口音数据库对应的第一声音变化曲线的方式具体可以为：

第二确定单元408确定目标口音数据库对应的用户性别、用户所在区域；

第二确定单元408根据所述用户性别和所述用户所在区域从声音变化曲线数据库中获取第一声音变化曲线(例如，该第一声音变化曲线为广东女性的声音变化曲线，那么该声音变化曲线涵盖所有年龄段的广东女性)。这样能够通过用户的性别和所在区域确定第一声音变化曲线，以提高随着用户年龄的增长对用户输入的语音信息的识别准确率。

本发明实施例中，另一种可选的，第二确定单元408确定目标口音数据库对应的第一声音变化曲线的方式具体可以为：

第二确定单元408根据目标口音数据库以及第一语音信息确定用户的声纹特征，并基于口音大数据分析声纹特征，进而生成第一声音变化曲线。这样能够通过对用户输入的语音信息进行分析进而生成独一无二的针对该用户的第一声音变化曲线(需要说明的是，该第一声音变化曲线能够展示该用户的每个年龄对应的声纹特征)，提高了随着用户年龄的增长对用户输入的语音信息的识别准确率。

本发明实施例中，在第二确定单元408确定目标口音数据库对应的第一声音变化曲线之后，触发优化存储单元409启动。

优化存储单元409，用于根据第一语音信息对应的第一声音数据优化第一声音变化曲线，得到用户的第二声音变化曲线，并存储第二声音变化曲线。

检测单元401，还用于在优化存储单元409存储第二声音变化曲线之后，检测是否接收到用户输入的第二语音信息。

第三确定单元410，用于在检测单元401接收到第二语音信息之后，确定第二语音信息对应的第二声音数据。

本发明实施例中，在第三确定单元410确定第二语音信息对应的第二声音数据之后，触发判断单元406执行判断第二声音变化曲线中是否存在某声音数据与第二声音数据匹配的操作。

判断单元406，还用于判断第二声音变化曲线中是否存在某声音数据与第二声音数据匹配。

识别单元403，还用于在判断单元406判断出存在某声音数据与第二声音数据匹配之后，根据某声音数据和目标口音数据库识别第二语音信息的语音内容，并将第二语音信息的语音内容作为当前待搜索内容。

可见，实施图6所描述的家教机能够提高家教机对语音问题的识别准确率，进而提高家教机针对语音问题的搜索结果的正确率；还能够当第一语音信息不是合法用户输入时不对第一语音信息进行内容识别，以降低家教机的功耗；还能够实现在不借助搜索引擎的情况下与用户进行语音交互，进而改善用户体验；还能够提高对用户的语音问题的响应速率，进而提高了对语音问题的搜索效率；还能够督促用户进行思考，帮助用户提高学习能力；还能够提高随着用户年龄的增长对用户输入的语音信息的识别准确率。

实施例七

请参阅图7，图7是本发明实施例公开的又一种家教机的结构示意图。如图7所示，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。

参考图7，家教机包括：射频(Radio Frequency，RF)电路710、存储器720、输入单元730、显示单元740、传感器750、音频电路760、无线保真(wireless fidelity，WiFi)模块770、处理器780、电源790以及摄像头(未图示)等部件。本领域技术人员可以理解，图7中示出的家教机结构并不构成对家教机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图7对家教机的各个构成部件进行具体的介绍：

RF电路710可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器780处理；另外，将设计上行的数据发送给基站。通常，RF电路710包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier，LNA)、双工器等。此外，RF电路710还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯***(GlobalSystem of Mobile communication，GSM)、通用分组无线服务(General Packet RadioService，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。

存储器720可用于存储软件程序以及模块，处理器780通过运行存储在存储器720的软件程序以及模块，从而执行家教机的各种功能应用以及数据处理。存储器720可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据家教机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器720可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元730可用于接收输入的数字或字符信息，以及产生与家教机的用户设置以及功能控制有关的键信号输入。具体地，输入单元730可包括触控面板731以及其他输入设备732。触控面板731，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板731上或在触控面板731附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板731可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器780，并能接收处理器780发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板731。除了触控面板731，输入单元730还可以包括其他输入设备732。具体地，其他输入设备732可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元740可用于显示由用户输入的信息或提供给用户的信息以及家教机的各种菜单。显示单元740可包括显示面板741，可选的，可以采用液晶显示器(Liquid CrystalDisplay，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板741。进一步的，触控面板731可覆盖显示面板741，当触控面板731检测到在其上或附近的触摸操作后，传送给处理器780以确定触摸事件的类型，随后处理器780根据触摸事件的类型在显示面板741上提供相应的视觉输出。虽然在图7中，触控面板731与显示面板741是作为两个独立的部件来实现家教机的输入和输入功能，但是在某些实施例中，可以将触控面板731与显示面板741集成而实现家教机的输入和输出功能。

家教机还可包括至少一种传感器750，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板741的亮度，接近传感器可在家教机移动到耳边时，关闭显示面板741和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别家教机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于家教机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路760、扬声器761，传声器762可提供用户与家教机之间的音频接口。音频电路760可将接收到的音频数据转换后的电信号，传输到扬声器761，由扬声器761转换为声音信号输出；另一方面，传声器762将收集的声音信号转换为电信号，由音频电路760接收后转换为音频数据，再将音频数据输出处理器780处理后，经RF电路710以发送给比如另一家教机，或者将音频数据输出至存储器720以便进一步处理。

WiFi属于短距离无线传输技术，家教机通过WiFi模块770可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图7示出了WiFi模块770，但是可以理解的是，其并不属于家教机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器780是家教机的控制中心，利用各种接口和线路连接整个家教机的各个部分，通过运行或执行存储在存储器720内的软件程序和/或模块，以及调用存储在存储器720内的数据，执行家教机的各种功能和处理数据，从而对家教机进行整体监控。可选的，处理器780可包括一个或多个处理单元；优选的，处理器780可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器780中。

家教机还包括给各个部件供电的电源790(比如电池)，优选的，电源可以通过电源管理***与处理器780逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。

尽管未示出，家教机还可以包括蓝牙模块等，在此不再赘述。

在本发明实施例中，该家教机所包括的处理器780调用存储在存储器720内的软件程序具体执行以下操作：

检测是否接收到用户输入的第一语音信息；

在接收到第一语音信息之后，根据第一语音信息，从预先获取到的总口音数据库中确定与输入第一语音信息的用户的口音所对应的目标口音数据库；总口音数据库是基于与预设统计维度相匹配的用户的口音形成的，预设统计维度包括区域；

根据目标口音数据库识别第一语音信息的语音内容，作为用户的待搜索内容。

可见，实施图7所描述的家教机能够提高家教机对语音问题的识别准确率，进而提高家教机针对语音问题的搜索结果的正确率。

以上所述，以上实施例仅用以说明本申请的技术方案而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，然而本领域的普通技术人员应当理解；其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种基于语音搜索的识别方法，其特征在于，所述方法包括：

家教机检测是否接收到用户输入的第一语音信息；

2.根据权利要求1所述的方法，其特征在于，所述预设统计维度还包括年龄以及性别；

3.根据权利要求2所述的方法，其特征在于，所述家教机根据所述目标口音数据库识别所述第一语音信息的语音内容，作为用户的待搜索内容之后，所述方法还包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述家教机存储所述第二声音变化曲线之后，所述方法还包括：

所述家教机检测是否接收到用户输入的第二语音信息；

6.一种家教机，其特征在于，所述家教机包括：

检测单元，用于检测是否接收到用户输入的第一语音信息；

7.根据权利要求6所述的家教机，其特征在于，所述预设统计维度还包括年龄以及性别；

8.根据权利要求7所述的家教机，其特征在于，所述家教机还包括：

9.根据权利要求6～8任一项所述的家教机，其特征在于，所述家教机还包括：

10.根据权利要求9所述的家教机，其特征在于，

所述检测单元，还用于在所述优化存储单元存储所述第二声音变化曲线之后，检测是否接收到用户输入的第二语音信息；

所述家教机还包括：