CN106710592A

CN106710592A - 一种智能硬件设备中的语音识别纠错方法和装置

Info

Publication number: CN106710592A
Application number: CN201611246867.0A
Authority: CN
Inventors: 杨英; 张倩倩
Original assignee: Beijing Qihoo Technology Co Ltd
Current assignee: Beijing Qihoo Technology Co Ltd
Priority date: 2016-12-29
Filing date: 2016-12-29
Publication date: 2017-05-24
Anticipated expiration: 2036-12-29
Also published as: WO2018121275A1; CN106710592B

Abstract

本发明公开了一种智能硬件设备中的语音识别纠错方法和装置。其中方法包括：将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息；从所述文字信息中提取关键词；将所提取的关键词与智能硬件业务相关的词表进行匹配，从词表中选出与所述关键词匹配的一个或多个候选词语；根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理。该技术方案充分考虑了智能硬件的功能特性，利用预设的业务相关词表对语音识别结果中解析出的关键词进行智能纠错，显著提升了语音识别的准确度，并且占用的资源较少，符合智能硬件设备低能耗的需求。

Description

一种智能硬件设备中的语音识别纠错方法和装置

技术领域

本发明涉及语音识别技术领域，具体涉及一种智能硬件设备中的语音识别纠错方法和装置。

背景技术

语音识别技术的发展使得用户与智能硬件设备(如智能手表、手机、行车记录仪)的交互变得更加便捷。下面给出了现有技术中，用户利用语音识别技术与智能硬件设备进行交互的几种示例：

1)通过语音识别技术将用户的指令转化为文字；

2)通过语义分析技术理解用户意图；

3)通过语音合成技术将找到的文字资源转化成语音，反馈给用户。

其中，语义分析的过程很依赖语音识别的准确率，而语音识别准确率难以达到100％，例如用户是儿童时，其吐字不清晰的特点会使语音识别出现各种各样的错误。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的智能硬件设备中的语音识别纠错方法和装置。

依据本发明的一个方面，提供了一种智能硬件设备中的语音识别纠错方法，包括：

将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息；

从所述文字信息中提取关键词；

将所提取的关键词与智能硬件业务相关的词表进行匹配，从词表中选出与所述关键词匹配的一个或多个候选词语；

根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理。

可选地，该方法进一步包括：预先设置一个或多个与所述智能硬件设备的业务语音交互关联的一个或多个固定句式；在每个固定句式中标记关键词的位置；

所述从所述文字信息中提取关键词包括：将所述文字信息与所述一个或多个固定句式进行匹配；根据相匹配的固定句式中标记的关键词的位置，从所述文字信息的相应位置提取关键词。

可选地，该方法进一步包括：为每个固定句式中的关键词标记类型信息；确定智能硬件业务相关的词表的类型信息；

所述将所提取的关键词与智能硬件业务相关的词表进行匹配包括：根据相匹配的固定句式中的关键词的类型信息确定所提取的关键词的类型信息，根据所提取的关键词的类型信息将所提取的关键词与类型匹配的词表进行匹配。

可选地，所述根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理包括：

对所选出的与所述关键词匹配的每个候选词句，根据所提取关键词与该候选词语的匹配度为该候选词语打分；

如果所述关键词的最高分候选词的分数高于或等于第一置信度值，则用该最高分候选词纠正所述关键词；

如果所述关键词的最高分候选词的分数高于第二置信度值但低于第一置信度值，则与用户进行进一步的语音对话，以确认是否需要用该最高分候选词纠正所述关键词；

如果所述关键词的最高分候选词的分数低于或等于第二置信度值，不进行纠正。

可选地，所述根据所提取关键词与该候选词语的匹配度为该候选词语打分包括：

将分数从高到低划分为高、中、低三个档位范围；

如果关键词与该候选词的拼音相同，只是音调不同，则在高档位范围内打分；

如果关键词与该候选词的拼音中的声母或韵母部分相同，则在中档位范围内打分；

如果关键词与该候选词的拼音中的声母、韵母都不相同，则在低档位范围内打分。

可选地，该方法进一步包括：

如果从所述文字信息中提取了多个关键词，则将各关键词的最高分候选词的分数相乘，得到该多个关键词的分数；

如果多个关键词的分数高于或等于第三置信度值，则用各关键词的最高分候选词纠正所述各关键词；

如果多个关键词的分数高于第四置信度值但低于第三置信度值，则与用户进行进一步的语音对话，以确认是否需要各关键词的最高分候选词纠正所述各关键词；

如果多个关键词的分数低于或等于第四置信度值，不进行纠正。

可选地，该方法进一步包括：

根据纠正处理结果输出所述智能硬件设备的相应业务服务。

依据本发明的另一方面，提供了一种智能硬件设备中的语音识别纠错装置，包括：

语音识别单元，适于将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息；

关键词提取单元，适于从所述文字信息中提取关键词；

匹配单元，适于将所提取的关键词与智能硬件业务相关的词表进行匹配，从词表中选出与所述关键词匹配的一个或多个候选词语；

纠错单元，适于根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理。

可选地，该装置进一步包括：配置单元，适于预先设置一个或多个与所述智能硬件设备的业务语音交互关联的一个或多个固定句式；在每个固定句式中标记关键词的位置；

所述关键词提取单元，适于将所述文字信息与所述一个或多个固定句式进行匹配；根据相匹配的固定句式中标记的关键词的位置，从所述文字信息的相应位置提取关键词。

可选地，所述配置单元，进一步适于为每个固定句式中的关键词标记类型信息；确定智能硬件业务相关的词表的类型信息；

所述匹配单元，适于根据相匹配的固定句式中的关键词的类型信息确定所提取的关键词的类型信息，根据所提取的关键词的类型信息将所提取的关键词与类型匹配的词表进行匹配。

可选地，所述纠错单元，适于对所选出的与所述关键词匹配的每个候选词句，根据所提取关键词与该候选词语的匹配度为该候选词语打分；如果所述关键词的最高分候选词的分数高于或等于第一置信度值，则用该最高分候选词纠正所述关键词；如果所述关键词的最高分候选词的分数高于第二置信度值但低于第一置信度值，则与用户进行进一步的语音对话，以确认是否需要用该最高分候选词纠正所述关键词；如果所述关键词的最高分候选词的分数低于或等于第二置信度值，不进行纠正。

可选地，所述纠错单元，适于将分数从高到低划分为高、中、低三个档位范围；如果关键词与该候选词的拼音相同，只是音调不同，则在高档位范围内打分；如果关键词与该候选词的拼音中的声母或韵母部分相同，则在中档位范围内打分；如果关键词与该候选词的拼音中的声母、韵母都不相同，则在低档位范围内打分。

可选地，所述纠错单元，进一步适于当从所述文字信息中提取了多个关键词时，将各关键词的最高分候选词的分数相乘，得到该多个关键词的分数；如果多个关键词的分数高于或等于第三置信度值，则用各关键词的最高分候选词纠正所述各关键词；如果多个关键词的分数高于第四置信度值但低于第三置信度值，则与用户进行进一步的语音对话，以确认是否需要各关键词的最高分候选词纠正所述各关键词；如果多个关键词的分数低于或等于第四置信度值，不进行纠正。

可选地，该装置进一步包括：

业务服务单元，适于根据纠正处理结果输出所述智能硬件设备的相应业务服务。

由上述可知，本发明的技术方案，首先利用语音识别技术对智能硬件设备收到的语音信号进行语音识别，将其转换为文字信息，再进一步解析文字信息得到其中的若干个关键词，将这些关键词通过与智能硬件业务相关的词表进行匹配，确定一个或多个候选词语，最后利用得到的候选词语对关键词进行纠错。该技术方案充分考虑了智能硬件的功能特性，利用预设的业务相关词表对语音识别结果中解析出的关键词进行智能纠错，显著提升了语音识别的准确度，并且占用的资源较少，符合智能硬件设备低能耗的需求。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了根据本发明一个实施例的一种智能硬件设备中的语音识别纠错方法的流程示意图；

图2示出了根据本发明一个实施例的一种智能硬件设备中的语音识别纠错装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

图1示出了根据本发明一个实施例的一种智能硬件设备中的语音识别纠错方法的流程示意图，如图1所示，该方法包括：

步骤S110，将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息。

其中，智能硬件设备可以是智能手机、智能手表、智能机器人等。语音识别技术是一种正在逐步完善并已投入使用的技术，例如苹果手机中的Siri功能，就可以实现对用户的声音进行语音识别，来执行苹果手机中的打开相机、地图导航等功能。

步骤S120，从文字信息中提取关键词。

例如，用户希望使用儿童手表中的讲故事功能，发出了“我想听故事——小红帽”的语音信号，那么“故事”是与该功能对应的关键词，“小红帽”则是与该功能下的故事分类对应的关键词。也就是说，关键词是与智能硬件业务相关的。因此继续执行下述步骤：

步骤S130，将所提取的关键词与智能硬件业务相关的词表进行匹配，从词表中选出与关键词匹配的一个或多个候选词语。

在实际使用时，用户的发音可能并不标准，这样就导致音不达意，例如，小孩子把“小红帽”说成了“肖红帽”(音)，那么语音识别技术将该语音信号转换的文字消息就可能是“肖红帽”。那么显然该词与“小红帽”是不能完全匹配的，但是二者的相似度非常高，通过人工判断可以得出小孩子实际想表达的就是“小红帽”。但是实际上，语音信号所转换成的文字消息能模糊匹配到的关键词可能是非常多的，例如，故事库中可能还有“小红猫”的故事。那么对于一个关键词而言，从词表中选出的候选词语可能是一个，也可能是多个。

步骤S140，根据所选出的一个或多个候选词语对文字信息中的关键词进行纠错处理。

可见，图1所示的方法，首先利用语音识别技术对智能硬件设备收到的语音信号进行语音识别，将其转换为文字信息，再进一步解析文字信息得到其中的若干个关键词，将这些关键词通过与智能硬件业务相关的词表进行匹配，确定一个或多个候选词语，最后利用得到的候选词语对关键词进行纠错。该技术方案充分考虑了智能硬件的功能特性，利用预设的业务相关词表对语音识别结果中解析出的关键词进行智能纠错，显著提升了语音识别的准确度，并且占用的资源较少，符合智能硬件设备低能耗的需求。

在本发明的一个实施例中，图1所示的方法进一步包括：预先设置一个或多个与智能硬件设备的业务语音交互关联的一个或多个固定句式；在每个固定句式中标记关键词的位置；从文字信息中提取关键词包括：将文字信息与一个或多个固定句式进行匹配；根据相匹配的固定句式中标记的关键词的位置，从文字信息的相应位置提取关键词。

前述实施例中，“我要听故事——肖红帽”就是一种固定句式，可以将其归纳为“我想听故事XXX”，其中的“XXX”对应于一个关键词。又例如，该句子的语义还可以表达为：“我想听肖红帽的故事”，那么对于的固定句式为“我想听XXX的故事”。在智能硬件支持歌曲播放时，用户可以使用“我想听XXX的XXX”这样的句式，例如，“我想听刘德华的忘情水”，等等。

那么显然，将“我想听肖红帽的故事”的文字信息与“我想听XXX的故事”这一固定句式进行匹配，就可以确定“肖红帽”是关键词。进一步地，还可以确定“肖红帽”对应的是故事名称。因此在本发明的一个实施例中，上述方法进一步包括：为每个固定句式中的关键词标记类型信息；确定智能硬件业务相关的词表的类型信息；将所提取的关键词与智能硬件业务相关的词表进行匹配包括：根据相匹配的固定句式中的关键词的类型信息确定所提取的关键词的类型信息，根据所提取的关键词的类型信息将所提取的关键词与类型匹配的词表进行匹配。

对于“讲故事”这一业务功能而言，与业务相关的词表可以为故事名；对于“歌曲播放”这一业务功能而言，与业务相关的词表可以为歌曲名、歌曲风格、歌手名等。在上一实施例中，可以确定各关键词在固定句式中的位置，那么通过每个位置的关键词对应的类型信息，就可以判断应该使用哪个业务相关的词表来进行候选词语的匹配。对于上一实施例中的“肖红帽”，就可以使用故事名词表来进行匹配；对于“刘德华”，可以使用歌手名词表来进行匹配；对于“忘情水”，可以使用歌曲名词表来进行匹配。

在得到关键词和对应的候选词语后，可以根据候选词语来确定关键词的真正语义。例如，小孩子想听的到底是“小红猫”的故事还是“小红帽”的故事。在本发明的一个实施例中，图1所示的方法中，根据所选出的一个或多个候选词语对文字信息中的关键词进行纠错处理包括：对所选出的与关键词匹配的每个候选词句，根据所提取关键词与该候选词语的匹配度为该候选词语打分；如果关键词的最高分候选词的分数高于或等于第一置信度值，则用该最高分候选词纠正关键词；如果关键词的最高分候选词的分数高于第二置信度值但低于第一置信度值，则与用户进行进一步的语音对话，以确认是否需要用该最高分候选词纠正关键词；如果关键词的最高分候选词的分数低于或等于第二置信度值，不进行纠正。

例如，“肖红帽”对应的候选词有“小红猫”和“小红帽”两个词。“肖红帽”与“小红帽”有两个字相同，只有一个字语音不同；“肖红帽”与“小红猫”有一个字相同，另外两个字语音不同。那么分数结果可能为：“小红帽”的分数为0.6，“小红猫”的分数为0.5。那么以第一置信度值为0.45为例，由于两个候选词语的分数都高于0.45，那么选择其中最高分的候选词语，也就是“小红帽”来纠正“肖红帽”这一关键词。

下面给出了几种对候选词语语进行打分的策略示例：在本发明的一个实施例中，上述方法中，根据所提取关键词与该候选词语的匹配度为该候选词语打分包括：将分数从高到低划分为高、中、低三个档位范围；如果关键词与该候选词的拼音相同，只是音调不同，则在高档位范围内打分；如果关键词与该候选词的拼音中的声母或韵母部分相同，则在中档位范围内打分；如果关键词与该候选词的拼音中的声母、韵母都不相同，则在低档位范围内打分。

举例而言，高档位的分数范围为[0.45,1]，中档位的分数范围为(0.4，0.45)，低档位的分数范围为[0,0.4)。由于“小红猫”和“小红帽”与“肖红帽”属于“拼音相同，只是音调不同”，那么采用高档位的打分标准。试看另一例：部分用户“n”、“l”的声母发音不分，导致将“牛肉”说成了“流肉”，那么由于“牛肉”这一候选词语与“流肉”这一关键词的部分声母不同，韵母部分相同，那么采用中档位的打分标准。再看另一例：用户由于记忆偏差，将“刘德华”记成了“张德华”，那么“刘”和“张”的声母、韵母都不相同，但其余两个字相同，在这种情况下可以采用低档位的打分标准。

那么在获取到候选词语的分数后，就可以依据上一实施例中的方法，判断最高分的候选词语的置信度。例如，“牛肉”的分数为0.44，低于第一置信度值0.45但高于第二置信度值0.4，那么可以询问用户：“你想说的是‘牛肉’吗？”以确认是否需要用“牛肉”纠正“流肉”。如果关键词的最高分候选词的分数低于或等于第二置信度值，不进行纠正，因为这时即使进行纠正，也可能偏离了用户的原意。

在本发明的一个实施例中，上述方法进一步包括：如果从文字信息中提取了多个关键词，则将各关键词的最高分候选词的分数相乘，得到该多个关键词的分数；如果多个关键词的分数高于或等于第三置信度值，则用各关键词的最高分候选词纠正各关键词；如果多个关键词的分数高于第四置信度值但低于第三置信度值，则与用户进行进一步的语音对话，以确认是否需要各关键词的最高分候选词纠正各关键词；如果多个关键词的分数低于或等于第四置信度值，不进行纠正。

在本实施例中给出了当关键词为多个时，如何计算候选词分数的示例。例如，“张德华”的分数为0.3，“忘情水”用户发音很标准，相应的“忘情水”候选词的分数为1，那么这两个关键词的分数为0.3×1＝0.3。

在本发明的一个实施例中，上述方法进一步包括：根据纠正处理结果输出智能硬件设备的相应业务服务。

例如，在不执行本发明技术方案的情况下，小孩子对智能陪护机器人说：“你会讲肖红帽的故事吗？”，由于“肖红帽”与“小红帽”不匹配，小孩子得到的回复为“这个我还不会呢。”这时妈妈重新对智能陪护机器人做出了正确的指令“讲小红帽的故事”，智能陪护机器人正确地获取“小红帽”这个故事的资源，进行语音讲述。

而在本实施例中，由于在小孩子说出“你会讲肖红帽的故事吗？”时，通过语音识别纠正，可以正确地将“肖红帽”纠正为“小红帽”，就可以正确地获取“小红帽”这个故事的资源，进行语音讲述。

图2示出了根据本发明一个实施例的一种智能硬件设备中的语音识别纠错装置的结构示意图，如图2所示，智能硬件设备中的语音识别纠错装置200包括：

语音识别单元210，适于将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息。

关键词提取单元220，适于从文字信息中提取关键词。

匹配单元230，适于将所提取的关键词与智能硬件业务相关的词表进行匹配，从词表中选出与关键词匹配的一个或多个候选词语。

纠错单元240，适于根据所选出的一个或多个候选词语对文字信息中的关键词进行纠错处理。

可见，图2所示的装置，通过各单元的相互配合，首先利用语音识别技术对智能硬件设备收到的语音信号进行语音识别，将其转换为文字信息，再进一步解析文字信息得到其中的若干个关键词，将这些关键词通过与智能硬件业务相关的词表进行匹配，确定一个或多个候选词语，最后利用得到的候选词语对关键词进行纠错。该技术方案充分考虑了智能硬件的功能特性，利用预设的业务相关词表对语音识别结果中解析出的关键词进行智能纠错，显著提升了语音识别的准确度，并且占用的资源较少，符合智能硬件设备低能耗的需求。

在本发明的一个实施例中，上述装置还包括：配置单元，适于预先设置一个或多个与智能硬件设备的业务语音交互关联的一个或多个固定句式；在每个固定句式中标记关键词的位置；关键词提取单元220，适于将文字信息与一个或多个固定句式进行匹配；根据相匹配的固定句式中标记的关键词的位置，从文字信息的相应位置提取关键词。

在本发明的一个实施例中，上述装置中，配置单元，进一步适于为每个固定句式中的关键词标记类型信息；确定智能硬件业务相关的词表的类型信息；匹配单元230，适于根据相匹配的固定句式中的关键词的类型信息确定所提取的关键词的类型信息，根据所提取的关键词的类型信息将所提取的关键词与类型匹配的词表进行匹配。

在本发明的一个实施例中，上述装置中，纠错单元240，适于对所选出的与关键词匹配的每个候选词句，根据所提取关键词与该候选词语的匹配度为该候选词语打分；如果关键词的最高分候选词的分数高于或等于第一置信度值，则用该最高分候选词纠正关键词；如果关键词的最高分候选词的分数高于第二置信度值但低于第一置信度值，则与用户进行进一步的语音对话，以确认是否需要用该最高分候选词纠正关键词；如果关键词的最高分候选词的分数低于或等于第二置信度值，不进行纠正。

在本发明的一个实施例中，上述装置中，纠错单元240，适于将分数从高到低划分为高、中、低三个档位范围；

如果关键词与该候选词的拼音相同，只是音调不同，则在高档位范围内打分；如果关键词与该候选词的拼音中的声母或韵母部分相同，则在中档位范围内打分；如果关键词与该候选词的拼音中的声母、韵母都不相同，则在低档位范围内打分。

在本发明的一个实施例中，上述装置中，纠错单元240，进一步适于当从文字信息中提取了多个关键词时，将各关键词的最高分候选词的分数相乘，得到该多个关键词的分数；如果多个关键词的分数高于或等于第三置信度值，则用各关键词的最高分候选词纠正各关键词；如果多个关键词的分数高于第四置信度值但低于第三置信度值，则与用户进行进一步的语音对话，以确认是否需要各关键词的最高分候选词纠正各关键词；如果多个关键词的分数低于或等于第四置信度值，不进行纠正。

在本发明的一个实施例中，上述装置进一步包括：业务服务单元，适于根据纠正处理结果输出智能硬件设备的相应业务服务。

需要说明的是，上述各装置实施例的具体实施方式与前述对应方法实施例的具体实施方式相同，在此不再赘述。

综上所述，本发明的技术方案，首先利用语音识别技术对智能硬件设备收到的语音信号进行语音识别，将其转换为文字信息，再进一步解析文字信息得到其中的若干个关键词，将这些关键词通过与智能硬件业务相关的词表进行匹配，确定一个或多个候选词语，最后利用得到的候选词语对关键词进行纠错。该技术方案充分考虑了智能硬件的功能特性，利用预设的业务相关词表对语音识别结果中解析出的关键词进行智能纠错，显著提升了语音识别的准确度，并且占用的资源较少，符合智能硬件设备低能耗的需求。

需要说明的是：

在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述，构造这类装置所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的智能硬件设备中的语音识别纠错装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种智能硬件设备中的语音识别纠错方法，其中，该方法包括：

从所述文字信息中提取关键词；

2.如权利要求1所述的方法，其中，

该方法进一步包括：预先设置一个或多个与所述智能硬件设备的业务语音交互关联的一个或多个固定句式；在每个固定句式中标记关键词的位置；

3.如权利要求1或2所述的方法，其中，

该方法进一步包括：为每个固定句式中的关键词标记类型信息；确定智能硬件业务相关的词表的类型信息；

4.如权利要求1-3中任一项所述的方法，其中，所述根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理包括：

5.如权利要求1-4中任一项所述的方法，其中，所述根据所提取关键词与该候选词语的匹配度为该候选词语打分包括：

将分数从高到低划分为高、中、低三个档位范围；

6.如权利要求1-5中任一项所述的方法，其中，该方法进一步包括：

7.如权利要求1-6中任一项所述的方法，其中，该方法进一步包括：

根据纠正处理结果输出所述智能硬件设备的相应业务服务。

8.一种智能硬件设备中的语音识别纠错装置，其中，该装置包括：

关键词提取单元，适于从所述文字信息中提取关键词；

9.如权利要求8所述的装置，其中，该装置进一步包括：配置单元，适于预先设置一个或多个与所述智能硬件设备的业务语音交互关联的一个或多个固定句式；在每个固定句式中标记关键词的位置；

10.如权利要求8或9所述的装置，其中，

所述配置单元，进一步适于为每个固定句式中的关键词标记类型信息；确定智能硬件业务相关的词表的类型信息；