CN105187656A - 通讯录联系人匹配方法和装置 - Google Patents
通讯录联系人匹配方法和装置 Download PDFInfo
- Publication number
- CN105187656A CN105187656A CN201510613491.1A CN201510613491A CN105187656A CN 105187656 A CN105187656 A CN 105187656A CN 201510613491 A CN201510613491 A CN 201510613491A CN 105187656 A CN105187656 A CN 105187656A
- Authority
- CN
- China
- Prior art keywords
- status switch
- converted
- phone sequence
- similarity
- phone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种通讯录联系人匹配方法和装置,其中,通讯录联系人匹配方法包括:获取用户发送的语音信息,并将语音信息识别为文本信息;将文本信息转换为第一音子序列,并根据第一音子序列生成第一状态序列;获取通讯录中的多个联系人信息;分别将多个联系人信息转换为对应的第二音子序列,并根据第二音子序列生成第二状态序列;计算第一状态序列与多个第二状态序列的相似度,并根据相似度对多个第二状态序列进行排序,以及将排名前N名的第二状态序列对应的联系人信息反馈给用户。本发明实施例的通讯录联系人匹配方法和装置,提高了用户语音搜索联系人姓名的准确率。
Description
技术领域
本发明涉及移动终端技术领域,尤其涉及一种通讯录联系人匹配方法和装置。
背景技术
随着科技的不断进步,智能手机已成为人们生活中必不可少的工具,其中,语音识别是智能手机中的一个重要功能。例如:用户说出联系人姓名,即可搜索到通讯录中保存的该联系人对应的联系电话等信息,用户就能够方便快捷地对该联系人进行拨打电话、发短信等操作。
目前,主要通过将用户输入的语音信息转换为拼音字符串,然后与通讯录中保存的联系人姓名对应的字符串进行匹配,选择多个与拼音字符串相似度较高的字符串对应的联系人姓名作为候选,并提供给用户。
但是,上述方法没有考虑到联系人姓名的语言学特征,因此对通讯录中联系人姓名的语音搜索准确率较低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种通讯录联系人匹配方法,该方法能够提高用户语音搜索联系人姓名的准确率。
本发明的第二个目的在于提出一种通讯录联系人匹配装置。
为了实现上述目的,本发明第一方面实施例提出了一种通讯录联系人匹配方法,包括:获取用户发送的语音信息,并将所述语音信息识别为文本信息;将所述文本信息转换为第一音子序列,并根据所述第一音子序列生成第一状态序列;获取通讯录中的多个联系人信息;分别将所述多个联系人信息转换为对应的第二音子序列,并根据所述第二音子序列生成第二状态序列;计算所述第一状态序列与所述多个第二状态序列的相似度,并根据所述相似度对所述多个第二状态序列进行排序,以及将排名前N名的所述第二状态序列对应的联系人信息反馈给所述用户。
本发明实施例的通讯录联系人匹配方法,通过将用户输入的语音信息和通讯录中保存的联系人信息基于声学模型分别转换为第一状态序列和第二状态序列,并计算两者之间的相似度,以及选择与第一状态序列相似度最高的N个第二状态序列,将上述第二状态序列对应的联系人信息反馈给用户,提高了用户语音搜索联系人姓名的准确率。
本发明第二方面实施例提出了一种通讯录联系人匹配装置,包括:第一获取模块,用于获取用户发送的语音信息,并将所述语音信息识别为文本信息;第一生成模块,用于将所述文本信息转换为第一音子序列,并根据所述第一音子序列生成第一状态序列;第二获取模块,用于获取通讯录中的多个联系人信息;第二生成模块,用于分别将所述多个联系人信息转换为对应的多个第二音子序列,并根据所述多个第二音子序列生成对应的多个第二状态序列;反馈模块,用于计算所述第一状态序列与所述多个第二状态序列的相似度,并根据所述相似度对所述多个第二状态序列进行排序,以及将排名前N名的所述第二状态序列对应的联系人信息反馈给所述用户。
本发明实施例的通讯录联系人匹配装置,通过将用户输入的语音信息和通讯录中保存的联系人信息基于声学模型分别转换为第一状态序列和第二状态序列,并计算两者之间的相似度,以及选择与第一状态序列相似度最高的N个第二状态序列,将上述第二状态序列对应的联系人信息反馈给用户,提高了用户语音搜索联系人姓名的准确率。
附图说明
图1是根据本发明一个实施例的通讯录联系人匹配方法的流程图。
图2是根据本发明一个实施例的通讯录联系人匹配装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的通讯录联系人匹配方法和装置。
图1是根据本发明一个实施例的通讯录联系人匹配方法的流程图。
如图1所示,通讯录联系人匹配方法可包括:
S1、获取用户发送的语音信息,并将语音信息识别为文本信息。
其中,语音信息可以是联系人姓名。例如:可将用户输入的联系人姓名转换为文本信息“张三丰”。
S2、将文本信息转换为第一音子序列,并根据第一音子序列生成第一状态序列。
在将语音信息识别为文本信息之后,可将文本信息转换为第一音子序列,然后将第一音子序列转换为三音子模型,并基于隐马尔可夫模型将三音子模型转换为第一状态序列。其中,第一音子序列为声母、韵母和声调的组合。
例如:可将文本信息“张三丰”转换为第一音子序列“silzhang1san1feng1sil”,其中sil为静音音子。然后转换为6个三音子模型sil-zh+ang1、zh-ang1+s、ang1-s+an1、s-an1+f、an1-f+eng1、f-eng1+sil。再基于隐马尔可夫模型将三音子模型转换为第一状态序列,每个音子均可用对应的状态ID表示,例如:sil-zh+ang1表示为(789,12,34)。则第一状态序列为6*3个状态ID。
S3、获取通讯录中的多个联系人信息。
其中,联系人信息可包括联系人姓名。
S4、分别将多个联系人信息转换为对应的第二音子序列,并根据第二音子序列生成第二状态序列。
其中,每个联系人信息均可转换为一个对应的第二音子序列,而每个第二音子序列也均对应一个第二状态序列。具体方法与生成第一状态序列的方法一致,此处不赘述。
S5、计算第一状态序列与多个第二状态序列的相似度,并根据相似度对多个第二状态序列进行排序,以及将排名前N名的第二状态序列对应的联系人信息反馈给用户。
具体地,可计算第一状态序列与每个第二状态序列之间的编辑距离,并按照编辑距离从小到大的顺序对第二状态序列进行排序,然后获得与第一状态序列编辑距离最近的N个第二状态序列例如5个,并将上述第二状态序列对应的联系人信息作为候选结果反馈给用户。用户看到候选结果后,可选择自己所需的结果进行进一步操作,例如拨打电话、发短信等。其中,编辑距离为两个字串之间由一个转成另一个所需的最少编辑操作次数。编辑次数越少,两者相似度越高。
本发明实施例的通讯录联系人匹配方法,通过将用户输入的语音信息和通讯录中保存的联系人信息基于声学模型分别转换为第一状态序列和第二状态序列,并计算两者之间的相似度,以及选择与第一状态序列相似度最高的N个第二状态序列,将上述第二状态序列对应的联系人信息反馈给用户,提高了用户语音搜索联系人姓名的准确率。
为实现上述目的,本发明还提出一种通讯录联系人匹配装置。
图2是根据本发明一个实施例的通讯录联系人匹配装置的结构示意图。
如图2所示,通讯录联系人匹配装置可包括:第一获取模块110、第一生成模块120、第二获取模块130、第二生成模块140和反馈模块150。
第一获取模块110用于获取用户发送的语音信息,并将语音信息识别为文本信息。其中,语音信息可以是联系人姓名。例如:可将用户输入的联系人姓名转换为文本信息“张三丰”。
第一生成模块120用于将文本信息转换为第一音子序列,并根据第一音子序列生成第一状态序列。
在将语音信息识别为文本信息之后,第一生成模块120可将文本信息转换为第一音子序列,然后将第一音子序列转换为三音子模型,并基于隐马尔可夫模型将三音子模型转换为第一状态序列。其中,第一音子序列为声母、韵母和声调的组合。
例如:可将文本信息“张三丰”转换为第一音子序列“silzhang1san1feng1sil”,其中sil为静音音子。然后转换为6个三音子模型sil-zh+ang1、zh-ang1+s、ang1-s+an1、s-an1+f、an1-f+eng1、f-eng1+sil。再基于隐马尔可夫模型将三音子模型转换为第一状态序列,每个音子均可用对应的状态ID表示,例如:sil-zh+ang1表示为(789,12,34)。则第一状态序列为6*3个状态ID。
第二获取模块130用于获取通讯录中的多个联系人信息。
其中,联系人信息可包括联系人姓名。
第二生成模块140用于分别将多个联系人信息转换为对应的多个第二音子序列,并根据多个第二音子序列生成对应的多个第二状态序列。
其中,每个联系人信息均可转换为一个对应的第二音子序列,而每个第二音子序列也均对应一个第二状态序列。具体方法与生成第一状态序列的方法一致,此处不赘述。
反馈模块150用于计算第一状态序列与多个第二状态序列的相似度,并根据相似度对多个第二状态序列进行排序,以及将排名前N名的第二状态序列对应的联系人信息反馈给用户。
具体地,反馈模块150可计算第一状态序列与每个第二状态序列之间的编辑距离,并按照编辑距离从小到大的顺序对第二状态序列进行排序,然后获得与第一状态序列编辑距离最近的N个第二状态序列例如5个,并将上述第二状态序列对应的联系人信息作为候选结果反馈给用户。用户看到候选结果后,可选择自己所需的结果进行进一步操作,例如拨打电话、发短信等。其中,编辑距离为两个字串之间由一个转成另一个所需的最少编辑操作次数。编辑次数越少,两者相似度越高。
本发明实施例的通讯录联系人匹配装置,通过将用户输入的语音信息和通讯录中保存的联系人信息基于声学模型分别转换为第一状态序列和第二状态序列,并计算两者之间的相似度,以及选择与第一状态序列相似度最高的N个第二状态序列,将上述第二状态序列对应的联系人信息反馈给用户,提高了用户语音搜索联系人姓名的准确率。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (8)
1.一种通讯录联系人匹配方法,其特征在于,包括以下步骤:
获取用户发送的语音信息,并将所述语音信息识别为文本信息;
将所述文本信息转换为第一音子序列,并根据所述第一音子序列生成第一状态序列;
获取通讯录中的多个联系人信息;
分别将所述多个联系人信息转换为对应的第二音子序列,并根据所述第二音子序列生成第二状态序列;
计算所述第一状态序列与所述多个第二状态序列的相似度,并根据所述相似度对所述多个第二状态序列进行排序,以及将排名前N名的所述第二状态序列对应的联系人信息反馈给所述用户。
2.如权利要求1所述的方法,其特征在于,所述根据所述第一音子序列生成第一状态序列,包括:
将所述第一音子序列转换为三音子模型,并基于隐马尔可夫模型将所述三音子模型转换为所述第一状态序列。
3.如权利要求1所述的方法,其特征在于,所述计算所述第一状态序列与所述多个第二状态序列的相似度,包括:
计算所述第一状态序列与每个所述第二状态序列之间的编辑距离。
4.如权利要求3所述的方法,其特征在于,所述根据所述相似度对所述多个第二状态序列进行排序,包括:
根据所述编辑距离从小到大的顺序对所述多个第二状态序列进行排序。
5.一种通讯录联系人匹配装置,其特征在于,包括:
第一获取模块,用于获取用户发送的语音信息,并将所述语音信息识别为文本信息;
第一生成模块,用于将所述文本信息转换为第一音子序列,并根据所述第一音子序列生成第一状态序列;
第二获取模块,用于获取通讯录中的多个联系人信息;
第二生成模块,用于分别将所述多个联系人信息转换为对应的多个第二音子序列,并根据所述多个第二音子序列生成对应的多个第二状态序列;
反馈模块,用于计算所述第一状态序列与所述多个第二状态序列的相似度,并根据所述相似度对所述多个第二状态序列进行排序,以及将排名前N名的所述第二状态序列对应的联系人信息反馈给所述用户。
6.如权利要求5所述的装置,其特征在于,所述第一生成模块,具体用于:
将所述第一音子序列转换为三音子模型,并基于隐马尔可夫模型将所述三音子模型转换为所述第一状态序列。
7.如权利要求5所述的装置,其特征在于,所述反馈模块,具体用于:
计算所述第一状态序列与每个所述第二状态序列之间的编辑距离。
8.如权利要求7所述的装置,其特征在于,所述反馈模块,具体用于:
根据所述编辑距离从小到大的顺序对所述多个第二状态序列进行排序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510613491.1A CN105187656B (zh) | 2015-09-23 | 2015-09-23 | 通讯录联系人匹配方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510613491.1A CN105187656B (zh) | 2015-09-23 | 2015-09-23 | 通讯录联系人匹配方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105187656A true CN105187656A (zh) | 2015-12-23 |
CN105187656B CN105187656B (zh) | 2018-09-07 |
Family
ID=54909493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510613491.1A Active CN105187656B (zh) | 2015-09-23 | 2015-09-23 | 通讯录联系人匹配方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105187656B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107707745A (zh) * | 2017-09-25 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 用于提取信息的方法和装置 |
CN109671436A (zh) * | 2018-12-07 | 2019-04-23 | 陈包容 | 智能语音识别通讯录联系人人名的方法 |
CN110390015A (zh) * | 2019-07-23 | 2019-10-29 | 中国工商银行股份有限公司 | 一种数据信息处理方法、装置及*** |
CN111312226A (zh) * | 2020-02-17 | 2020-06-19 | 出门问问信息科技有限公司 | 一种语音识别方法、设备及计算机可读存储介质 |
CN113470645A (zh) * | 2021-06-30 | 2021-10-01 | 百度在线网络技术(北京)有限公司 | 呼叫处理的方法、装置、设备以及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103456297A (zh) * | 2012-05-29 | 2013-12-18 | ***通信集团公司 | 一种语音识别匹配的方法和设备 |
US20140163994A1 (en) * | 2012-12-06 | 2014-06-12 | Qnx Software Systems Limited | Method of identifying contacts for initiating a communication using speech recognition |
CN104469002A (zh) * | 2014-12-02 | 2015-03-25 | 科大讯飞股份有限公司 | 确定手机联系人的方法和装置 |
CN104598527A (zh) * | 2014-12-26 | 2015-05-06 | 盈世信息科技(北京)有限公司 | 一种语音搜索方法及装置 |
-
2015
- 2015-09-23 CN CN201510613491.1A patent/CN105187656B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103456297A (zh) * | 2012-05-29 | 2013-12-18 | ***通信集团公司 | 一种语音识别匹配的方法和设备 |
US20140163994A1 (en) * | 2012-12-06 | 2014-06-12 | Qnx Software Systems Limited | Method of identifying contacts for initiating a communication using speech recognition |
CN104469002A (zh) * | 2014-12-02 | 2015-03-25 | 科大讯飞股份有限公司 | 确定手机联系人的方法和装置 |
CN104598527A (zh) * | 2014-12-26 | 2015-05-06 | 盈世信息科技(北京)有限公司 | 一种语音搜索方法及装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107707745A (zh) * | 2017-09-25 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 用于提取信息的方法和装置 |
US20190096402A1 (en) * | 2017-09-25 | 2019-03-28 | Baidu Online Network Technology (Beijing) Co., Ltd | Method and apparatus for extracting information |
US11217236B2 (en) * | 2017-09-25 | 2022-01-04 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and apparatus for extracting information |
CN109671436A (zh) * | 2018-12-07 | 2019-04-23 | 陈包容 | 智能语音识别通讯录联系人人名的方法 |
CN110390015A (zh) * | 2019-07-23 | 2019-10-29 | 中国工商银行股份有限公司 | 一种数据信息处理方法、装置及*** |
CN111312226A (zh) * | 2020-02-17 | 2020-06-19 | 出门问问信息科技有限公司 | 一种语音识别方法、设备及计算机可读存储介质 |
CN113470645A (zh) * | 2021-06-30 | 2021-10-01 | 百度在线网络技术(北京)有限公司 | 呼叫处理的方法、装置、设备以及存储介质 |
CN113470645B (zh) * | 2021-06-30 | 2024-05-28 | 百度在线网络技术(北京)有限公司 | 呼叫处理的方法、装置、设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN105187656B (zh) | 2018-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105187656A (zh) | 通讯录联系人匹配方法和装置 | |
US10339925B1 (en) | Generation of automated message responses | |
US9742912B2 (en) | Method and apparatus for predicting intent in IVR using natural language queries | |
CN107016994B (zh) | 语音识别的方法及装置 | |
KR100597110B1 (ko) | 사전 데이터 압축 방법 | |
US10319365B1 (en) | Text-to-speech processing with emphasized output audio | |
JP4769223B2 (ja) | テキスト発音記号変換辞書作成装置、認識語彙辞書作成装置、及び音声認識装置 | |
KR100769029B1 (ko) | 다언어의 이름들의 음성 인식을 위한 방법 및 시스템 | |
EP1267326B1 (en) | Artificial language generation | |
US20080126093A1 (en) | Method, Apparatus and Computer Program Product for Providing a Language Based Interactive Multimedia System | |
CN100403828C (zh) | 一种便携式数字移动通讯设备及其语音控制方法和*** | |
CN102549652A (zh) | 信息检索装置、信息检索方法及导航*** | |
CN101567189A (zh) | 声音识别结果修正装置、方法以及*** | |
CN103064530A (zh) | 输入处理方法和装置 | |
CN112580335A (zh) | 多音字消歧方法及装置 | |
CN102651218A (zh) | 用于创建语音标签的方法以及设备 | |
TWI660340B (zh) | 聲控方法及系統 | |
GB2376554A (en) | Artificial language generation and evaluation | |
JP3948260B2 (ja) | テキスト入力方法及びその装置 | |
JP2012168349A (ja) | 音声認識システムおよびこれを用いた検索システム | |
KR101250897B1 (ko) | 전자사전에서 음성인식을 이용한 단어 탐색 장치 및 그 방법 | |
KR100910302B1 (ko) | 멀티모달 기반의 정보 검색 장치 및 방법 | |
CN1979636B (zh) | 一种音标到语音的转换方法 | |
JP2003141113A (ja) | 翻訳装置、音声翻訳方法、およびプログラム | |
CN1604185B (zh) | 利用可变长子字的语音合成***和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |