CN111312252A - 一种通过ai语音邀请通讯录人员的方法 - Google Patents
一种通过ai语音邀请通讯录人员的方法 Download PDFInfo
- Publication number
- CN111312252A CN111312252A CN202010168217.9A CN202010168217A CN111312252A CN 111312252 A CN111312252 A CN 111312252A CN 202010168217 A CN202010168217 A CN 202010168217A CN 111312252 A CN111312252 A CN 111312252A
- Authority
- CN
- China
- Prior art keywords
- voice
- intention
- contact
- client
- inviting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000006399 behavior Effects 0.000 claims abstract description 16
- 238000004458 analytical method Methods 0.000 claims abstract description 15
- 230000005540 biological transmission Effects 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种通过AI语音邀请通讯录人员的方法,客户端采集语音数据通过网络连接传递到语音识别模块,识别出文本内容;将识别出的文本内容通过网络连接传递给意图解析模块,分析出意图行为和内容;所述意图解析模块返回分析结果到客户端,所述客户端根据意图行为和内容在通讯录中查找与之匹配的联系人信息;找到通讯录中的联系人后,通过网络传输发送到后端服务器,所述后端服务器根据客户端设备唯一识别ID,将邀请信息推送到被邀请的客户端设备上。本发明可以应用于多种场合(例如开车),无需手动邀请通讯录中的好友,从而大大提高了安全性。
Description
技术领域
本发明涉及一种通过AI语音邀请通讯录人员的方法,属于智能终端技术领域。
背景技术
在智能终端上,邀请好友的方式被应用在很多APP中,我们可以通过多次屏幕点击操作,就可以将邀请消息发送给通讯录中的好友,但是在一些特殊的场景下,比如在开车场景下,手动去邀请通讯录中的好友就会增加安全风险。
发明内容
针对现有技术存在的不足,本发明目的是提供一种应用于特殊场景下的通过AI语音邀请通讯录人员的方法,安全风险低。
为了实现上述目的,本发明是通过如下的技术方案来实现:
本发明的一种通过AI语音邀请通讯录人员的方法,客户端采集语音数据通过网络连接传递到语音识别模块,识别出文本内容;
将识别出的文本内容通过网络连接传递给意图解析模块,分析出意图行为和内容;
所述意图解析模块返回分析结果到客户端,所述客户端根据意图行为和内容在通讯录中查找与之匹配的联系人信息;
找到通讯录中的联系人后,通过网络传输发送到后端服务器,所述后端服务器根据客户端设备唯一识别ID,将邀请信息推送到被邀请的客户端设备上。
在所述客户端采集语音数据之前或同时,还包括,所述客户端会访问通讯录所有联系人的姓名,组成一个词库,在后续检索时用于缩小检索范围,提高人名识别的准确率。
上述语音识别模块具体处理方法如下:
预处理;
提取特征参数;
匹配模式。
上述预处理具体包括预滤波、采样、量化、加窗、端点检测和预加重步骤。
提取的特征参数必须满足以下要求:
(1)提取的特征参数能有效地代表语音特征,具有区分性;
(2)各阶参数之间有独立性;
(3)特征参数要计算方便,以保证语音识别的实时实现。
上述述模式匹配方法如下:先对***中的每个字,做一个码本作为该字的参考模板,共有M个字,故共有M个码本,组成一个模板库;识别时,对于任意输入的语音特征矢量序列X={X1,X2,…,XN},计算该序列中每一个特征矢量对模板库中的每个码本的总平均失真量误差,找出最小的失真误差对应的码本,将对应的字输出作为识别的结果。
上述意图解析模块分析出意图行为和内容,AI模块可以进行训练,可以把关键词邀请作为一种行为,邀请后的内容作为被邀请的对象,具体方法如下:
对识别出的文本内容进行分类,分成强意图、弱意图,使用规则模块解析和意图词表的方式解析意图;
如果有邀请强意图,进入下一步姓名匹配;如果未解析到邀请意图,需要重新语音录入收集。
上述客户端接收到意图解析的结果后,根据其结果匹配通讯录联系人信息,具体的方法如下:
找到通讯录中最匹配的联系人,通过网络传输发送到后端服务器,所述后端服务器再通过消息推送服务,把邀请消息发送到被邀请人移动端设备上;邀请会产生3种结果,匹配到多个联系人、一个联系人、未匹配到联系人;多个联系人时,选择邀请第几个联系人;只有一个联系人时,则默认邀请;通讯录中没有被邀请人时,及时给予文字和语音提示。
本发明将通讯录中所有的人员姓名作为语音的基础库,利用语音识别将话术转为文字,接着在AI模块训练邀请的意图,把语音转成的文字传递给AI模块,返回邀请的意图和姓名,然后在基础库中进行匹配,通过文字和首字母进行模糊匹配,最终的结果会有1条或多条的匹配结果,本发明可以应用于多种场合(例如开车与导航),无需手动邀请通讯录中的好友,从而大大提高了安全性。
附图说明
图1为一种通过AI语音邀请通讯录人员的方法的工作流程图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
通过AI语音邀请通讯录人员的方法:将通讯录中所有的人员姓名作为语音的基础库,利用语音识别技术(第三方)将话术转为文字,接着在AI模块(第三方)训练邀请的意图,把语音转成的文字传递给AI模块,返回邀请的意图和姓名,然后在基础库中进行匹配,通过文字和首字母进行模糊匹配,最终的结果会有1条或多条的匹配结果。
参见图1,一种通过AI语音邀请通讯录人员的方法,,客户端采集语音数据通过网络连接传递到语音识别模块进行处理。
在所述语音识别模块处理完成之后,将识别出的文本内容通过网络连接传递给意图解析模块,分析出意图行为和内容,并返回分析结果到客户端,客户端根据意图行为和内容在通讯录中查找与之匹配的联系人信息。
在客户端采集语音数据之前或同时,还包括,客户端会访问通讯录所有联系人的姓名,组成一个词库,后续在检索时用于缩小检索范围,提高人名识别的准确率。
客户端采集语音数据通过网络连接传递到语音识别模块进行处理包括:
语音信号的预处理、特征提取、模式匹配几个部分。预处理包括预滤波、采样和量化、加窗、端点检测、预加重等过程。语音信号识别最重要的一环就是特征参数提取。提取的特征参数必须满足以下的要求:
(1)提取的特征参数能有效地代表语音特征,具有很好的区分性;
(2)各阶参数之间有良好的独立性;
(3)特征参数要计算方便,以保证语音识别的实时实现。
客户端采集语音数据通过网络连接传递到语音识别模块处理后还包含:
将语音识别的结果内容进行解析,意图解析本质上是对信息进行分类的过程,存在强意图、弱意图,使用规则模块解析和意图词表的方式解析意图。如果有邀请意图,进入下一步姓名匹配,如果未解析到邀请意图,需要重新语音录入收集,再走一遍流程,表述清楚意图。
客户端接收到意图解析的结果后,根据其结果匹配通讯录联系人信息的过程包括:
找到通讯录中最匹配的联系人,通过网络传输发送到后端服务器,服务器再通过消息推送服务,把邀请消息发送到被邀请人移动端设备上;这边邀请会产生3中结果,匹配到多个联系人、一个联系人、未匹配到联系人。多个联系人的情况可以选择邀请第几个联系人,如果只有一个联系人,则默认邀请;如果通讯录中没有被邀请人,及时给予文字和语音提示;
找到通讯录中的联系人后,通过网络传输发送到后端服务器,服务器再通过消息推送服务还包括:
消息推送服务会根据客户端设备唯一识别ID,通过网络服务协议,将邀请信息推送到被邀请的客户端设备上。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (8)
1.一种通过AI语音邀请通讯录人员的方法,其特征在于:客户端采集语音数据通过网络连接传递到语音识别模块,识别出文本内容;
将识别出的文本内容通过网络连接传递给意图解析模块,分析出意图行为和内容;
所述意图解析模块返回分析结果到客户端,所述客户端根据意图行为和内容在通讯录中查找与之匹配的联系人信息;
找到通讯录中的联系人后,通过网络传输发送到后端服务器,所述后端服务器根据客户端设备唯一识别ID,将邀请信息推送到被邀请的客户端设备上。
2.根据权利要求1所述的通过AI语音邀请通讯录人员的方法,其特征在于:在所述客户端采集语音数据之前或同时,还包括,所述客户端会访问通讯录所有联系人的姓名,组成一个词库,在后续检索时用于缩小检索范围。
3.根据权利要求1所述的通过AI语音邀请通讯录人员的方法,其特征在于:所述语音识别模块具体处理方法如下:
预处理;
提取特征参数;
匹配模式。
4.根据权利要求3所述的通过AI语音邀请通讯录人员的方法,其特征在于:所述预处理具体包括预滤波、采样、量化、加窗、端点检测和预加重步骤。
5.根据权利要求3所述的通过AI语音邀请通讯录人员的方法,其特征在于:提取的特征参数必须满足以下要求:
(1)提取的特征参数能有效地代表语音特征,具有区分性;
(2)各阶参数之间有独立性;
(3)特征参数要计算方便,以保证语音识别的实时实现。
6.根据权利要求3所述的通过AI语音邀请通讯录人员的方法,其特征在于:所述模式匹配方法如下:先对***中的每个字,做一个码本作为该字的参考模板,共有M个字,故共有M个码本,组成一个模板库;识别时,对于任意输入的语音特征矢量序列X={X1,X2,…,XN},计算该序列中每一个特征矢量对模板库中的每个码本的总平均失真量误差,找出最小的失真误差对应的码本,将对应的字输出作为识别的结果。
7.根据权利要求1所述的通过AI语音邀请通讯录人员的方法,其特征在于:所述意图解析模块分析出意图行为和内容,AI模块可以进行训练,可以把关键词邀请作为一种行为,邀请后的内容作为被邀请的对象,具体方法如下:
对识别出的文本内容进行分类,分成强意图、弱意图,使用规则模块解析和意图词表的方式解析意图;
如果有邀请强意图,进入下一步姓名匹配;如果未解析到邀请意图,需要重新语音录入收集。
8.根据权利要求1所述的通过AI语音邀请通讯录人员的方法,其特征在于:所述客户端接收到意图解析的结果后,根据其结果匹配通讯录联系人信息,具体的方法如下:
找到通讯录中最匹配的联系人,通过网络传输发送到后端服务器,所述后端服务器再通过消息推送服务,把邀请消息发送到被邀请人移动端设备上;邀请会产生3种结果,匹配到多个联系人、一个联系人、未匹配到联系人;多个联系人时,选择邀请第几个联系人;只有一个联系人时,则默认邀请;通讯录中没有被邀请人时,及时给予文字和语音提示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010168217.9A CN111312252A (zh) | 2020-03-11 | 2020-03-11 | 一种通过ai语音邀请通讯录人员的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010168217.9A CN111312252A (zh) | 2020-03-11 | 2020-03-11 | 一种通过ai语音邀请通讯录人员的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111312252A true CN111312252A (zh) | 2020-06-19 |
Family
ID=71162261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010168217.9A Pending CN111312252A (zh) | 2020-03-11 | 2020-03-11 | 一种通过ai语音邀请通讯录人员的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111312252A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113489762A (zh) * | 2021-06-17 | 2021-10-08 | 南京爱沓信息技术有限公司 | 一种人工智能化语音邀请共享导航的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080243853A1 (en) * | 2007-03-30 | 2008-10-02 | Verizon Services Corp. | Method and system for notifying an invitee user when an inviting user accesses a social networking application |
CN101593519A (zh) * | 2008-05-29 | 2009-12-02 | 夏普株式会社 | 检测语音关键词的方法和设备及检索方法和*** |
CN107680598A (zh) * | 2017-09-04 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 基于好友声纹通讯录的信息交互方法、装置及其设备 |
CN108665890A (zh) * | 2017-03-28 | 2018-10-16 | 三星电子株式会社 | 操作语音识别服务的方法、电子设备和支持该设备的*** |
CN109830234A (zh) * | 2019-03-19 | 2019-05-31 | 深圳市尼欧科技有限公司 | 一种智能车载信息交互设备及交互方法 |
-
2020
- 2020-03-11 CN CN202010168217.9A patent/CN111312252A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080243853A1 (en) * | 2007-03-30 | 2008-10-02 | Verizon Services Corp. | Method and system for notifying an invitee user when an inviting user accesses a social networking application |
CN101593519A (zh) * | 2008-05-29 | 2009-12-02 | 夏普株式会社 | 检测语音关键词的方法和设备及检索方法和*** |
CN108665890A (zh) * | 2017-03-28 | 2018-10-16 | 三星电子株式会社 | 操作语音识别服务的方法、电子设备和支持该设备的*** |
CN107680598A (zh) * | 2017-09-04 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 基于好友声纹通讯录的信息交互方法、装置及其设备 |
CN109830234A (zh) * | 2019-03-19 | 2019-05-31 | 深圳市尼欧科技有限公司 | 一种智能车载信息交互设备及交互方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113489762A (zh) * | 2021-06-17 | 2021-10-08 | 南京爱沓信息技术有限公司 | 一种人工智能化语音邀请共享导航的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111488433B (zh) | 一种适用于银行的提升现场体验感的人工智能交互*** | |
US10777207B2 (en) | Method and apparatus for verifying information | |
US8135579B2 (en) | Method of analyzing conversational transcripts | |
CN110459210A (zh) | 基于语音分析的问答方法、装置、设备及存储介质 | |
CN112468659B (zh) | 应用于电话客服的质量评价方法、装置、设备及存储介质 | |
CN105261356A (zh) | 一种语音识别***及方法 | |
CN111524527A (zh) | 话者分离方法、装置、电子设备和存储介质 | |
CN109003600B (zh) | 消息处理方法及装置 | |
CN111462758A (zh) | 智能会议角色分类的方法、装置、设备及存储介质 | |
CN112364622B (zh) | 对话文本分析方法、装置、电子装置及存储介质 | |
CN111128182A (zh) | 一种智能语音录入方法及装置 | |
CN111627448A (zh) | 实现基于语音大数据的审讯与谈话控制***及其方法 | |
US20210256220A1 (en) | Method and system for automated autonomous intent mining | |
CN116562270A (zh) | 一种支持多模态输入的自然语言处理***及其方法 | |
CN113744742A (zh) | 对话场景下的角色识别方法、装置和*** | |
CN116665676A (zh) | 一种用于智能语音外呼***的语义识别方法 | |
CN116150651A (zh) | 基于ai的深度合成检测方法和*** | |
CN111312252A (zh) | 一种通过ai语音邀请通讯录人员的方法 | |
CN113726942A (zh) | 一种智能电话接听方法、***、介质及电子终端 | |
CN113051384A (zh) | 基于对话的用户画像抽取方法及相关装置 | |
CN116303951A (zh) | 对话处理方法、装置、电子设备和存储介质 | |
CN116127011A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN108899035B (zh) | 消息处理方法及装置 | |
CN113314103A (zh) | 基于实时语音情感分析的非法信息识别方法及装置 | |
CN113489762B (zh) | 一种人工智能化语音邀请共享导航的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200619 |