CN109274847B - 通话方法和装置、智能语音设备以及控制器和介质 - Google Patents
通话方法和装置、智能语音设备以及控制器和介质 Download PDFInfo
- Publication number
- CN109274847B CN109274847B CN201811314545.4A CN201811314545A CN109274847B CN 109274847 B CN109274847 B CN 109274847B CN 201811314545 A CN201811314545 A CN 201811314545A CN 109274847 B CN109274847 B CN 109274847B
- Authority
- CN
- China
- Prior art keywords
- call
- voice
- intelligent
- information
- equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 230000008569 process Effects 0.000 claims abstract description 46
- 230000006870 function Effects 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims description 32
- 230000006854 communication Effects 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 22
- 230000009467 reduction Effects 0.000 claims description 17
- 230000003287 optical effect Effects 0.000 claims description 15
- 230000002194 synthesizing effect Effects 0.000 claims description 9
- 238000012544 monitoring process Methods 0.000 claims description 7
- 238000012423 maintenance Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 239000011521 glass Substances 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 description 6
- 230000001629 suppression Effects 0.000 description 6
- 241000219498 Alnus glutinosa Species 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M7/00—Arrangements for interconnection between switching centres
- H04M7/006—Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/10—Architectures or entities
- H04L65/1016—IP multimedia subsystem [IMS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M7/00—Arrangements for interconnection between switching centres
- H04M7/006—Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
- H04M7/0081—Network operation, administration, maintenance, or provisioning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Telephone Function (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明涉及一种通话方法和装置、智能语音设备以及控制器和介质,所述方法包括将智能语音设备接入运营商局域网中;所述智能语音设备获取语音指令;根据所述语音指令执行对应的拨打电话或接听电话过程。本发明使智能语音设备实现高质量的如固话、手机一样的通话功能,提升了用户体验。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种通话方法和装置、智能语音设备以及控制器和介质。
背景技术
随着智能语音技术的发展,现有的智能语音设备可实现语音拨打、接听电话的功能,但是现有的智能语音设备通常是通过网络电话(如互联网Internet,IP电话)的方式实现呼出或接听电话的功能。由于缺乏运营商层面的合作支持,一般在智能语音设备呼叫的对端无法正常显示本机电话号码,智能语音设备也无法通过手机号码、固定电话号码拨打拥有该手机号码、固定电话的手机等通讯设备,且在对方设备无网络状态下,智能语音设备将无法拨通电话,用户体验差。此外,传统的手机和电话机等设备,无法在支持远场拾音的同时,在环境嘈杂、有噪声引入的情况下录制高质量语音。因此如何实现使智能语音设备实现高质量的如固话、手机一样的通话功能成为亟待解决的技术问题。
发明内容
本发明目的在于,提供一种通话方法和装置、智能语音设备以及控制器和介质,使智能语音设备实现高质量的如固话、手机一样的通话功能,提升了用户体验。
为了解决上述技术问题,根据本发明第一实施例,提供了一种通话方法,应用于智能语音设备,包括:
将智能语音设备接入运营商局域网中,并授权所述智能语音设备固话功能;
所述智能语音设备获取语音指令;
根据所述语音指令执行对应的拨打电话或接听电话过程;
所述“将智能语音设备接入运营商局域网中,授权所述智能语音设备固话功能”进一步包括:运营商将所述智能语音设备的唯一ID与运营商手机号或者固化号码绑定,此后所述智能语音设备连接internet网后即可接入运营商局域网;
所述智能语音设备获取语音指令包括:
采用麦克风阵列来采集原始语音数据;
将所述原始语音数据进行回声消除及降噪处理得到所述语音指令。
进一步的,将智能语音设备接入运营商局域网中包括:
通过中国电信光猫、***光宽带或***VOIMS软件将所述智能语音设备接入对应的运营商局域网。
进一步的,所述方法还包括:
导入并存储联系人信息,所述联系人信息包括姓名和电话号码。
进一步的,根据所述语音指令执行对应的拨打电过程,包括以下步骤:
将所述语音指令进行语义识别和语义理解处理,得到对应的意图;
若所述意图为拨打联系人/电话号码,则解析出对应的联系人/电话号码信息发送给所述智能语音设备;
所述智能语音设备根据所述接收的联系人/电话号码信息拨打对应的联系人/电话号码。
进一步的,根据所述语音指令执行对应的拨打电过程,还包括以下步骤:
在电话未接通过程/已接通过程中,若接收到意图为取消拨打的语音指令,则所述智能语音设备取消/挂断本次通话过程。
进一步的,根据所述语音指令执行对应的接听电话过程包括以下步骤:
所述智能语音设备监听到来电信息;
将所述来电信息与所述联系人信息进行匹配,查找对应联系人;
若查找到对应联系人,则语音合成对应联系人信息进行语音播报,并询问是否接听电话;
否则,语音合成来电号码信息进行语音播报,并询问是否接听电话;
将所述语音指令进行语义识别和语义理解处理,得到对应的意图;
若所述意图为接听电话,则接听通话;
若所述意图为挂断电话或拒接电话,则挂断通话。
根据本发明第二实施例,提供了一种通话装置,应用于智能语音设备,包括:
接入模块,用于将智能语音设备接入运营商局域网中,并授权所述智能语音设备固话功能;
语音获取模块,用于获取语音指令;
通话模块,用于根据所述语音指令执行对应的拨打电话或接听电话过程;
所述接入模块进一步用于:运营商将所述智能语音设备的唯一ID与运营商手机号或者固化号码绑定,此后所述智能语音设备连接internet网后即可接入运营商局域网;
所述语音获取模块包括:
采集单元,用于采用麦克风阵列来采集原始语音数据;
处理单元,用于将所述原始语音数据进行回声消除及降噪处理得到所述语音指令。
进一步的,所述接入模块还用于:
通过中国电信光猫、***光宽带或***VOIMS软件将智能语音设备接入运营商局域网。
进一步的,所述语音获取模块包括:
采集单元,用于采集原始语音数据;
处理单元,用于将所述原始语音数据进行回声消除及降噪处理得到所述语音指令。
进一步的,所述采集单元包括麦克风阵列,所述麦克风阵列为环麦或线麦,包括单麦、线两麦、线4麦、环4麦、环6麦、环7麦、环8麦中的一种或多种。
进一步的,所述装置还包括:
信息维护模块,用于导入并存储联系人信息,所述联系人信息包括姓名和电话号码。
进一步的,所述通话模块包括:
意图识别单元,用于将所述语音指令进行语义识别和语义理解处理,得到对应的意图,所述意图包括拨打联系人/电话号码、取消拨打、接听电话、挂断电话和拒接电话;
信息解析单元,用于在所述意图识别单元识别的意图为拨打联系人/电话号码时,则解析出对应的联系人/电话号码信息发送给拨打电话单元;
拨打电话单元,用于根据所述接收的联系人/电话号码信息拨打对应的联系人/电话号码;
取消通话单元,用于在电话未接通过程/已接通过程中,若意图识别单元识别到取消拨打意图,则取消本次通话过程;
挂断通话单元,用于在电话未接通过程/已接通过程中,若意图识别单元识别到挂断电话意图,则挂断本次通话过程,以及,用于在来电过程中,意图识别单元识别到挂断电话意图或拒接电话时,挂断电话;
监听来电单元,用于监听来电信息,当监听到来电信息时触发联系人查找单元;
联系人查找单元,用于在将所述来电信息与所述联系人信息进行匹配,查找对应联系人,并将查找结果发送给语音播报单元;
语音播报单元,若所述查找结果为查找到对应联系人,则语音合成对应联系人信息进行语音播报,并询问是否接听电话,否则,语音合成来电号码信息进行语音播报,并询问是否接听电话;
接听电话单元,用于在来电过程中,意图识别单元识别到接听电话意图时,接听通话。
根据本发明第三实施例,提供了一种智能语音设备,包括上述通话装置。
进一步的,所述智能语音设备包括智能音箱、智能车载终端、智能语音电视机、智能平板电脑、智能眼镜中的一种或多种。
根据根据本发明第四实施例,提供了一种控制器,其包括存储器与处理器,所述存储器存储有计算机程序,所述程序在被所述处理器执行时能够实现所述方法的步骤。
根据本发明第五实施例,提供了一种计算机可读存储介质,用于存储计算机指令,所述指令在由一计算机或处理器执行时实现所述方法的步骤。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明一种通话方法和装置、智能语音设备以及控制器和介质可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
本发明通过将智能语音设备接入运营商局域网,并授予其固话功能,再通过语音指令控制智能语音设备执行对应通话过程,使得智能语音设备实现如固话、手机一样的通话功能,能在对端正常显示本机号码,且能通过手机号码、固定电话号码拨打拥有该手机号码、固定电话的手机等通讯设备。此外,本发明通过对采集的语音的处理,使智能语音设备支持远场拾音,且在环境嘈杂、有噪声引入的情况下仍能录制高质量语音,使智能语音设备实现高质量的如固话、手机一样的通话功能,提升了用户体验。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1为本发明一实施例提供通话方法示意图;
图2为本发明一实施例提供的通话装置示意图。
【符号说明】
1:接入模块 2:语音获取模块
3:通话模块
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种通话方法和装置、智能语音设备以及控制器和介质的具体实施方式及其功效,详细说明如后。
本发明实施例提供了一种通话方法,应用于智能语音设备,如图1所示,包括以下步骤:
步骤S1、将智能语音设备接入运营商局域网中;
作为示例,所述步骤S1包括:通过中国电信光猫、***光宽带或***VOIMS软件将所述智能语音设备接入对应的运营商局域网,并授权所述智能语音设备固话功能。即运营商将语音设备唯一ID与运营商手机号或者固化号码绑定,即为此语音设备开通电话功能业务,此后语音设备连接internet网后即可接入运营商局域网。
具体通过以下几个实施例来说明步骤S1:
实施例一、接入移动运营商操作步骤
将智能语音设备接入移动光宽带,通过和家亲APP给所述智能语音设备配置wifi网络,然后可在和家亲APP或者移动网上营业厅申请云固话功能,将云固话功能授权给所述智能语音设备,即可使所述智能语音设备等同于普通话机设备,进而可以使用语音控制拨打以及接听电话等通话服务。
实施例二、接入电信运营商操作步骤
将智能语音设备接入电信光猫,通过电信营业厅开通“爱通话”业务,选择给所述智能设备授权,将所述智能设备配置到此电信宽带的网络后,即可等同于普通话机设备,实现语音控制拨打以及接听电话等通话服务。
因为是将智能语音设备与运营商深度合作,智能语音设备的通话功能本质上是真实话机业务接入,因此可以和正常话机一样,拨打后接听方可显示智能语音设备真实的电话号码,同时智能语音设备也支持接听来电的功能。
需要说明的是,所述运营商不仅限于***、***、中国电信,还可为中国香港运营商,如电信盈科pccw、香港电讯、亚太环通等;美国运营商圣安娜KT、达拉斯SL、芝加哥SK、洛杉矶PR等,韩国运营商韩国KT等等。
步骤S2、所述智能语音设备获取语音指令;
作为示例,所述步骤S2包括以下步骤:
步骤S21、采集原始语音数据;
步骤S22、将所述原始语音数据进行回声消除及降噪处理得到所述语音指令。
步骤S21-步骤S22可采用麦克风阵列来完成远场拾音与降噪处理,可以理解的是,通话过程中,也采用步骤S21-步骤S22获取语音信息并进行回声消除及降噪处理,从而实现高质量语音通话。
作为示例,麦克风阵列可以是环麦,也可以是线麦,包括单麦、线两麦、线4麦、环四麦、环6麦、环7麦、环8麦中的一种或多种。
步骤S21通过硬件麦克风阵列采集原始语音数据
步骤S22将原始语音数据通过自适应回声消除算法(AEC)以及降噪处理,实现自身音源消除以及降噪的处理,将从麦克风阵列录取到的原始语音数据最大程度的还原为清晰的人声,然后将处理过后的语音数据输入给通话功能,从而实现高质量语音通话。
作为一种示例,本实施例中,AEC以及降噪算法处理的几个指标如下:
a、远场识音和降噪算法中对噪声抑制量大于25dB。
b、AEC算法中对语音损伤程度dtml小于3dB,对回声的抑制量erle大于45dB,其中,dtml:double talk mute level,是指有double talk时,回声消除算法对近端语音的损伤程度,标准是在正负6dB以内;erle:echo return loss enhancement,是指只有回声的模式下,回声消除算法对回声的抑制量。
c、实时波束形成算法中,消除残余噪声,提高信噪比5-6dB。
所述方法还包括步骤S0、导入并存储联系人信息,所述联系人信息包括姓名和电话号码,作为示例,可通过手机App将联系人信息导入智能语音设备,也可将联系人信息导入云端,智能语音设备与云端通信连接,可从云端获取联系联系人信息。此外,还可设置热词机制,从而优化对联系人语音识别的性能,热词机制为一种语音识别领域优先匹配机制,比如语音指令说“suchenglong”,如果有一个热词为“苏诚龙”,则此条语音经过算法处理后形成拼音,再经过热词匹配优先匹配为“苏诚龙”,而非“苏成龙”。
步骤S3、根据所述语音指令执行对应的拨打电话或接听电话过程。
所述步骤S3中,根据所述语音指令执行对应的拨打电过程,具体可包括以下步骤:
步骤S311、将所述语音指令进行语义识别(ASR)和语义理解(NLP)处理,得到对应的意图;
步骤S312、若所述意图为拨打联系人/电话号码,则解析出对应的联系人/电话号码信息发送给所述智能语音设备;
步骤S313、所述智能语音设备根据所述接收的联系人/电话号码信息拨打对应的联系人/电话号码。此时,使能语音设备所拨打的对端能够显示所述智能语音设备对应的电话号码。
在电话未接通过程/已接通过程中,步骤S3还可包括步骤S314、若接收到意图为取消拨打的语音指令,则所述智能语音设备取消/挂断本次通话过程。
所述步骤S3中,根据所述语音指令执行对应的接听电话过程包括以下步骤:
步骤S321、所述智能语音设备监听到来电信息;
步骤S322、将所述来电信息与所述联系人信息进行匹配,查找对应联系人;
步骤S323、若查找到对应联系人,则语音合(TTS)成对应联系人信息进行语音播报,并询问是否接听电话;否则,语音合成来电号码信息进行语音播报,并询问是否接听电话;
步骤S324、将所述语音指令进行语义识别和语义理解处理,得到对应的意图;
步骤S325、若所述意图为接听电话,则接听通话;若所述意图为挂断电话或拒接电话,则挂断通话。
本发明实施例还提供了一种通话装置,应用于智能语音设备,包括接入模块1、语音获取模块2和通话模块3,其中,接入模块1用于将智能语音设备接入运营商局域网中;语音获取模块2用于获取语音指令;通话模块3用于根据所述语音指令执行对应的拨打电话或接听电话过程。
作为示例,所述接入模块1具体用于:通过中国电信光猫、***光宽带或***VOIMS软件将智能语音设备接入运营商局域网,并授权所述智能语音设备固话功能。
具体通过以下几个实施例来说明步骤S1:
实施例三、接入移动运营商操作步骤
接入模块1将智能语音设备接入移动光宽带,通过和家亲APP给所述智能语音设备配置wifi网络,然后可在和家亲APP或者移动网上营业厅申请云固话功能,将云固话功能授权给所述智能语音设备,即可使所述智能语音设备等同于普通话机设备,进而可以使用语音控制拨打以及接听电话等通话服务。
实施例四、接入电信运营商操作步骤
接入模块1将智能语音设备接入电信光猫,通过电信营业厅开通“爱通话”业务,选择给所述智能设备授权,将所述智能设备配置到此电信宽带的网络后,即可等同于普通话机设备,实现语音控制拨打以及接听电话等通话服务。
因为是将智能语音设备与运营商深度合作,智能语音设备的通话功能本质上是真实话机业务接入,因此可以和正常话机一样,拨打后接听方可显示智能语音设备真实的电话号码,同时智能语音设备也支持接听来电的功能。
需要说明的是,所述运营商不仅限于***、***、中国电信,还可为中国香港运营商,如电信盈科pccw、香港电讯、亚太环通等;美国运营商圣安娜KT、达拉斯SL、芝加哥SK、洛杉矶PR等,韩国运营商韩国KT等等。
所述语音获取模块2可包括采集单元和处理单元,其中,采集单元用于采集原始语音数据,作为示例,采集单元包括麦克风阵列,所述麦克风阵列为环麦或线麦,包括单麦、线两麦、线4麦、环4麦、环6麦、环7麦、环8麦中的一种或多种。处理单元用于将所述原始语音数据进行回声消除及降噪处理得到所述语音指令。处理单元将原始语音数据通过自适应回声消除算法(AEC)以及降噪处理,实现自身音源消除以及降噪的处理,将从麦克风阵列录取到的原始语音数据最大程度的还原为清晰的人声,然后将处理过后的语音数据输入给通话功能,从而实现高质量语音通话。
作为一种示例,本实施例中,AEC以及降噪算法处理的几个指标如下:
a、远场识音和降噪算法中对噪声抑制量大于25dB。
b、AEC算法中对语音损伤程度dtml小于3dB,对回声的抑制量erle大于45dB,其中,dtml:double talk mute level,是指有double talk时,回声消除算法对近端语音的损伤程度,标准是在正负6dB以内;erle:echo return loss enhancement,是指只有回声的模式下,回声消除算法对回声的抑制量。
c、实时波束形成算法中,消除残余噪声,提高信噪比5-6dB。
所述装置还包括信息维护模块,用于导入并存储联系人信息,所述联系人信息包括姓名和电话号码。作为示例,可通过手机App将联系人信息导入智能语音设备,也可将联系人信息导入云端,使云端来行使所述信息维护模块的功能,智能语音设备与云端通信连接,可从云端获取联系联系人信息。此外,还可设置热词机制,从而优化对联系人语音识别的性能,热词机制为一种语音识别领域优先匹配机制,比如语音指令说“suchenglong”,如果有一个热词为“苏诚龙”,则此条语音经过算法处理后形成拼音,再经过热词匹配优先匹配为“苏诚龙”,而非“苏成龙”。
所述通话模块3包括意图识别单元、信息解析单元、拨打电话单元、取消通话单元、挂断通话单元、监听来电单元、联系人查找单元、语音播报单元和接听电话单元,其中,意图识别单元用于将所述语音指令进行语义识别和语义理解处理,得到对应的意图,所述意图包括拨打联系人/电话号码、取消拨打、接听电话、挂断电话和拒接电话。信息解析单元用于在所述意图识别单元识别的意图为拨打联系人/电话号码时,则解析出对应的联系人/电话号码信息发送给拨打电话单元。拨打电话单元,用于根据所述接收的联系人/电话号码信息拨打对应的联系人/电话号码,此时,使能语音设备所拨打的对端能够显示所述智能语音设备对应的电话号码。取消通话单元,用于在电话未接通过程/已接通过程中,若意图识别单元识别到取消拨打意图,则取消本次通话过程。挂断通话单元,用于在电话未接通过程/已接通过程中,若意图识别单元识别到挂断电话意图,则挂断本次通话过程,以及,用于在来电过程中,意图识别单元识别到挂断电话意图或拒接电话时,挂断电话。监听来电单元用于监听来电信息,当监听到来电信息时触发联系人查找单元。联系人查找单元用于在将所述来电信息与所述联系人信息进行匹配,查找对应联系人,并将查找结果发送给语音播报单元。语音播报单元用于若所述查找结果为查找到对应联系人,则语音合成对应联系人信息进行语音播报,并询问是否接听电话,否则,语音合成来电号码信息进行语音播报,并询问是否接听电话;接听电话单元用于在来电过程中,意图识别单元识别到接听电话意图时,接听通话。
本发明实施例还提供了一种智能语音设备,包括本发明实施例所述的通话装置,通过智能语音设备可实现手机和固话相同的通话功能,可作为拨打电话的一端、也可作为接听电话的一端。作为示例,所述智能语音设备包括智能音箱、智能车载终端、智能语音电视机、智能平板电脑、智能眼镜中的一种或多种,智能语音设备还可通过安装语音软件开发工具包(SDK)和通话软件开发工具包(SDK)来实现本发明实施例所述的通话功能,例如可安装若琪(ROKID)的语音SDK和通话SDK来兼容上述通话功能。
本发明实施例还提供一种控制器,其包括存储器与处理器,所述存储器存储有计算机程序,所述程序在被所述处理器执行时能够实现所述的通话方法的步骤。
本发明实施例还提供一种计算机可读存储介质,用于存储计算机指令,所述指令在由一计算机或处理器执行时实现所述通话方法的步骤。
本发明实施例通过将智能语音设备接入运营商局域网,并授予其固话功能,再通过语音指令控制智能语音设备执行对应通话过程,使得智能语音设备实现如固话、手机一样的通话功能,能在对端正常显示本机号码,且能通过手机号码、固定电话号码拨打拥有该手机号码、固定电话的手机等通讯设备。此外,本发明通过对采集的语音的处理,使智能语音设备支持远场拾音,且在环境嘈杂、有噪声引入的情况下仍能录制高质量语音,使智能语音设备实现高质量的如固话、手机一样的通话功能,提升了用户体验。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (15)
1.一种通话方法,应用于智能语音设备,其特征在于:包括:
将智能语音设备接入运营商局域网中,并授权所述智能语音设备固话功能;
所述智能语音设备获取语音指令;
根据所述语音指令执行对应的拨打电话或接听电话过程;
所述“将智能语音设备接入运营商局域网中,授权所述智能语音设备固话功能”进一步包括:运营商将所述智能语音设备的唯一ID与运营商手机号或者固话号码绑定,此后所述智能语音设备连接internet网后即可接入运营商局域网;
所述智能语音设备获取语音指令包括:
采用麦克风阵列来采集原始语音数据;
将所述原始语音数据进行回声消除及降噪处理得到所述语音指令。
2.根据权利要求1所述的通话方法,其特征在于:
将智能语音设备接入运营商局域网中包括:
通过中国电信光猫、***光宽带或***VOIMS软件将所述智能语音设备接入对应的运营商局域网。
3.根据权利要求1所述的通话方法,其特征在于:
所述方法还包括:
导入并存储联系人信息,所述联系人信息包括姓名和电话号码。
4.根据权利要求3所述的通话方法,其特征在于:
根据所述语音指令执行对应的拨打电过程,包括以下步骤:
将所述语音指令进行语义识别和语义理解处理,得到对应的意图;
若所述意图为拨打联系人/电话号码, 则解析出对应的联系人/电话号码信息发送给所述智能语音设备;
所述智能语音设备根据接收的联系人/电话号码信息拨打对应的联系人/电话号码。
5.根据权利要求4所述的通话方法,其特征在于:
根据所述语音指令执行对应的拨打电过程,还包括以下步骤:
在电话未接通过程/已接通过程中,若接收到意图为取消拨打的语音指令,则所述智能语音设备取消/挂断本次通话过程。
6.根据权利要求3所述的通话方法,其特征在于:
根据所述语音指令执行对应的接听电话过程包括以下步骤:
所述智能语音设备监听到来电信息;
将所述来电信息与所述联系人信息进行匹配,查找对应联系人;
若查找到对应联系人,则语音合成对应联系人信息进行语音播报,并询问是否接听电话;
否则,语音合成来电号码信息进行语音播报,并询问是否接听电话;
将所述语音指令进行语义识别和语义理解处理,得到对应的意图;
若所述意图为接听电话,则接听通话;
若所述意图为挂断电话或拒接电话,则挂断通话。
7.一种通话装置,应用于智能语音设备,其特征在于:包括:
接入模块,用于将智能语音设备接入运营商局域网中,并授权所述智能语音设备固话功能;
语音获取模块,用于获取语音指令;
通话模块,用于根据所述语音指令执行对应的拨打电话或接听电话过程;
所述接入模块进一步用于:运营商将所述智能语音设备的唯一ID与运营商手机号或者固话号码绑定,此后所述智能语音设备连接internet网后即可接入运营商局域网;
所述语音获取模块包括:
采集单元,用于采用麦克风阵列来采集原始语音数据;
处理单元,用于将所述原始语音数据进行回声消除及降噪处理得到所述语音指令。
8.根据权利要求7所述的通话装置,其特征在于:
所述接入模块还用于:
通过中国电信光猫、***光宽带或***VOIMS软件将智能语音设备接入运营商局域网。
9.根据权利要求7所述的通话装置,其特征在于:
所述采集单元包括所述麦克风阵列,所述麦克风阵列为环麦或线麦,包括单麦、线两麦、线4麦、环4麦、环6麦、环7麦、环8麦中的一种或多种。
10.根据权利要求7所述的通话装置,其特征在于:
所述装置还包括:
信息维护模块,用于导入并存储联系人信息,所述联系人信息包括姓名和电话号码。
11.根据权利要求10所述的通话装置,其特征在于:
所述通话模块包括:
意图识别单元,用于将所述语音指令进行语义识别和语义理解处理,得到对应的意图,所述意图包括拨打联系人/电话号码、取消拨打、接听电话、挂断电话和拒接电话;
信息解析单元,用于在所述意图识别单元识别的意图为拨打联系人/电话号码时, 则解析出对应的联系人/电话号码信息发送给拨打电话单元;
拨打电话单元,用于根据接收的联系人/电话号码信息拨打对应的联系人/电话号码;
取消通话单元,用于在电话未接通过程/已接通过程中,若意图识别单元识别到取消拨打意图,则取消本次通话过程;
挂断通话单元,用于在电话未接通过程/已接通过程中,若意图识别单元识别到挂断电话意图,则挂断本次通话过程,以及,用于在来电过程中,意图识别单元识别到挂断电话意图或拒接电话时,挂断电话;
监听来电单元,用于监听来电信息,当监听到来电信息时触发联系人查找单元;
联系人查找单元,用于在将所述来电信息与所述联系人信息进行匹配,查找对应联系人,并将查找结果发送给语音播报单元;
语音播报单元,若所述查找结果为查找到对应联系人,则语音合成对应联系人信息进行语音播报,并询问是否接听电话,否则,语音合成来电号码信息进行语音播报,并询问是否接听电话;
接听电话单元,用于在来电过程中,意图识别单元识别到接听电话意图时,接听通话。
12.一种智能语音设备,其特征在于:包括权利要求7-11中任意一项所述的通话装置。
13.根据权利要求12所述的智能语音设备,其特征在于:
所述智能语音设备包括智能音箱、智能车载终端、智能语音电视机、智能平板电脑、智能眼镜中的一种或多种。
14.一种控制器,其包括存储器与处理器,其特征在于:所述存储器存储有计算机程序,所述程序在被所述处理器执行时能够实现权利要求1至6中任意一项权利要求所述的方法的步骤。
15.一种计算机可读存储介质,用于存储计算机指令,其特征在于:所述指令在由一计算机或处理器执行时实现如权利要求1至6中任意一项权利要求所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811314545.4A CN109274847B (zh) | 2018-11-06 | 2018-11-06 | 通话方法和装置、智能语音设备以及控制器和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811314545.4A CN109274847B (zh) | 2018-11-06 | 2018-11-06 | 通话方法和装置、智能语音设备以及控制器和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109274847A CN109274847A (zh) | 2019-01-25 |
CN109274847B true CN109274847B (zh) | 2021-07-02 |
Family
ID=65191478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811314545.4A Active CN109274847B (zh) | 2018-11-06 | 2018-11-06 | 通话方法和装置、智能语音设备以及控制器和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109274847B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111681650A (zh) * | 2019-03-11 | 2020-09-18 | 阿里巴巴集团控股有限公司 | 一种智能会议控制方法和装置 |
CN111770228A (zh) * | 2019-04-02 | 2020-10-13 | 深圳市贝沃电子科技有限公司 | 一种智能老人机 |
CN111787524B (zh) * | 2019-04-04 | 2023-04-11 | 阿里巴巴集团控股有限公司 | 物联网设备通话控制方法、装置及*** |
CN110139184A (zh) * | 2019-06-01 | 2019-08-16 | 厦门市思芯微科技有限公司 | 一种带电话功能的智能音箱***及运行方法 |
CN112449059A (zh) * | 2019-08-14 | 2021-03-05 | 阿里巴巴集团控股有限公司 | 语音交互设备、基于语音交互设备实现通话的方法及*** |
CN110557497A (zh) * | 2019-08-14 | 2019-12-10 | 蓝润英 | 一种基于座机拨号的异地拨号方法及其装置 |
CN112543447A (zh) | 2019-09-19 | 2021-03-23 | 华为技术有限公司 | 基于通讯录的设备发现方法、音视频通信方法及电子设备 |
CN112714222A (zh) * | 2019-10-24 | 2021-04-27 | 阿里巴巴集团控股有限公司 | 语音呼叫***、方法和语音设备 |
CN113271383A (zh) * | 2021-05-12 | 2021-08-17 | 思必驰科技股份有限公司 | 语音查号方法和装置 |
CN113438351A (zh) * | 2021-05-18 | 2021-09-24 | 青岛海尔空调器有限总公司 | 空调语音控制方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160060018A (ko) * | 2016-05-13 | 2016-05-27 | 주식회사 코아트리 | Ip/sip/ims카메라, ip/sip/ims카메라가 구비된 사설보안시스템 및 사설보안시스템 제어방법 |
CN107135130A (zh) * | 2016-06-24 | 2017-09-05 | 九阳股份有限公司 | 一种智能家电权限控制方法及智能家电 |
US9967381B1 (en) * | 2017-11-03 | 2018-05-08 | Republic Wireless, Inc. | Virtual telephony assistant |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101784052B (zh) * | 2009-01-21 | 2012-07-25 | ***通信集团上海有限公司 | 一种非ims终端接入ims网络的方法及装置 |
CN103517463B (zh) * | 2012-06-20 | 2018-04-27 | 中兴通讯股份有限公司 | 家庭网关、语音通话方法及装置 |
CN104702789A (zh) * | 2015-03-11 | 2015-06-10 | 安徽声讯信息技术有限公司 | 具有语音控制功能的智能手机及其语音控制方法 |
CN106550082A (zh) * | 2016-10-25 | 2017-03-29 | 乐视控股(北京)有限公司 | 一种使用语音助手应用拨号的方法和装置 |
CN107295143A (zh) * | 2017-07-20 | 2017-10-24 | 广东小天才科技有限公司 | 基于穿戴式设备的拨打电话方法、装置、设备及存储介质 |
-
2018
- 2018-11-06 CN CN201811314545.4A patent/CN109274847B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160060018A (ko) * | 2016-05-13 | 2016-05-27 | 주식회사 코아트리 | Ip/sip/ims카메라, ip/sip/ims카메라가 구비된 사설보안시스템 및 사설보안시스템 제어방법 |
CN107135130A (zh) * | 2016-06-24 | 2017-09-05 | 九阳股份有限公司 | 一种智能家电权限控制方法及智能家电 |
US9967381B1 (en) * | 2017-11-03 | 2018-05-08 | Republic Wireless, Inc. | Virtual telephony assistant |
Also Published As
Publication number | Publication date |
---|---|
CN109274847A (zh) | 2019-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109274847B (zh) | 通话方法和装置、智能语音设备以及控制器和介质 | |
CN105513596B (zh) | 一种语音控制方法和控制设备 | |
CN102857807B (zh) | 语音控制通信终端的方法及数字电视终端 | |
CA2573937C (en) | Communication handoff between telephone devices | |
CN110602327B (zh) | 语音通话方法、装置、电子设备及计算机可读存储介质 | |
CN102917105A (zh) | 呼叫信息处理方法和终端设备 | |
CN103219011A (zh) | 降噪方法、装置与通信终端 | |
CN100452863C (zh) | 一种可视电话控制方法及设备 | |
CN104320529A (zh) | 一种信息接收处理方法及语音通信设备 | |
CN103491263A (zh) | 一种外来电话过滤的实现方法及*** | |
CN104427479A (zh) | 一种提示呼叫状态的方法及移动终端 | |
GB2560441B (en) | Automatically delaying playback of a voice message at a captioning device | |
CN103310794A (zh) | 过滤通话噪音的方法及装置 | |
CN111556210A (zh) | 通话语音处理方法与装置、终端设备和存储介质 | |
CN1319359C (zh) | 一种来话接入方法 | |
CN101902517B (zh) | 一种通讯终端及来电应答的方法 | |
CN104618593B (zh) | 一种移动终端及其第三方呼入时的操作方法 | |
CN111343328B (zh) | 基于声纹识别的通话管理方法、***及移动终端 | |
CN106385517A (zh) | 一种音频通话的实现方法、***及智能会议设备 | |
CN104735811B (zh) | 一种基于无线接入***的二次拨号方法及无线接入设备 | |
CN105721688A (zh) | 一种紧急呼叫的方法和装置 | |
CN101340498A (zh) | 一种摄像头可受通话对方控制的移动电话 | |
CN115174724A (zh) | 通话降噪方法、装置、设备及可读存储介质 | |
CN114466324A (zh) | 呼叫方法及相关装置 | |
CN105812707B (zh) | 一种视频通信终端、***及使用方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |