CN110390934A - 一种信息提示的方法和语音交互终端 - Google Patents
一种信息提示的方法和语音交互终端 Download PDFInfo
- Publication number
- CN110390934A CN110390934A CN201910555553.6A CN201910555553A CN110390934A CN 110390934 A CN110390934 A CN 110390934A CN 201910555553 A CN201910555553 A CN 201910555553A CN 110390934 A CN110390934 A CN 110390934A
- Authority
- CN
- China
- Prior art keywords
- terminal
- wake
- coordinate
- user
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 40
- 230000002618 waking effect Effects 0.000 claims abstract description 18
- 230000006870 function Effects 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 12
- 238000005516 engineering process Methods 0.000 claims description 8
- 230000004807 localization Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
本申请实施例公开了一种信息提示的方法,所述方法应用于具有语音交互功能的终端上,用于提示用户在通过语音唤醒设备时,从低唤醒区域进入高唤醒率区域,使用户获得更好的唤醒体验。本申请实施例方法包括:所述终端确定用户当前位置所对应的第一坐标;所述终端根据预置的不同坐标和不同唤醒率的对应关系,确定所述第一坐标对应的第一唤醒率,所述第一唤醒率用于指示在所述第一坐标所在的位置通过语音成功唤醒所述终端的概率;所述终端生成提示信息,所述指示信息用于指示所述用户到达第二坐标所在的位置,所述第二坐标对应的第二唤醒率高于所述第一唤醒率。
Description
技术领域
本申请涉及语音识别领域,尤其涉及一种信息提示的方法和语音交互终端。
背景技术
在未来的生活和工作场景中,语音交互是一个新的入口,它提供了更灵活的交互方式,使得用户可以通过语音进行远距离的设备控制。
用户在通过语音对设备进行控制时,设备接收到的语音信号的强度受用户发出的语音的能量值大小以及与用户之间的距离影响。这样就导致,用户在不同的位置,通过语音唤醒设备的成功率并不相同。当用户在低唤醒区域时,用户通过语音唤醒设备的成功率较低,往往需要多次唤醒才能唤醒设备,用户的使用体验较差。
发明内容
本申请实施例公开了一种信息提示的方法,所述方法应用于具有语音交互功能的终端上,所述方法用于提示用户在通过语音唤醒设备时,从低唤醒区域进入高唤醒率区域,使用户获得更好的唤醒体验。
有鉴于此,本申请实施例第一方面提供了一种信息提示的方法,可以包括:
用户在进入终端的唤醒区域后,终端可以根据预先设定或在接收到用于检测用户位置的指令时,终端以自身为原点,以自身的朝向作为坐标轴,确定进入该唤醒区域的用户的第一坐标值,之后,用户根据预置的不同坐标和不同唤醒率的对应关系,确定该用户所在位置对应的第一唤醒率,该第一唤醒率表示用户在该第一坐标所在的位置通过语音成功唤醒所述终端的概率。确定第一唤醒率后,终端可以根据该第一唤醒率和前述的对应关系,确定第二唤醒率对应的第二坐标,该第二唤醒率高于第一唤醒率,并生成提示信息,指示用户从第一坐标移动到第二坐标所在的位置。由于第二坐标的位置对应的第二唤醒率高于第一坐标位置对应的第一唤醒率,用户在移动到第二坐标对应的位置时,通过语音成功唤醒终端的概率得到了提高,从而有效提高了用户的唤醒体验。
在一种可能的设计中,所述终端确定用户当前位置所对应的第一坐标,包括:在预设时间内,当用户通过语音连续唤醒所述终端未成功的次数大于第一预设阈值时,所述终端确定用户当前位置所对应的第一坐标。本申请实施例中,提供了一种具体场景,在用户通过语音连续唤醒终端未成功的次数大于第一预设阈值时,终端再检测用户坐标,从而之后再进行提示,更具有可行性。
在一种可能的设计中,所述终端生成提示信息,包括:当所述第一唤醒率小于第二预设阈值时,所述终端生成指示信息。本申请实施例中,提供了一种具体场景,即用户所在的位置所对应的唤醒率小于第二预设阈值时,终端生成提示信息,提示用户进入高唤醒区域,提高了方案的实用性。
在一种可能的设计中,所述终端生成提示信息,包括:在预设时间内,当用户通过语音连续唤醒所述终端未成功的次数大于第一预设阈值时,所述终端生成指示信息。本申请实施例中,提供了一种具体场景,即用户在进入唤醒区域后,若连续通过语音唤醒终端未成功的次数大于第一预设阈值,则终端自动生成提示信息,提示用户移动到第二坐标所在的位置。由于第二坐标所在的位置对应的第二唤醒率高于第一唤醒率,因而,用户在进入第二坐标的位置时,更容易唤醒终端,提高了用户体验。
在一种可能的设计中,所述终端确定用户当前位置所对应的第一坐标,包括:所述终端以所述终端为原点,通过摄像头和/或声源定位技术确定所述用户位置所对应的第一坐标。本申请实施例中,指示了终端检测用户坐标值的具体方式,提高了方案的可行性。并且,需要说明的时,本申请实施例中,所采用的摄像头辅助定位或声源定位技术是终端确定用户坐标的方法之一,对具体终端采用何种方式确定用户坐标并不构成限定,在可能的场景下,还可以采用其他手段来进行定位,例如根据室内的路由或交换机辅助定位。
在一种可能的设计中,所述方法还包括:所述终端获取用户用于唤醒所述终端的语音信号;所述终端对所述语音信号的能量值进行归一化处理,得到归一化能量值;所述终端显示所述归一化能量值。本申请实施例中,用户在唤醒时,终端确定用户发出的唤醒词的能量值,并进行归一化处理,将归一化处理的能量值显示出来。从而用户在移动中,可以看到唤醒能量值的变化,提高用户的唤醒体验。
在一种可能的设计中,所述指示信息包括所述第一坐标的位置至所述第二坐标的位置的轨迹信息。本申请实施例中,该指示信息可以包括第一坐标的位置至第二坐标的位置的轨迹信息,该轨迹信息可以以地图导航路线的形式指示给用户,从而可以指示用户精确到达第二坐标所对应的位置。
在一种可能的设计中,所述指示信息包括语音信息、文字信息、图像信息和/或视频信息。本申请实施例中,该指示信息可以包括多种形式,例如语音信息、文字信息、图像信息和/或视频信息,提高了方案的可行性。
本申请实施例第二方面提供了一种语音交互终端,可以包括:
检测单元,用于确定用户当前位置所对应的第一坐标;
处理单元,用于根据预置的不同坐标和不同唤醒率的对应关系,确定所述第一坐标对应的第一唤醒率,所述第一唤醒率用于指示在所述第一坐标所在的位置通过语音成功唤醒所述终端的概率;终端生成提示信息,所述指示信息用于指示所述用户到达第二坐标所在的位置,所述第二坐标对应的第二唤醒率高于所述第一唤醒率。
在一种可能的设计中,
所述检测单元,具体用于在预设时间内,当用户通过语音连续唤醒所述终端未成功的次数大于第一预设阈值时,确定用户当前位置所对应的第一坐标。
在一种可能的设计中,
所述处理单元,具体用于当所述第一唤醒率小于第二预设阈值时,生成指示信息。
在一种可能的设计中,
所述处理单元,具体用于在预设时间内,当用户通过语音连续唤醒所述终端未成功的次数大于第一预设阈值时,生成指示信息。
在一种可能的设计中,
所述检测单元,具体用于以所述终端为原点,通过摄像头和/或声源定位技术确定所述用户位置所对应的第一坐标。
在一种可能的设计中,所述语音交互终端还包括:
接收单元,用于获取用户用于唤醒所述终端的语音信号;
所述处理单元,还用于对所述语音信号的能量值进行归一化处理,得到归一化能量值;
显示单元,用于显示所述归一化能量值。
在一种可能的设计中,所述指示信息包括所述第一坐标的位置至所述第二坐标的位置的轨迹信息。
在一种可能的设计中,所述指示信息包括语音信息、文字信息、图像信息和/或视频信息。
本申请实施例第三方面提供了一种语音交互终端,可以包括:
处理器、存储器、以及收发器;
所述收发器用于与所述语音交互终端之外的装置进行通信;
所述存储器用于存储指令代码;所述处理器执行所述指令代码时,使得所述终端执行如第一方面以及任一可选方式中所述的方法。
本申请实施例第四方面提供了一种计算机存储介质,所述介质存储有指令,当所述指令在计算机上运行时,使得计算机执行如第一方面以及任一可选方式中所述的方法。
本申请实施例第五方面提供了一种计算机程序产品,所述指令,当所述指令在计算机上运行时,使得计算机执行如第一方面以及任一可选方式中所述的方法。
本申请实施例第六方面提供一种芯片***,该芯片***包括处理器,用于支持网络设备实现上述方面中所涉及的功能,例如,例如发送或处理上述方法中所涉及的数据和/或信息。在一种可能的设计中,所述芯片***还包括存储器,所述存储器,用于保存网络设备必要的程序指令和数据。该芯片***,可以由芯片构成,也可以包括芯片和其他分立器件。
从以上技术方案可以看出,本申请实施例具有以下优点:
在用户通过语音控制语音交互的终端时,终端检测用户当前位置的第一坐标值,根据预置的不同坐标值与不同唤醒率的对应关系,确定该第一坐标值对应的第一唤醒率。之后,终端生成提示信息,通过该提示信息提示用户进入第二坐标值对应的位置,该第二坐标值对应的第二唤醒率的值大于第一唤醒率的值,即通过该提示信息提示用户进入高唤醒区域,提高用户通过语音唤醒终端的成功率,从而提高了用户体验。
附图说明
图1为本申请实施例中提供的一种信息提示的方法的一个实施例示意图;
图2为本申请实施例中提供的一种信息提示的方法的另一个实施例示意图;
图3为本申请实施例中提供的一种信息提示的方法的另一个实施例示意图;
图4为本申请实施例中提供的一种信息提示的方法的另一个实施例示意图;
图5为本申请实施例中提供的一种信息提示的方法的另一个实施例示意图;
图6A为本申请实施例中提供的一种语音交互终端的一个实施例示意图;
图6B为本申请实施例中提供的一种语音交互终端的另一个实施例示意图;
图7为本申请实施例中提供的一种语音交互终端的另一个实施例示意图。
具体实施方式
本申请实施例,可以应用于多种具有语音交互功能的设备中,例如但不限于,应用在具有语音交互功能的智能电视、智能音响等智能家居设备中。
本申请实施例中,所包括的术语包括以下含义:
唤醒:是每一次用户与语音产品交互的第一个接触点。
唤醒词:定义一个将产品从待机状态切换到工作状态的词语。
唤醒率:成功唤醒智能设备的概率。
能量值:语音信号的能量,当唤醒词的能量值大于唤醒门限时,则判定唤醒成功。
语音交互:基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。语音交互流程被划分为五个环节,分别是唤醒、响应、输入、理解、反馈等环节。
下面结合附图对本申请实施例所提供的一种信息提示的方法及终端进行详细说明。
下面具体参照图1,图1为本申请实施例提供的一种信息提示的方法的一个实施例示意图,可以包括:
S101、终端获取用户发出的语音信号,并记录预设时长内,连续唤醒所述终端未成功的次数。
在一个具体的实施方式中,当用户进入所述终端的唤醒区域后,发出用于唤醒所述终端的语音信号,该语音信号可以为预设的唤醒词。终端在获取到该语音信号后,记录接收到该语音信息的时刻,并记录在预设时长内,用户通过语音唤醒该终端未成功的次数。其中,唤醒词、预设时长都可以由用户进行提前设定和修改,或者,也可以由终端厂家在出厂前设定,并在后续通过网络对该唤醒词和预设时长的设定进行更新。
S102、在预设时间内,当用户通过语音连续唤醒终端未成功的次数大于第一预设阈值时,终端确定用户当前位置所对应的第一坐标。
在一个具体的实施方式中,若在预设的时间内,当终端检测到用户通过语音唤醒该终端的未成功次数大于第二预设阈值时,终端以自身为原点,可以通过摄像头或者声源定位***确定用户当前位置所对应的第一坐标。具体地,终端可以通过自身携带的摄像头或者区域内其他与终端具有连接关系的摄像头,捕捉用户的移动轨迹,并采集用户当前位置的第一坐标,或者,终端在检测到用户唤醒时,运用声源定位技术确定用户的当前位置的第一坐标。如图2所示,为终端确定用户当前位置的示意图,以终端为原点,得到用户与终端拾音麦克风整列的距离坐标,左边是-X轴,右边是X轴,正面垂直90度为Y轴。例如:确定用户当前位置为53度角,距离终端距离为5米,则获得到用户在终端的53度角距离5米处,而唤醒数据地图是以终端上的拾音麦克风为中心原点,向外180度的坐标限,利用三角公式就能算出用户的xy坐标是(3,4)。
S103、终端根据预置的不同坐标和不同唤醒率的对应关系,确定第一坐标对应的第一唤醒率,第一唤醒率用于指示在第一坐标所在的位置通过语音成功唤醒终端的概率。
在一个具体的实施方式中,终端预置有以终端自身为原点的,周围不同坐标和不同唤醒率的对应关系,该对应关系可以是预置的函数关系:P=f(x,y),P代表唤醒率,为坐标x和y的函数,终端确定坐标值(x,y)后,将x、y的值输入该函数中,即可计算得到坐标值(x,y)对应的唤醒率。该函数也可以以列表形式预存在终端内,如下表所示为不同坐标区域与不同唤醒率的对应关系,其中P代表唤醒率。
X(m) | Y(m) | P | 备注 |
-2≤x≤2 | -2≤y≤3 | 0.9 | 高唤醒区域 |
-3≤x<-2或2<x≤3 | -3≤y<-2或3<y≤4 | 0.85 | 高唤醒区域 |
-4≤x<-3或3<x≤4 | -4≤y<-3或4≤y<5 | 0.75 | 一般唤醒区域 |
x<-4或x>4 | y<-4或y>5 | <0.6 | 低唤醒区域 |
表1
根据上述描述的内容可知,终端在确定用户的第一坐标(x,y)后,根据该对应关系,确定该第一坐标对应的第一唤醒率。
其中,需要说明的是该对应关系可以由终端厂商预置在该终端内,后续当终端连接网络后,可以从服务器端接收更新包,对终端上保存的该对应关系进行更新。可选的,用户在通过语音唤醒该终端时,该终端可以记录每次唤醒过程的相关数据,例如成功唤醒前的唤醒次数,平均唤醒成功的用时,用户的坐标值等参数,并将该参数上报至厂商的服务器上,以使云端服务器根据不同用户上报的参数,对该唤醒模型数据地图进行更新。
在一个具体的实施方式中,该对应关系可以表示为唤醒模型数据地图的形式,并在终端的显示屏或者与终端相连的其他设备的显示屏中展示出来,如图3所示,为该唤醒模型数据地图的示意图。
在一个具体的实施方式中,终端确定用户在第一坐标所在的位置的第一唤醒率后,若终端具有显示屏,则可以在终端自身的屏幕上显示第一唤醒率,或者在与该终端相连的其他设备的显示屏上显示该第一唤醒率。例如,终端可以是只能音响或具有语音交互功能的空调,可以通过手机或智能电视与其建立通信连接,用户在手机或智能电视上打开演示模式,则可以在手机上显示用户移动后,用户位置所对应的第一唤醒率。
在一个具体的实施方式中,该对应关系也可以和用户的特征形成对应关系,从而终端在检测用户坐标时,同时检测用户的特征数据,并查找到对应的对应关系。具体地,在用户在发出唤醒词时,同一坐标下,同一唤醒词可能不同年龄或不同性别的用户发出的唤醒词的能量值并不相同,这样就导致唤醒率与用户特征可能存在一定关系,因此可以根据不同用户的特征,生成与该特征对应的对应关系。例如,终端在接收用户唤醒时,同时采集用户的特征信息,并将唤醒率,该特征信息、用户坐标以及唤醒次数等数据上传至服务器,服务器根据不同终端上传的数据,进行整理,得到不同用户类型对应的对应关系,例如男性用户的唤醒率与坐标的对应关系,老人的唤醒率与坐标的对应关系等。从而,终端在检测用户坐标时,同时确定用户特征,查找与之对应的对应关系。
S104、终端根据预置的不同坐标和不同唤醒率的对应关系确定第二坐标,该第二坐标对应的第二唤醒率高于第一唤醒率。
在一个具体的实施方式中,终端确定第一坐标对应的第一唤醒率后,根据前述的对应关系,确定唤醒率高于第一唤醒率的区域,并从该区域中确定第二坐标,该第二坐标对应的第二唤醒率高于第一唤醒率。
S105、终端生成提示信息,该指示信息用于指示用户到达第二坐标所在的位置。
在一个具体的实施方式中,终端在确定第二坐标后,可以生成提示信息,该提示信息用于指示用户从第一坐标的位置移动到该第二坐标的位置。其中,该提示信息可以是语音信息,文字信息、图像信息或者视频信息等。例如,该终端可以是智能音响,该提示信息可以为语音形式,比如可以是“当前位置唤醒率较差,请向前移动2米”,该终端可以是智能电视,该提示信息可以以动画形式展示在屏幕上,如图3所示,通过箭头引导用户到达第二坐标的位置。
在一个具体的实施方式中,用户在从第一坐标的位置向第二坐标的位置移动时,可以在终端的显示屏或与终端具有通信连接的其他设备的显示屏上显示用户的移动轨迹,在用户发出唤醒词时,检测用户发出的唤醒词的能量值,并实时在显示屏上显示对应的归一化能量值。由于能量值的真实值为0-1中的一个数字,本实施例中,可以将该唤醒词的能量值归一化为0-100的数值,从而用户在移动过程中,可以从显示屏上看到该归一化能量值,提高用户体验。
在一个具体的实施方式中,在步骤S104之前,终端确定第一坐标对应的第一唤醒率后,可以判断该第一唤醒率是否高于预设的第一预设阈值,若低于第一预设阈值,则终端可以确定用户当前处于低唤醒率区域,此时终端可以根据预置的不同坐标和不同唤醒率的对应关系确定第二坐标,该第二坐标对应的区域为高唤醒率区域,该第二坐标对应的第二唤醒率高于第一唤醒率。
从以上技术方案可以看出,本申请实施例具有以下优点:
在用户通过语音控制语音交互的终端时,终端检测用户当前位置的第一坐标值,根据预置的不同坐标值与不同唤醒率的对应关系,确定该第一坐标值对应的第一唤醒率。之后,终端生成提示信息,通过该提示信息提示用户进入第二坐标值对应的位置,该第二坐标值对应的第二唤醒率的值大于第一唤醒率的值,即通过该提示信息提示用户进入高唤醒区域,提高用户通过语音唤醒终端的成功率,从而提高了用户体验。
下面具体参照图4,图4为本申请实施例提供的一种信息提示的方法的另一个实施例示意图,可以包括:
S401、终端确定用户当前位置对应的第一坐标。
在一个具体的实施方式中,终端被设置当用户进入终端的唤醒区域后,终端确定用户当前位置对应的第一坐标,或者,用户也可以通过遥控设备,打开位置跟踪的开关,从而使得终端确定用户当前位置对应的第一坐标。其中,该遥控设备可以是终端对应的遥控器,或者与终端具有连接关系的其他设备。此外,此处终端确定第一坐标的方式与图1所示的实施例中步骤S102类似,此处不再赘述。
S402、终端根据预置的不同坐标和不同唤醒率的对应关系,确定第一坐标对应的第一唤醒率,第一唤醒率用于指示在第一坐标所在的位置通过语音成功唤醒终端的概率。
S403、终端获取用户发出的语音信号,并记录预设时长内,连续唤醒所述终端未成功的次数。
需要说明的是,步骤S403与步骤S401无必然的执行次序,可以同时执行,并且步骤S402与步骤S403分别与图1所示实施例中步骤S103和步骤S101类似,此处不在赘述。
S404、若该次数大于第一预设阈值,则终端生成指示信息,该指示信息用于指示用户到达第二坐标所在的位置,该第二坐标对应的第二唤醒率高于第一唤醒率。
在一个具体的实施方式中,当用户通过语音连续唤醒终端未成功的次数大于第一预设阈值时,终端根据预先保存的不同坐标与不同唤醒率的对应关系,确定第二坐标,该第二坐标对应的第二唤醒率高于第一唤醒率。之后,终端生成指示信息,该指示信息用于指示用户从当前的位置移动到第二坐标所在的位置,从而使用户获得更好的唤醒体验。需要说明的是,此处终端生成指示信息的方式与图1所示的实施例中步骤S105类似,此处不再赘述。
从以上技术方案可以看出,本申请实施例具有以下优点:
在用户通过语音控制语音交互的终端时,终端检测用户当前位置的第一坐标值,根据预置的不同坐标值与不同唤醒率的对应关系,确定该第一坐标值对应的第一唤醒率。之后,终端生成提示信息,通过该提示信息提示用户进入第二坐标值对应的位置,该第二坐标值对应的第二唤醒率的值大于第一唤醒率的值,即通过该提示信息提示用户进入高唤醒区域,提高用户通过语音唤醒终端的成功率,从而提高了用户体验。
下面具体参照图5,图5为本申请实施例提供的一种信息提示的方法的另一个实施例示意图,可以包括:
S501、终端确定用户当前位置对应的第一坐标。
S502、终端根据预置的不同坐标和不同唤醒率的对应关系,确定第一坐标对应的第一唤醒率,第一唤醒率用于指示在第一坐标所在的位置通过语音成功唤醒终端的概率。
需要说明的是,步骤S501与步骤S502分别与图1所示实施例中步骤。
S503、若第一唤醒率小于第二预设阈值,则终端根据预置的不同坐标和不同唤醒率的对应关系,确定第二坐标,第二坐标对应的第二唤醒率大于第一唤醒率。
在一个具体的实施方式中,当终端检测到用户当前的位置所对应的第一唤醒率小于预设的第二预设阈值时,则终端确定高于第一唤醒率的第二唤醒率对应的第二坐标,其中,确定第二坐标的方式与图1所示实施例中步骤S104类似,此处不再赘述。
S504、终端生成提示信息,该提示信息用于指示用户移动到第二坐标所在的位置。
需要说明的是,步骤S504与图1所示实施例中步骤S105类似,此处不再赘述。
从以上技术方案可以看出,本申请实施例具有以下优点:
在用户通过语音控制语音交互的终端时,终端检测用户当前位置的第一坐标值,根据预置的不同坐标值与不同唤醒率的对应关系,确定该第一坐标值对应的第一唤醒率。之后,终端生成提示信息,通过该提示信息提示用户进入第二坐标值对应的位置,该第二坐标值对应的第二唤醒率的值大于第一唤醒率的值,即通过该提示信息提示用户进入高唤醒区域,提高用户通过语音唤醒终端的成功率,从而提高了用户体验。
下面具体参照图6A,图6A为本申请实施例提供的一种语音交互终端的一个实施例示意图,可以包括:
检测单元S601,用于确定用户当前位置所对应的第一坐标;
处理单元S602,用于根据预置的不同坐标和不同唤醒率的对应关系,确定所述第一坐标对应的第一唤醒率,所述第一唤醒率用于指示在所述第一坐标所在的位置通过语音成功唤醒所述终端的概率;终端生成提示信息,所述指示信息用于指示所述用户到达第二坐标所在的位置,所述第二坐标对应的第二唤醒率高于所述第一唤醒率。
在一个具体的实施方式中,
检测单元S601,具体用于在预设时间内,当用户通过语音连续唤醒所述终端未成功的次数大于第一预设阈值时,确定用户当前位置所对应的第一坐标。
在一个具体的实施方式中,
处理单元S602,具体用于当所述第一唤醒率小于第二预设阈值时,生成指示信息。
在一个具体的实施方式中,
处理单元S602,具体用于在预设时间内,当用户通过语音连续唤醒所述终端未成功的次数大于第一预设阈值时,生成指示信息。
在一个具体的实施方式中,
检测单元S601,具体用于以所述终端为原点,通过摄像头和/或声源定位技术确定所述用户位置所对应的第一坐标。
在一个具体的实施方式中,下面具体参照图6B,图6B为本申请实施例提供的一种语音交互终端的另一个实施例示意图,所述语音交互终端还可以包括:
接收单元S603,用于获取用户用于唤醒所述终端的语音信号;
处理单元S602,还用于对所述语音信号的能量值进行归一化处理,得到归一化能量值;
显示单元S604,用于显示所述归一化能量值。
在一个具体的实施方式中,所述指示信息包括所述第一坐标的位置至所述第二坐标的位置的轨迹信息。
在一个具体的实施方式中,所述指示信息包括语音信息、文字信息、图像信息和/或视频信息。
下面具体参照图7,图7为本申请实施例提供的一种语音交互终端的一个实施例示意图,可以包括:
处理器S701、存储器S702、以及收发器S703;
收发器S703,用于与语音交互终端之外的装置进行通信;
存储器S702,用于存储指令代码;
处理器S701,用于执行存储器S702中存储的所述指令代码,使得所述语音交互终端执行如图1-图5所述实施例及任一可选实施例中的方法。
本申请实施例还提供了一种计算机存储介质,所述介质存储有指令,当所述指令在计算机上运行时,使得计算机执行如图1-图5所述实施例及任一可选实施例中的方法。
本申请实施例还提供了一种计算机程序产品,包括指令,当所述指令在计算机上运行时,使得计算机执行如图1-图5所述实施例及任一可选实施例中的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (19)
1.一种信息提示的方法,其特征在于,所述方法应用于具有语音交互功能的终端上,包括:
所述终端确定用户当前位置所对应的第一坐标;
所述终端根据预置的不同坐标和不同唤醒率的对应关系,确定所述第一坐标对应的第一唤醒率,所述第一唤醒率用于指示在所述第一坐标所在的位置通过语音成功唤醒所述终端的概率;
所述终端生成提示信息,所述指示信息用于指示所述用户到达第二坐标所在的位置,所述第二坐标对应的第二唤醒率高于所述第一唤醒率。
2.根据权利要求1所述的方法,其特征在于,所述终端确定用户当前位置所对应的第一坐标,包括:在预设时间内,当用户通过语音连续唤醒所述终端未成功的次数大于第一预设阈值时,所述终端确定用户当前位置所对应的第一坐标。
3.根据权利要求1或2所述的方法,其特征在于,所述终端生成提示信息,包括:当所述第一唤醒率小于第二预设阈值时,所述终端生成指示信息。
4.根据权利要求1所述的方法,其特征在于,所述终端生成提示信息,包括:在预设时间内,当用户通过语音连续唤醒所述终端未成功的次数大于第一预设阈值时,所述终端生成指示信息。
5.根据权利要求1-4中任一项所述的方法,其特征在于,
所述终端确定用户当前位置所对应的第一坐标,包括:
所述终端以所述终端为原点,通过摄像头和/或声源定位技术确定所述用户位置所对应的第一坐标。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:
所述终端获取用户用于唤醒所述终端的语音信号;
所述终端对所述语音信号的能量值进行归一化处理,得到归一化能量值;
所述终端显示所述归一化能量值。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述指示信息包括所述第一坐标的位置至所述第二坐标的位置的轨迹信息。
8.根据权利要求1-7中任一项所述的方法,其特征在于,所述指示信息包括语音信息、文字信息、图像信息和/或视频信息。
9.一种语音交互终端,其特征在于,包括:
检测单元,用于确定用户当前位置所对应的第一坐标;
处理单元,用于根据预置的不同坐标和不同唤醒率的对应关系,确定所述第一坐标对应的第一唤醒率,所述第一唤醒率用于指示在所述第一坐标所在的位置通过语音成功唤醒所述终端的概率;终端生成提示信息,所述指示信息用于指示所述用户到达第二坐标所在的位置,所述第二坐标对应的第二唤醒率高于所述第一唤醒率。
10.根据权利要求9所述的语音交互终端,其特征在于,
所述检测单元,具体用于在预设时间内,当用户通过语音连续唤醒所述终端未成功的次数大于第一预设阈值时,确定用户当前位置所对应的第一坐标。
11.根据权利要求9或10所述的语音交互终端,其特征在于,所述处理单元,具体用于当所述第一唤醒率小于第二预设阈值时,生成指示信息。
12.根据权利要求9所述的语音交互终端,其特征在于,所述处理单元,具体用于在预设时间内,当用户通过语音连续唤醒所述终端未成功的次数大于第一预设阈值时,生成指示信息。
13.根据权利要求9-12中任一项所述的语音交互终端,其特征在于,
所述检测单元,具体用于以所述终端为原点,通过摄像头和/或声源定位技术确定所述用户位置所对应的第一坐标。
14.根据权利要求9-13中任一项所述的语音交互终端,其特征在于,所述语音交互终端还包括:
接收单元,用于获取用户用于唤醒所述终端的语音信号;
所述处理单元,还用于对所述语音信号的能量值进行归一化处理,得到归一化能量值;
显示单元,用于显示所述归一化能量值。
15.根据权利要求9-14中任一项所述的语音交互终端,其特征在于,所述指示信息包括所述第一坐标的位置至所述第二坐标的位置的轨迹信息。
16.根据权利要求9-15中任一项所述的语音交互终端,其特征在于,所述指示信息包括语音信息、文字信息、图像信息和/或视频信息。
17.一种语音交互终端,其特征在于,包括:
处理器、存储器、以及收发器;
所述收发器用于与所述语音交互终端之外的装置进行通信;
所述存储器用于存储指令代码;所述处理器执行所述指令代码时,使得所述终端执行如权利要求1-8中任一项所述的方法。
18.一种计算机存储介质,其特征在于,所述介质存储有指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至8中任一项所述的方法。
19.一种计算机程序产品,其特征在于,包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910555553.6A CN110390934B (zh) | 2019-06-25 | 2019-06-25 | 一种信息提示的方法和语音交互终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910555553.6A CN110390934B (zh) | 2019-06-25 | 2019-06-25 | 一种信息提示的方法和语音交互终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110390934A true CN110390934A (zh) | 2019-10-29 |
CN110390934B CN110390934B (zh) | 2022-07-26 |
Family
ID=68285898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910555553.6A Active CN110390934B (zh) | 2019-06-25 | 2019-06-25 | 一种信息提示的方法和语音交互终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110390934B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111076355A (zh) * | 2019-12-17 | 2020-04-28 | 宁波奥克斯电气股份有限公司 | 一种语音唤醒指令处理方法、装置、终端及存储介质 |
CN111613232A (zh) * | 2020-05-22 | 2020-09-01 | 苏州思必驰信息科技有限公司 | 多终端设备语音交互方法及*** |
CN112164396A (zh) * | 2020-09-28 | 2021-01-01 | 北京百度网讯科技有限公司 | 语音控制方法、装置、电子设备及存储介质 |
CN113380240A (zh) * | 2021-05-07 | 2021-09-10 | 荣耀终端有限公司 | 语音交互方法和电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510425A (zh) * | 2008-02-15 | 2009-08-19 | 株式会社东芝 | 声音识别装置以及用于执行声音识别的方法 |
CN105261368A (zh) * | 2015-08-31 | 2016-01-20 | 华为技术有限公司 | 一种语音唤醒方法及装置 |
US20160203828A1 (en) * | 2015-01-14 | 2016-07-14 | Honda Motor Co., Ltd. | Speech processing device, speech processing method, and speech processing system |
CN106328132A (zh) * | 2016-08-15 | 2017-01-11 | 歌尔股份有限公司 | 一种智能设备的语音交互控制方法和装置 |
CN107622770A (zh) * | 2017-09-30 | 2018-01-23 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
CN108735218A (zh) * | 2018-06-25 | 2018-11-02 | 北京小米移动软件有限公司 | 语音唤醒方法、装置、终端及存储介质 |
CN109243441A (zh) * | 2018-09-26 | 2019-01-18 | 广东小天才科技有限公司 | 调整语音采集距离的引导方法、装置、终端及存储介质 |
EP3451335A1 (en) * | 2016-04-29 | 2019-03-06 | Vtouch Co., Ltd. | Optimum control method based on multi-mode command of operation-voice, and electronic device to which same is applied |
-
2019
- 2019-06-25 CN CN201910555553.6A patent/CN110390934B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510425A (zh) * | 2008-02-15 | 2009-08-19 | 株式会社东芝 | 声音识别装置以及用于执行声音识别的方法 |
US20160203828A1 (en) * | 2015-01-14 | 2016-07-14 | Honda Motor Co., Ltd. | Speech processing device, speech processing method, and speech processing system |
CN105261368A (zh) * | 2015-08-31 | 2016-01-20 | 华为技术有限公司 | 一种语音唤醒方法及装置 |
EP3451335A1 (en) * | 2016-04-29 | 2019-03-06 | Vtouch Co., Ltd. | Optimum control method based on multi-mode command of operation-voice, and electronic device to which same is applied |
CN106328132A (zh) * | 2016-08-15 | 2017-01-11 | 歌尔股份有限公司 | 一种智能设备的语音交互控制方法和装置 |
CN107622770A (zh) * | 2017-09-30 | 2018-01-23 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
CN108735218A (zh) * | 2018-06-25 | 2018-11-02 | 北京小米移动软件有限公司 | 语音唤醒方法、装置、终端及存储介质 |
CN109243441A (zh) * | 2018-09-26 | 2019-01-18 | 广东小天才科技有限公司 | 调整语音采集距离的引导方法、装置、终端及存储介质 |
Non-Patent Citations (2)
Title |
---|
ZE LEI,等: "Artificial Robot Navigation based on Gesture and Speech Recognition", 《SPAC》, 19 October 2014 (2014-10-19), pages 323 - 327, XP032705053, DOI: 10.1109/SPAC.2014.6982708 * |
李春玉等: "不同等级背景噪音与距离条件下听障幼儿语音识别能力研究", 《教育研究》, 31 October 2013 (2013-10-31), pages 40 - 41 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111076355A (zh) * | 2019-12-17 | 2020-04-28 | 宁波奥克斯电气股份有限公司 | 一种语音唤醒指令处理方法、装置、终端及存储介质 |
CN111076355B (zh) * | 2019-12-17 | 2021-11-05 | 宁波奥克斯电气股份有限公司 | 一种语音唤醒指令处理方法、装置、终端及存储介质 |
CN111613232A (zh) * | 2020-05-22 | 2020-09-01 | 苏州思必驰信息科技有限公司 | 多终端设备语音交互方法及*** |
CN112164396A (zh) * | 2020-09-28 | 2021-01-01 | 北京百度网讯科技有限公司 | 语音控制方法、装置、电子设备及存储介质 |
CN113380240A (zh) * | 2021-05-07 | 2021-09-10 | 荣耀终端有限公司 | 语音交互方法和电子设备 |
CN113380240B (zh) * | 2021-05-07 | 2022-04-12 | 荣耀终端有限公司 | 语音交互方法和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110390934B (zh) | 2022-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110390934A (zh) | 一种信息提示的方法和语音交互终端 | |
CN106898348B (zh) | 一种出声设备的去混响控制方法和装置 | |
CN109918975A (zh) | 一种增强现实的处理方法、对象识别的方法及终端 | |
CN107528755A (zh) | 智能设备的控制方法、装置、设备和存储介质 | |
CN105393302A (zh) | 多级语音识别 | |
CN105654949A (zh) | 一种语音唤醒方法及装置 | |
CN106205628B (zh) | 声音信号优化方法及装置 | |
CN106847298A (zh) | 一种基于弥漫式语音交互的拾音方法和装置 | |
US20170109756A1 (en) | User Unsubscription Prediction Method and Apparatus | |
CN104714895A (zh) | 一种移动终端及其提高运行速度的方法和装置 | |
CN107123429A (zh) | 音频信号的自动增益控制方法和装置 | |
CN105396289A (zh) | 实时游戏和多媒体会话过程中实现特效的方法及装置 | |
US20190205786A1 (en) | Method and system for classifying time-series data | |
CN105357295A (zh) | 语音交互方法、装置及*** | |
CN106778117A (zh) | 权限开启方法、装置及*** | |
CN107491101A (zh) | 一种麦克风阵列拾音角度的调节方法、装置及电子设备 | |
KR20170006120A (ko) | 재실 추론 확률에 기반한 홈 IoT 제어 시스템 및 홈 IoT 제어 방법 | |
CN107786714B (zh) | 基于车载多媒体设备的语音控制方法、装置及*** | |
Huang et al. | Distributed-neuron-network based machine learning on smart-gateway network towards real-time indoor data analytics | |
CN111613232A (zh) | 多终端设备语音交互方法及*** | |
CN109256151A (zh) | 通话语音调控方法、装置、移动终端及可读存储介质 | |
CN110096249A (zh) | 用于提示快捷唤醒词的方法、装置和*** | |
CN106101776A (zh) | 音量调节的方法、智能设备及音箱 | |
CN110309339A (zh) | 图片标签生成方法及装置、终端及存储介质 | |
CN110517677A (zh) | 语音处理***、方法、设备、语音识别***及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |