CN105096936A - 一种即时按键通话业务控制方法和装置 - Google Patents
一种即时按键通话业务控制方法和装置 Download PDFInfo
- Publication number
- CN105096936A CN105096936A CN201410205777.1A CN201410205777A CN105096936A CN 105096936 A CN105096936 A CN 105096936A CN 201410205777 A CN201410205777 A CN 201410205777A CN 105096936 A CN105096936 A CN 105096936A
- Authority
- CN
- China
- Prior art keywords
- phonetic feature
- preserved
- advance
- user
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明实施例公开了一种即时按键通话业务控制方法及装置,其中方法包括:接收语音,解析所接收的语音所具有的语音特征;在预先保存的语音特征中查找是否存在所解析的语音特征,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征;若存在,则触发即时按键通话业务。可见本发明的技术方案能够利用用户的语音特征来触发即时按键通话业务,以避免外界干扰噪声较大或者其他用户的语音干扰造成的即时按键通话业务的误操作。
Description
技术领域
本发明涉及移动通信技术领域,特别是涉及一种即时按键通话业务控制方法及装置。
背景技术
即时按键通话(Push-To-Talk,PTT)业务是指按下一个按键即可通话的业务,为了满足人们的即时通话需求,公网和专网均提供了多种产品和多种应用场合来支持PTT业务,比如:智能手机、对讲机、调度台等。
用户在应用PTT业务时,首先需要通过一定的方式触发PPT业务,现有技术中出现两种PTT业务控制方法用于触发PTT业务,第一种方法是通过检测声音的大小的方式来判断是否触发PTT业务;第二种方法是通过预先设置控制语句,然后检测接收到的语音是否是预先设置的控制语句,如果是则触发PTT业务;在实际应用中,由于人群聚集地方的外界噪声干扰和周围用户干扰声源较多、声音较大,导致采用现有的第一种或者第二种方法均容易产生PTT业务的误操作。
发明内容
为了解决上述技术问题,本发明提供了一种即时按键通话业务控制方法及装置,通过识别用户的语音特征的方式,控制即时按键通话业务,这种方式能够避免外界噪声干扰和周围用户的干扰,更准确地控制即时按键通话业务。
第一方面,本发明提供了一种即时按键通话业务控制方法,该方法包括:
接收语音,解析所接收的语音所具有的语音特征;
在预先保存的语音特征中查找是否存在所解析的语音特征,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征;
若存在,则触发即时按键通话业务。
优选的,在预先保存的语音特征中查找是否存在所解析的语音特征之前,所述方法还包括:
判断所接收的语音的音量是否大于预设阈值,若是,则进行在预先保存的语音特征中查找是否存在所解析的语音特征的操作。
优选的,在预先保存的语音特征中查找是否存在所解析的语音特征之前,所述方法还包括:
识别所接收的语音中是否存在预设控制语句,若是,则进行预先保存的语音特征中查找是否存在所解析的语音特征的操作。
优选的,在预先保存的语音特征中查找是否存在所解析的语音特征之前,所述方法还包括:
判断所接收的语音的音量是否大于预设阈值,若大于,则识别所接收的语音中是否存在预设控制语句,若存在,则进行预先保存的语音特征中查找是否存在所解析的语音特征的操作。
优选的,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征,其中,每个用户的语音特征与用户名一一对应保存,则所述在预先保存的语音特征中查找是否存在所解析的语音特征,若存在,则触发即时按键通话业务,包括:
根据用户选择的用户名,从预先保存的语音特征中提取与所述用户名对应的语音特征;
对比所解析的语音特征与所提取的语音特征是否相同;
若相同,则触发即时按键通话业务。
第二方面,本发明还提供了一种即时按键通话业务控制装置,包括:
接收单元,用于接收语音;
解析单元,用于解析所接收的语音所具有的语音特征;
查找单元,用于在预先保存的语音特征中查找是否存在所解析的语音特征,当存在时,启动触发单元;所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征;
触发单元,用于触发即时按键通话业务。
优选的,所述装置还包括:
第一判断单元,用于判断所接收的语音的音量是否大于预设阈值,若是,则触发所述查找单元执行查找操作。
优选的,所述装置还包括:
第一识别单元,用于识别所接收的语音中是否存在预设控制语句,若是,则触发所述查找单元执行查找操作。
优选的,所述装置还包括:
第二判断单元,用于判断所接收的语音的音量是否大于预设阈值,若大于,则触发第二识别单元执行识别操作;
所述第二识别单元,用于识别所接收的语音中是否存在预设控制语句,若存在,则触发所述查找单元执行查找操作。
优选的,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征,其中,每个用户的语音特征与用户名一一对应保存,则所述查找单元,包括:
提取模块,用于根据用户选择的用户名,从预先保存的语音特征中提取与所述用户名对应的语音特征;
对比模块,用于对比所解析的语音特征与所提取的语音特征是否相同;若相同,则启动触发单元。
通过上述描述可知,本发明的有益效果在于:
本发明即时按键通话业务控制方法及装置,为了降低误操作率,更准确地实现即时按键通话业务的控制,首先,接收语音,解析所接收的语音所具有的语音特征;然后,在预先保存的语音特征中查找是否存在所解析的语音特征,所述预先保存的语音特征是指预先采集设备允许的用户所具有的语音特征并保存在语音特征库中的语音特征;若存在,则触发即时按键通话业务。本发明控制方法及装置,基于用户的语音特征控制PTT业务,避免了外界干扰声音造成的误操作。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例即时按键通话业务控制方法实施例1的流程图;
图2为本发明实施例即时按键通话业务控制方法实施例2的流程图;
图3为本发明实施例即时按键通话业务控制方法实施例3的流程图;
图4为本发明实施例即时按键通话业务控制方法实施例4的流程图;
图5为本发明实施例即时按键通话业务控制方法实施例5的流程图;
图6为本发明实施例即时按键通话业务控制方法实施例6的流程图;
图7为本发明实施例即时按键通话业务控制装置实施例1的结构图;
图8为本发明实施例即时按键通话业务控制装置实施例2的结构图;
图9为本发明实施例即时按键通话业务控制装置实施例3的结构图;
图10为本发明实施例即时按键通话业务控制装置实施例4的结构图;
图11为本发明实施例即时按键通话业务控制装置实施例5的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步描述的详细描述。
请参阅图1,其为本发明实施例揭示的即时按键通话业务控制方法实施例1的流程图,该方法包括:
步骤101,接收语音,解析所接收的语音所具有的语音特征。
在实际应用中,用户可以使用多种不同的终端设备比如:智能手机、对讲机、调度台等,这些终端具有物理PTT按键或者软件PTT按键,能够支持PPT业务,同时,这些终端设备均具有接收语音的功能,不论用户处于什么样的环境,设备均能够接收到语音。下面仅以对讲机为例对本实施例进行解释说明。
当用户在工作繁忙双手不便时,无法抽出手来一直按压PTT按键来触发PTT业务,用户只需要通过语音控制即可,若仅通过语音的声音大小控制,容易产生误操作,比如:用户身边的其他人由于讲话声音过大或者外界的噪声过大而触发用户设备的PTT业务,从而导致误操作频繁发生。若采用的控制语句比较简单,比如:预设的控制语句为“开始”,当用户或者身边的人在讲话中无意识地讲出“开始”这个词语时,就会触发设备的PTT业务,同样也会导致误操作频繁发生。若采用的控制语句比较复杂,用户难以记住,常常在使用时,无法正确操作,或者控制语句被其他人知道后,也容易产生误操作。
为了保证用户对设备PTT业务的正确操作,本实施例利用用户的语音特征来触发PTT业务,由于每个人的语音特征均不相同,即使两个人的语音大小相同,表达的语句相同,也不会影响个人的语音特征。
所谓语音特征可以通过语音的主要特征参数来体现,这些语音特征参数可包括:频率、带宽、幅度、基音频率、平均能量、平价跨零数或者跨零率、共振峰、LP参数倒谱参数、临界带倒谱等参数;对语音的语音特征分析可以通过多种不同的算法来实现,比如:线性预测分析LPC法等。
由于在日常应用中经常会有对讲机用户聚集的情况发生,对于某一用户而言,当他在使用自己的对讲机时,他通过语音控制对讲机,容易受到其他用户声音或者外界噪声等声音的干扰,为了降低或者消除干扰,对讲机在接收用户的语音之后,可以进行过滤处理,从接收到的所有声音中尽可能完整地提取出用户的语音,然后,再利用语音特征分析方法解析出该语音的语音特征,解析出的语音特征为后续的PTT业务的触发打好技术基础。
步骤102,在预先保存的语音特征中查找是否存在所解析的语音特征,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征。若存在,则执行步骤103,触发即时按键通话业务。
为了保证用户触发设备PTT业务的准确性,需要预先保存用户的语音特征,若该设备只允许一个人使用时,则只需要预先采集该用户的语音特征并将其保存。若该设备可允许多个人使用时,则需要预先采集可允许的多个用户的语音特征并将其都保存。对于设备而言,当用户第一次使用该设备时,设备可自动提取用户的语音特征将其保存,当用户下一次使用时,即可利用语音特征信息来触发PTT业务。对于用户而言,想要通过语音特征的方式来触发PTT业务,必须预先将自己的语音特征信息录入设备中。
对于设备而言,当接收到用户的语音信息,解析出语音特征,然后就需要从预先保存的语音特征中查找是否存在当前所解析的语音特征,如果存在,表明当前用户的语音控制是有效的可执行的,因此,触发PTT业务。如果不存在,表明当前用户的语音控制是无效的不可执行的,因此,忽略不做处理,以避免误操作。
通过上述本发明实施例可以看出,将用户的语音特征作为是否触发PTT业务的判断基准,这样能够避免其他用户语音或者外界噪声的干扰而产生的误操作,从而准确控制即时按键通话业务,提高用户的使用体验。
在实际应用中,当多个用户聚集在一起时或者外界干扰声音较大时,对于设备而言并不知道哪个声音是本设备所允许的用户的声音,哪个是其他用户的声音,而哪些是噪音,只要接收到语音,都是先要进行解析语音特征,然后从预先保存的语音特征中查找是否存在所解析的语音特征,如果存在,则触发PTT业务,若某一设备的用户并未发出声音,并未想要触发PTT业务,而身边其他人的声音过大,该用户的设备依旧能够接收到这些声音,进行一系列的操作,就会严重浪费设备资源。基于上述技术问题的考虑,本发明实施例提供以下三个优选方案,分别是实施例2、3以及实施例4。下面依次对这三个优选方案进行解释说明。
首先,请参阅图2,示出的本发明实施例即时按键通话业务控制方法实施例2的流程图,该方法包括:
步骤201,接收语音,解析所接收的语音所具有的语音特征;
步骤202,判断所接收的语音的音量是否大于预设阈值,若是,则执行步骤203。
由于用户在使用设备时,外界环境中的干扰声音较多,比如外界噪声、其他用户的语音等声音,均可能被用户正在使用的设备接收到,考虑到,这些声音的声源可能距离用户正在使用的设备较远,或者这些声音与用户正常的声音相比较小,因此,本步骤可通过判断所接收到的语音的声音大小,初步判断该声音是不是本设备所允许用户发出的声音,如果不是,可以避免后续的查找操作做出无谓的操作浪费设备资源,如果是,再进行后续查找操作。
当然,也可以是在接收语音之后,先判断所接收的语音的音量是否大于预设阈值,若是,则解析所接收的语音所具有的语音特征,然后,再执行步骤203。否则,不进行解析操作、查找操作。这样能够避免接收语音之后,直接进行解析操作,然后,再进行判断操作,若判断结果为否,后续并不需要执行查找操作,导致所解析的语音特征没有任何价值,而解析操作比较耗费资源,因此,这样处理能够更进一步节约设备资源。
步骤203,在预先保存的语音特征中查找是否存在所解析的语音特征,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征;若存在,则执行步骤204。
步骤204,触发即时按键通话业务。
通过上述本发明实施例可以看出,通过判断所接收的语音的音量的方式,来决定是否进行后续的查找操作,由于查找操作具体是对比语音特征信息,过程比较复杂,耗费较多设备资源,利用判断音量的方式,避免多余的查找操作引起的资源浪费现象的出现。
然后,请参阅图3,示出的本发明实施例即时按键通话业务控制方法实施例3的流程图,该方法包括:
步骤301,接收语音,解析所接收的语音所具有的语音特征;
步骤302,识别所接收的语音中是否存在预设控制语句,若是,则执行步骤303。
由于,在某一时间段内,设备只能是归属于一个用户,因此对于设备而言,只能对当前用户的指令做出对应操作,为了避免设备在接收到任何用户的语音都进行查找语音特征的操作,由于解析语音特征、查找语音特征比较复杂耗费设备资源,因此,用户在使用设备之前,可以预先设置一个控制语句用于控制PTT业务,比如:预先设置控制语句为“启动PTT业务”、“开始PTT业务”、“开始”、“start”等任一语句,该控制语句可以是设备所能识别的任一语种的语句,可以是一个词、一句话、一个字母等任意形式。
这样处理后,只有用户自己知道预设的控制语句,其他用户不知道该控制语句,其他用户即使发出声音也无法对该设备产生作用。因此,通过本步骤可以先判断出接收到语音是不是PTT业务的触发语句,如果不是,就不用再进行后续的解析语音特征、查找语音特征等操作,这样就能够避免浪费设备资源。另外,即使该设备的控制语句被其他用户知道并说出时,还能够通过后续的查找操作,做出更准确的判断,从而避免误操作。
当然,也可以是在接收语音之后,先识别所接收的语音中是否存在预设控制语句,若是,则解析所接收的语音所具有的语音特征,然后,再执行步骤303。否则,不进行解析操作、查找操作。这样能够避免接收语音之后,直接进行解析操作,然后,再进行识别操作,若识别结果为否,后续并不需要执行查找操作,导致所解析的语音特征没有任何价值,而解析操作比较耗费资源,因此,这样处理能够更进一步节约设备资源。
步骤303,在预先保存的语音特征中查找是否存在所解析的语音特征,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征;若存在则执行步骤304。
步骤304,触发即时按键通话业务。
通过上述本发明实施例可以看出,利用识别所接收的语音中是否存在预设控制语句的方法,来控制是否进行查找操作,这样既能够避免多余的查找操作引起的资源浪费现象的出现,又能够提高触发PTT业务的可靠性。
最后,请参阅图4,示出的本发明实施例即时按键通话业务控制方法实施例4的流程图,该方法包括:
步骤401,接收语音,解析所接收的语音所具有的语音特征;
步骤402,判断所接收的语音的音量是否大于预设阈值,若大于,则执行步骤403;
步骤403,识别所接收的语音中是否存在预设控制语句,若存在,则执行步骤404;
当然,也可以是在接收语音之后,先判断所接收的语音的音量是否大于预设阈值,若大于,则识别所接收的语音中是否存在预设控制语句,若存在,则解析所接收的语音所具有的语音特征,然后执行步骤404;否则,不进行解析操作、查找操作。
步骤404,在预先保存的语音特征中查找是否存在所解析的语音特征,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征;若存在则执行步骤405。
步骤405,触发即时按键通话业务。
通过上述三个优选方案均可以看出,通过判断所接收的语音的音量是否大于预设阈值和识别所接收的语音中是否存在预设控制语句,两个操作更进一步的保证后续的查找操作的可靠性,避免多余的查找操作浪费设备资源。
由于,在实际应用中触发PTT业务最常用的方式,还是手按压物理PTT按键或者点击软件PTT按键的方式,因此,为了更好的兼容现有设备的按压按键的方式,本发明实施例提供优选方案,具体是在上述任一种实施例的基础上,增加监测即时按键通话业务的按键的按压信号,当监测到按键的按压信号时,触发即时按键通话业务的操作,使得设备既能够利用语音特征触发PTT业务,又能够支持按键方式触发PTT业务。下面仅以实施例1为基础,对该优选方案进行解释说明。
具体请参阅图5,示出的本发明实施例即时按键通话业务控制方法实施例5的流程图,该方法可包括:
步骤501,接收语音,解析所接收的语音所具有的语音特征;
步骤502,在预先保存的语音特征中查找是否存在所解析的语音特征,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征;若存在,则执行步骤504。
步骤503,监测即时按键通话业务的按键的按压信号,当监测到按键的按压信号时,则执行步骤504。
步骤504,触发即时按键通话业务。
需要说明的是,步骤503与步骤501、步骤502之间没有顺序关系,是两个并列执行的操作,任意一个步骤满足条件即执行步骤504。
当然,在实际应用中,也可以设置以PTT物理按键或者软件按键的触发方式为主、以语音特征的触发方式为辅的控制逻辑;或者,也可以设置以语音特征的触发方式为主、以PTT物理按键或者软件按键的触发方式为辅的控制逻辑。
在实际应用中,为了更好地控制PTT业务,还需要考虑如何关闭PTT业务,基于此,在上述实施例的基础上,本发明还提供以下几种实现方式:
当监测到PTT物理或者软件按键的释放信号时,关闭PTT业务;或者,当接收到的语音间断时间大于预设时间时,关闭PTT业务;比如:设备持续接收到用户的语音,当没有接收到语音的时间大于预设时间值时,立刻关闭PTT业务。或者,还可以通过预设关闭控制语句作为关闭PTT业务的控制语句,比如:设置关闭控制语句为“over”、“停止通话”、“byebye”、“关闭PTT业务”等任意语句;当接收到语音为预设的关闭控制语句时,关闭PTT业务。
考虑到有些设备并不是属于一个特定的用户,比如:团队使用对讲机,给每个人分配一个对讲机,但是对于哪个用户使用哪个对讲机是不确定的,因此,为了实现本发明即时按键通话业务控制方法,就需要在设备中预先保存该设备所允许的用户所具有的语音特征,当设备所允许的用户较多时,则设备中预先保存的语音特征的数据量较大,而在接收到语音特征时,就需要遍历所有的语音特征才能保证查找的可靠性,这样使得查找操作需要耗费较大资源,并且查找操作所需的时间较长,严重时会造成延迟,影响用户使用体验;另外,当该设备所允许的用户聚集在一起时,其他用户的语音会对当前用户所使用的设备造成误操作。基于此问题的考虑,本发明实施例提供优选方案以解决该问题。
具体请参阅图6,示出的本发明实施例即时按键通话业务控制方法实施例6的流程图,该方法可包括:
步骤601,接收语音,解析所接收的语音所具有的语音特征;
步骤602,根据用户选择的用户名,从预先保存的语音特征中提取与所述用户名对应的语音特征;所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征,其中,每个用户的语音特征与用户名一一对应保存;
步骤603,对比所解析的语音特征与所提取的语音特征是否相同;若相同,则执行步骤604,触发即时按键通话业务。
从上述本发明实施例可以看出,通过用户名与语音特征一一对应保存的管理方式,能够保证用户在使用设备实现PTT业务时,设备只需要通过当前用户的用户名关联至对应的语音特征,仅进行一次对比操作就能够准备地实现PTT业务控制,避免遍历所有用户的语音特征造成的资源浪费问题。
与上述控制方法实施例1相对应的本发明实施例提供即时按键通话业务控制装置,具体参阅图7,示出的本发明实施例即时按键通话业务控制装置实施例1的结构图,该装置可包括:接收单元701、解析单元702、查找单元703以及触发单元704,下面结合该装置的工作原理对其内部各单元连接关系以及功能进行解释说明。
接收单元701,用于接收语音;
解析单元702,用于解析所接收的语音所具有的语音特征;
查找单元703,用于在预先保存的语音特征中查找是否存在所解析的语音特征,当存在时,启动触发单元,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征;
触发单元704,用于触发即时按键通话业务。
本发明实施例即时按键通话业务控制装置,将用户的语音特征作为是否触发PTT业务的判断基准,这样能够避免其他用户语音或者外界噪声的干扰而产生的误操作,从而准确控制即时按键通话业务,提高用户的使用体验。
与上述控制方法实施例2相对应的本发明实施例提供了控制装置实施例2,具体是在上述控制装置实施例1的基础上增加第一判断单元,以通过判断所接收的语音的音量的方式,来决定是否进行后续的查找操作,由于查找操作具体是对比语音特征信息,过程比较复杂,耗费较多设备资源,利用判断音量的方式,避免多余的查找操作引起的资源浪费现象的出现。
具体请参阅图8,示出的本发明实施例即时按键通话业务控制装置实施例2的结构图,该装置包括五个单元,其中,接收单元801、解析单元802、查找单元803以及触发单元804,与控制装置实施例1中的各单元相同,在此不再赘述。
其中,第一判断单元805,用于判断所接收的语音的音量是否大于预设阈值,若是,则触发所述查找单元执行查找操作。
由于,当第一判断单元判断结果为否时,后续的查找单元和触发单元都不再执行任何操作,导致解析单元解析出的语音特征也就失去意义,解析单元的解析操作需要一定的硬件资源和处理时间,因此,为了避免装置的冗余操作造成资源浪费,本装置的各单元还可以通过以下连接方式进行工作。
首先,接收单元接收语音,然后,第一判断单元进行判断操作,对于第一判断单元805而言,当判断所接收的语音的音量大于预设阈值时,再触发解析单元进行解析操作,然后,再触发查找单元进行查找操作。也就是说,对于控制装置而言,先利用接收单元进行接收语音处理,然后利用第一判断单元进行判断处理,当判断结果为是时,触发解析单元进行解析操作,解析出语音特征之后,再利用查找单元进行查找操作,若查找结果为存在时,再启动触发单元执行触发操作。这样的连接结构能够解析单元进行无意义的操作,避免冗余的操作浪费资源,进一步节约、资源。
与上述控制方法实施例3相对应的本发明实施例提供了控制装置实施例3,具体是在上述控制装置实施例1的基础上增加第二判断单元,具体请参阅9,示出的本发明实施例即时按键通话业务控制装置实施例3的结构图,该装置包括五个单元,其中,接收单元901、解析单元902、查找单元903以及触发单元904,与控制装置实施例1中的各单元相同,在此不再赘述。
其中,第一识别单元905,用于识别所接收的语音中是否存在预设控制语句,若是,则触发所述查找单元执行查找操作。
由于,当第一识别单元识别结果是不存在时,后续的查找单元和触发单元都不再执行任何操作,这种情况导致解析单元解析出的语音特征也就失去意义,然而,解析单元的解析操作需要一定的硬件资源和处理时间,因此,为了避免装置的冗余操作导致的资源浪费,本装置的各单元还可以通过以下连接方式进行工作。
首先,接收单元接收语音,然后,第一识别单元进行识别操作,对于第一识别单元905而言,当识别所接收的语音中存在预设控制语句时,再触发解析单元进行解析操作,然后,再触发查找单元进行查找操作。也就是说,对于控制装置而言,先利用接收单元进行接收语音处理,然后利用识别单元进行识别处理,当识别结果为存在时,触发解析单元进行解析操作,解析出语音特征之后,再利用查找单元进行查找操作,若查找结果为存在时,再启动触发单元执行触发操作。这样的连接结构能够进一步节约装置资源,避免冗余的操作浪费资源。
与上述控制方法实施例4相对应的本发明实施例提供了控制装置实施例4,具体是在上述控制装置实施例1的基础上增加第二判断单元和第二识别单元,具体请参阅10,示出的本发明实施例即时按键通话业务控制装置实施例4的结构图,其中接收单元1001、解析单元1002、查找单元1003以及触发单元1004,与控制装置实施例1中的各单元相同,在此不再赘述。
其中,第二判断单元1005,用于判断所接收的语音的音量是否大于预设阈值,若大于,则触发第二识别单元执行识别操作;
第二识别单元1006,用于识别所接收的语音中是否存在预设控制语句,若存在,则触发所述查找单元执行查找操作。
由于,当第二识别单元识别结果为不存在时,查找单元和触发单元都不再执行操作,也就不再需要解析的语音特征,这种情况下,导致先解析出的语音特征没有任何意义,解析操作就是冗余操作浪费资源。为了避免资源浪费,本实施例装置的各单元还可以通过以下连接方式进行工作,具体是:
当接收单元接收语音之后,第二判断单元进行判断操作,当判断结果为是时,第二识别单元进行识别操作,当识别结果为存在时,触发解析单元进行解析操作,然后再启动查找单元进行查找操作,当查找结果为是时,再启动触发单元执行触发操作。也就是说,解析单元并不是在接收单元接收到语音之后就直接进行解析操作,而是当第二识别单元识别结果为存在时,再进行解析操作,这种连接方式能够避免解析单元进行无意义的操作浪费资源。
与上述控制方法实施例5相对应的本发明实施例提供了控制装置实施例5,具体是在上述控制装置实施例1的基础上增加监测单元,具体请参阅11,示出的本发明实施例即时按键通话业务控制装置实施例5的结构图,该装置包括五个单元,其中,接收单元1101、解析单元1102、查找单元1103以及触发单元1104,与控制装置实施例1中的各单元相同,在此不再赘述。
其中,监测单元1105,用于监测即时按键通话业务的按键的按压信号,当监测到按压信号时,则启动触发单元。
本发明实施例即时按键通话业务控制装置,为用户提供了既能够利用物理PTT按键触发PTT业务,又能够利用用户语音特征来触发PTT业务的控制方式,这种控制方式既能够提高PTT业务的控制的可靠性,又能够提高用户的使用体验。
虽然,设备可以允许多个用户使用,但是,设备并不允许多个用户同时使用,对于某一段时间而言,设备只能归属一个用户,被一个用户使用,为了更准确、更方便地实现当前用户对即时按键通话业务的控制,本发明实施例提供以下优选方案,具体是在上述任意一个控制装置的基础上,所述查找单元依据的预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征,其中,每个用户的语音特征与用户名一一对应保存,则所述查找单元,包括:
提取模块,用于根据用户选择的用户名,从预先保存的语音特征中提取与所述用户名对应的语音特征;
对比模块,用于对比所解析的语音特征与所提取的语音特征是否相同;若相同,若存在,则启动触发单元。
对于控制装置而言,需要预先采集并保存的设备允许的用户所具有的语音特征,其中,每个用户的语音特征与用户名一一对应保存,这样当某个用户使用设备时,可先选择设置自己的用户名,以确定的当前用户情况,当装置接收到语音时,只需要该用户名对应的语音特征进行对比,就能够判断出是否需要触发PTT业务,这样能够避免与***中其他语音特征进行冗余对比造成的设备资源浪费。同时,也避免了设备所允许的其他用户对当前用户使用设备造成的干扰。
需要说明的是,在本文中诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过终端设备的可执行程序来指令相关的硬件来完成,所述的程序可存储于设备可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上对本发明所提供的一种即时按键通话业务控制方法及装置进行了详细介绍,本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种即时按键通话业务控制方法,其特征在于,包括:
接收语音,解析所接收的语音所具有的语音特征;
在预先保存的语音特征中查找是否存在所解析的语音特征,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征;
若存在,则触发即时按键通话业务。
2.根据权利要求1所述的方法,其特征在于,在预先保存的语音特征中查找是否存在所解析的语音特征之前,所述方法还包括:
判断所接收的语音的音量是否大于预设阈值,若是,则进行在预先保存的语音特征中查找是否存在所解析的语音特征的操作。
3.根据权利要求1所述的方法,其特征在于,在预先保存的语音特征中查找是否存在所解析的语音特征之前,所述方法还包括:
识别所接收的语音中是否存在预设控制语句,若是,则进行预先保存的语音特征中查找是否存在所解析的语音特征的操作。
4.根据权利要求1所述的方法,其特征在于,在预先保存的语音特征中查找是否存在所解析的语音特征之前,所述方法还包括:
判断所接收的语音的音量是否大于预设阈值,若大于,则识别所接收的语音中是否存在预设控制语句,若存在,则进行预先保存的语音特征中查找是否存在所解析的语音特征的操作。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征,其中,每个用户的语音特征与用户名一一对应保存,则所述在预先保存的语音特征中查找是否存在所解析的语音特征,若存在,则触发即时按键通话业务,包括:
根据用户选择的用户名,从预先保存的语音特征中提取与所述用户名对应的语音特征;
对比所解析的语音特征与所提取的语音特征是否相同;
若相同,则触发即时按键通话业务。
6.一种即时按键通话业务控制装置,其特征在于,包括:
接收单元,用于接收语音;
解析单元,用于解析所接收的语音所具有的语音特征;
查找单元,用于在预先保存的语音特征中查找是否存在所解析的语音特征,当存在时,启动触发单元;所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征;
触发单元,用于触发即时按键通话业务。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第一判断单元,用于判断所接收的语音的音量是否大于预设阈值,若是,则触发所述查找单元执行查找操作。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第一识别单元,用于识别所接收的语音中是否存在预设控制语句,若是,则触发所述查找单元执行查找操作。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二判断单元,用于判断所接收的语音的音量是否大于预设阈值,若大于,则触发第二识别单元执行识别操作;
所述第二识别单元,用于识别所接收的语音中是否存在预设控制语句,若存在,则触发所述查找单元执行查找操作。
10.根据权利要求6至9中任一项所述的装置,其特征在于,所述预先保存的语音特征是预先采集并保存的设备允许的用户所具有的语音特征,其中,每个用户的语音特征与用户名一一对应保存,则所述查找单元,包括:
提取模块,用于根据用户选择的用户名,从预先保存的语音特征中提取与所述用户名对应的语音特征;
对比模块,用于对比所解析的语音特征与所提取的语音特征是否相同;若相同,则启动触发单元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410205777.1A CN105096936A (zh) | 2014-05-15 | 2014-05-15 | 一种即时按键通话业务控制方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410205777.1A CN105096936A (zh) | 2014-05-15 | 2014-05-15 | 一种即时按键通话业务控制方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105096936A true CN105096936A (zh) | 2015-11-25 |
Family
ID=54577222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410205777.1A Pending CN105096936A (zh) | 2014-05-15 | 2014-05-15 | 一种即时按键通话业务控制方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105096936A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105338429A (zh) * | 2015-12-10 | 2016-02-17 | 南京正泽科技有限公司 | 一种对讲机音频信号中继*** |
CN106331556A (zh) * | 2016-09-20 | 2017-01-11 | 深圳市同行者科技有限公司 | 基于语音识别的违章抓拍控制方法及其装置 |
CN109243447A (zh) * | 2018-10-12 | 2019-01-18 | 西安蜂语信息科技有限公司 | 语音发送触发方法及装置 |
CN109936814A (zh) * | 2019-01-16 | 2019-06-25 | 深圳市北斗智能科技有限公司 | 一种对讲终端、语音对讲协同调度方法及其*** |
CN110752973A (zh) * | 2018-07-24 | 2020-02-04 | Tcl集团股份有限公司 | 一种终端设备的控制方法、装置和终端设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1656366A (zh) * | 2002-05-29 | 2005-08-17 | 诺基亚有限公司 | 数字网络***中用于控制终端设备的传输的方法 |
DE102005014520A1 (de) * | 2005-03-30 | 2006-10-05 | Siemens Ag | PoC-fähige Teilnehmerstation und Verfahren zum Betreiben einer PoC-Verbindung |
WO2009075211A1 (ja) * | 2007-12-10 | 2009-06-18 | Sharp Kabushiki Kaisha | 自動発話者判別記録装置及び自動発話者判別記録システム |
CN102054481A (zh) * | 2009-10-30 | 2011-05-11 | 大陆汽车有限责任公司 | 用于激活和/或进行语音对话的装置、***和方法 |
CN102881287A (zh) * | 2012-09-20 | 2013-01-16 | 熊猫电子集团有限公司 | 一种语音控发方法与电路 |
CN103559883A (zh) * | 2013-08-24 | 2014-02-05 | 郑静晨 | 一种基于语音频域指纹的方舱对讲机开启方法 |
-
2014
- 2014-05-15 CN CN201410205777.1A patent/CN105096936A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1656366A (zh) * | 2002-05-29 | 2005-08-17 | 诺基亚有限公司 | 数字网络***中用于控制终端设备的传输的方法 |
DE102005014520A1 (de) * | 2005-03-30 | 2006-10-05 | Siemens Ag | PoC-fähige Teilnehmerstation und Verfahren zum Betreiben einer PoC-Verbindung |
WO2009075211A1 (ja) * | 2007-12-10 | 2009-06-18 | Sharp Kabushiki Kaisha | 自動発話者判別記録装置及び自動発話者判別記録システム |
CN102054481A (zh) * | 2009-10-30 | 2011-05-11 | 大陆汽车有限责任公司 | 用于激活和/或进行语音对话的装置、***和方法 |
CN102881287A (zh) * | 2012-09-20 | 2013-01-16 | 熊猫电子集团有限公司 | 一种语音控发方法与电路 |
CN103559883A (zh) * | 2013-08-24 | 2014-02-05 | 郑静晨 | 一种基于语音频域指纹的方舱对讲机开启方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105338429A (zh) * | 2015-12-10 | 2016-02-17 | 南京正泽科技有限公司 | 一种对讲机音频信号中继*** |
CN105338429B (zh) * | 2015-12-10 | 2022-05-20 | 南京正泽科技股份有限公司 | 一种对讲机音频信号中继*** |
CN106331556A (zh) * | 2016-09-20 | 2017-01-11 | 深圳市同行者科技有限公司 | 基于语音识别的违章抓拍控制方法及其装置 |
CN110752973A (zh) * | 2018-07-24 | 2020-02-04 | Tcl集团股份有限公司 | 一种终端设备的控制方法、装置和终端设备 |
CN110752973B (zh) * | 2018-07-24 | 2020-12-25 | Tcl科技集团股份有限公司 | 一种终端设备的控制方法、装置和终端设备 |
CN109243447A (zh) * | 2018-10-12 | 2019-01-18 | 西安蜂语信息科技有限公司 | 语音发送触发方法及装置 |
CN109936814A (zh) * | 2019-01-16 | 2019-06-25 | 深圳市北斗智能科技有限公司 | 一种对讲终端、语音对讲协同调度方法及其*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9373322B2 (en) | System and method for determining query intent | |
CN113138743B (zh) | 使用音频水印的关键词组检测 | |
CN110047481B (zh) | 用于语音识别的方法和装置 | |
US20170046124A1 (en) | Responding to Human Spoken Audio Based on User Input | |
CN103888581B (zh) | 一种通信终端及其记录通话信息的方法 | |
CN104834847B (zh) | 身份验证方法及装置 | |
CN105096936A (zh) | 一种即时按键通话业务控制方法和装置 | |
US8417524B2 (en) | Analysis of the temporal evolution of emotions in an audio interaction in a service delivery environment | |
CN106502649A (zh) | 一种机器人服务唤醒方法及装置 | |
US8781826B2 (en) | Method for operating a speech recognition system | |
CN109753663B (zh) | 一种客户情绪分级方法及装置 | |
CN104282307A (zh) | 唤醒语音控制***的方法、装置及终端 | |
CN105469789A (zh) | 一种语音信息的处理方法及终端 | |
CN108028044A (zh) | 使用多个识别器减少延时的语音识别*** | |
WO2020038145A1 (zh) | 一种业务数据处理方法、装置以及相关设备 | |
CN110675873B (zh) | 智能设备的数据处理方法、装置、设备及存储介质 | |
CN103077341A (zh) | 一种应用程序解锁方法及装置 | |
CN107491286A (zh) | 移动终端的语音输入方法、装置、移动终端及存储介质 | |
EP2933789B1 (en) | Security alarm system with adaptive speech processing | |
CN106844335A (zh) | 自然语言处理方法及装置 | |
CN105227557A (zh) | 一种帐号处理方法及装置 | |
US11250854B2 (en) | Method and apparatus for voice interaction, device and computer-readable storage medium | |
CN107799115A (zh) | 一种语音识别方法及装置 | |
CN105611033A (zh) | 一种语音控制的方法及装置 | |
CN111862965A (zh) | 唤醒处理方法、装置、智能音箱及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151125 |
|
RJ01 | Rejection of invention patent application after publication |