CN1727911A

CN1727911A - 声控定位***及方法

Info

Publication number: CN1727911A
Application number: CNA2004100545955A
Authority: CN
Inventors: 严嘉鑫; 吴建明; 林哲民; 邱毓翰
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2004-07-26
Filing date: 2004-07-26
Publication date: 2006-02-01

Abstract

一种声控定位***及方法，包含多个接收器、一个延迟估测器、一个***、一个移位器、一个信号分离器、一个数据库、一个声音分类器、多个受控器及一个控制器。每个接收器可以接收声音信号，延迟估测器可以计算声音信号间的时间延迟参数，***可以定位出声音源所在的位置，移位器可以使声音信号在调整后有相同的时间延迟，信号分离器可将信号中的噪声去除且分离出独立的声音信号，声音分类器可找出信号所对应的指令，并将该指令送至控制器，受控器可控制受控设备的动作，控制器接收动作指令及***定位出的位置，并将该等信息送至该命令所对应的受控器。

Description

声控定位***及方法

技术领域

本发明是有关于一种定位***及方法，特别是指一种声控定位***及方法。

背景技术

已知的声控家电，是使用者用声音对该家电用品下达控制指令，例如：发出“开电扇”的动作指令，则该电扇在接受的该动作指令后将会开始运转。但已知的声控家电在下达指令时，必须近距离对着安装于该电器上的声音接收器或对着安装有该电器的声音接收器的遥控器说出指令，因此，使用者无法在屋内的任一位置以语音方式操控多个电器。所以此种声控家电***在使用上并不方便。

此外，以知之声控家电只能有效地控制家电产品的简单功能，如：开机、关机、增加风量等，而无法使该等家电产品具备有追踪的功能，及该家电***无法定位出发出声音的使用者的位置，故处于屋内的使用者必须重复下达多重指令才能使电扇或冷气机的出风口转向自己，故在使用上并不人性化。

发明内容

因此，本发明的目的是提供一种声控定位***，该***可以以声控方式操控多个受控设备。

因此，本发明的另一个目的是提供一种声控定位方法，该方法功能追踪出声音源的位置，因而可达到定位的效果

于是，本发明的声控定位***适用于以声音操控多个受控设备，该***包含多个接收器、延迟估测器、***、移位器、信号分离器、数据库、声音分类器、多个受控器及控制器。

每个接收器可接收声音信号。而该延迟估测器与该多个接收器电连接，并接收该多个接收器传来的声音信号，并且可以计算每两个接收器接收到的声音信号之间的时间延迟参数。而该***与该延迟估测器电连接，并可接收该延迟估测器计算出的时间延迟参数以定位出声音源所在的位置。

该移位器与该延迟估测器电连接，并可接收该延迟估测器计算出的时间延迟参数，以对该等接收器接收到的声音信号做调整，使该等声音信号在调整后能有相同的时间延迟。该信号分离器与该移位器电连接，并可将该移位器处理后的信号中的噪声去除，且从该信号中分离出至少一个独立的声音信号。

该数据库可存储多种资料。而该声音分类器可接收该信号分离器分析出的信号，并与该数据库中的资料比较以找出该独立声音信号所对应的指令，并将该指令送至该控制器。该多个受控器分别与该多个受控设备电连接并可控制该多个受控设备的动作。该控制器接收该声音分类器传来的动作指令，及该***定位出的位置，并将该等信息送至该命令所对应的受控器。

于是，本发明的声控定位方法适用于以声音操控多个受控设备，包含步骤：

(A)接收声音信号；

(B)计算该等声音信号之间的时间延迟参数；

(C)根据步骤(B)计算出的时间延迟参数定位出声音源的位置，且调整接收到的声音信号，使该多个声音信号有相同的时间延迟；

(D)将声音信号的噪声去除，并将来自不同声音源的信号分离出来，且判断分离出的独立信号是否有需要分析的命令信号，当有需要分析的命令信号时，则执行步骤(E)，若否，则执行步骤(A)；

(E)判断此时的声音信号是否为动作指令，若是，则执行步骤(F)，若否，则执行步骤(A)；及

(F)将该动作指令送至所对应的受控设备。

本发明的功效在于使用者不需处于特定位置即能够以声控方式控制多个受控设备，此外，本发明更可用来当作安全防盗***，以定位出小偷入侵的位置。

附图说明

图1是根据本发明的声控定位***及方法的优选实施例的***架构图；

图2是该优选实施例的示意图，说明多个受控设备及多个接收器的位置；和

图3是该优选实施例的流程图。

具体实施方式

有关本发明的前述及其它技术内容、特点与功效，通过下面配合参考附图的优选实施例的详细说明，将会更清楚地理解。

如图1所示，本发明的声控定位***及方法适用于控制多个受控设备10，包含四个接收器1、一个延迟估测器2、一个***3、一个控制器4、一个移位器5、一个信号分离器6、一个声音分类器(Sound Classification)7、一个数据库8及四个受控器9。

参考图2，该多个受控器9分别与该多个受控设备10电连接并可根据该控制器4传送来的信息控制该多个受控设备10的动作。在本实施例中，该多个受控设备10包括摄影机101、电扇102、冷气机103及具有旋转座105的电视机104，应该理解，本发明的受控设备不限于此。

该数据库8存储多种语音资料，该多种语音资料可由使用者预录或是通过搜集其它语音数据库的资料而得到。而该多种语音资料包括有一般的动作指令，例如：“开电扇”、“强风”、“弱风”、“关电扇”、“开电视”、“增加频道”、“音量加大”等用来操控该多个受控设备10的指令，此外，该语音资料也包括警铃声、玻璃破碎声、汽车发出的警报声等声音。

在本实施例中，每个接收器1是麦克风，该多个接收器1分别安装于屋内的天花板的四个角落。然而，值得注意的是，也可视使用情形将该多个接收器1安装于搂梯口、大门上、甚至户外等环境中。而该多个接收器1分别与该移位器5及该延迟估测器2电连接，且每个接收器1可接收一声音信号并将接收到的声音信号传送至该移位器5及该延迟估测器2。值得注意的是，接收器1的数量并不以此为限，只要有两个以上的接收器1都可实现本发明的目的。

该延迟估测器2接收该多个接收器1传来的声音信号，并可利用互相关(Cross-correlation)的方法来计算每两个接收器1接收到的声音信号之间的时间延迟(Time Delay)参数。并将计算出的时间延迟参数送至该***3及该移位器5。

该***3可利用接收到的时间延迟参数定位出声音源所在的位置，而该***3所采用的定位方法可使用，例如：美国专利No.5778082、6243322B1及6469732B1中所提出的方法中的一种，或是R.O.Schmidt于1981年在加州史丹佛大学所提出的博士论文“ASignal Subspace Approach to Multiple Emitter Location and SpectralEstimation”中所提出的“MUSIC Algorithm”法。

该移位器5与该信号分离器6电连接，而因为发出声音的声音源并不一定刚好位于四个接收器1的中心，故该四接收器1接收到的声音信号将会产生不同大小的延迟，故该移位器5的功用即是利用从该延迟估测器2接收到的时间延迟参数对该四接收器1接收到的声音信号做调整，使该等声音信号在调整后能有相同的时间延迟，以利后续的信号分离器6进行分析。

该信号分离器6接收由该移位器5处理后的信号，但因为该多个信号含有噪声的成分，故该信号分离器6可将信号中的噪声去除，此外，在同一时间内可能不只一个声音源发出声音，例如：当一个使用者发出“开电视”的声音时，可能同时有玻璃破碎声，而混杂了此两种声音的信号将同时传入该信号分离器6，而该信号分离器6将接收此混合的信号，并利用不同的信号源相互独立的统计特性分离出混合前的各个信号源的信号。

分离后的各音源信号则利用特征提取(Feature Extraction)的方式判断何者是命令信号，而在此可利用声音的频率高低或是声音的振幅波形当作该等声音源信号的特征，如：玻璃破碎声的音量变化较急剧且频率偏高，而人发出的语音的越零率(Zero-Crossing Rate)则会较高，且振幅呈次高斯分布(Sub-gaussian Distribution)。而本发明的信号分离器6可采用美国专利No.6424960B 1、欧洲专利No.EP0990306或是R.M.Everson与S.J.Roberts于2000年在Journalof VLSI Signal Processing-Systems for Signal，Image，and VideoTechnology，Vol.26，pp.15-24提出的“On-line Blind Source Separationof Non-Stationary Signals”中提出的技术方案。

声音分类器7可接收该信号分离器6分析出的信号，并与该数据库8中的语音信号比较，以找出该声音信号所对应的指令，并将该指令送至该控制器4，而该声音分类器7所采用例如，Tong Zhang于2001年在IEEE Transactions on Speech and Audio Processing，Vol.9，pp.441-457所提出的“Audio Content Analysis for On-line AudiovisualData Segmentation and Classification”的方法或是其它可达到相同功效的语音识别方法。

该控制器4包括无线发射模块，而每个受控器9都包括一个无线接收模块，且该多个无线接收模块可接收该控制器4的无线发射模块发出的信号，而该无线发射模块、无线接收模块所使用的传输技术包括射频传输、红外线传输等方式。该控制器4接收该声音分类器7传来的动作指令，及该***3定位出的位置，并将该等信息透过该无线发射模块送至该命令所对应的无线接收模块。

本发明的流程如图3所示：步骤S1是该等接收器1分别接收使用者发出的声音信号，例如：“开电视”。步骤S2是该延迟估测器2计算出由该四个接收器1接收到的声音信号的时间延迟参数，并将计算结果送至该移位器5及该***3。步骤S3是该***3定位出声音源的位置，并将定位出的位置信息送至该控制器4。而在执行步骤S3时，也同时执行步骤S4，步骤S4是该移位器5调整四个接收器1接收到的声音信号，使该多个声音信号有相同的时间延迟。

步骤S5是该信号分离器6将接收到的声音信号的噪声去除，并将来自不同声音源的信号分离出来，且判断分离出的独立信号是否有需要分析的声音，还是都是一些噪声声，如：电机运转声、鸟叫声。当有需要分析的声音时，则跳到步骤S6，若否，则跳回步骤S1。

而步骤S6是该声音分类器7根据该数据库8的信息判断此时的声音信号是属于哪一个动作指令，若有对应到该数据库8所存储的指令，则跳到步骤S7，若无对应的，则跳回步骤S1。步骤S7是该控制器4将该动作指令送至所对应的受控设备10。而步骤S8则是该受控设备10执行该动作指令所对应的动作。例如：如果安装在该电视104上的受控器9接收到该“开电视”的动作指令及使用者的位置信息。则该受控器9将开启该电视104，并控制该旋转座105使该电视104能转向使用者的位置的方向。

本发明除了可用于控制家电用品外，更可作为防盗设施，例如：当一小偷打破窗户的玻璃入侵到家中，则在执行步骤S1时，该多个接收器1可接收到玻璃破碎声的声音信号。并依序执行步骤S2～S9，则在执行步骤S3时，将定位出发出玻璃破碎声的位置，即小偷的位置。而在执行步骤S6时，判断出该玻璃破碎声所对应的动作指令是激活该摄影机101。则在步骤S7时，该控制器4将控制该摄影机101旋转至发出玻璃破碎声的位置以摄取小偷的影像。此外，使用者也可额外设定玻璃破碎声所对应的动作指令可激活警铃或与其它安全***联机。

如上所述，本发明的声控定位***因同时具有声控功能及定位功能，故使用者不需处于特定位置或朝某一特定方向发出动作指令即可控制多个受控设备，且因为能侦测出声音源的位置，故该多个受控设备可视使用情形调整至该使用者或声音源的位置，此外，本发明更可用来当作安全防盗***，故不仅在使用上具有便利性更具有保全功能，所以确实能达到本发明的目的。

以上所描述的仅为本发明的优选实施例，而不是以此限定本发明的实施范围，在本申请范围及发明说明书内容所作的简单的等效变化与修改，皆应仍属本发明专利涵盖的范围内。

附图组件符号的简单说明

1 接收器

2 延迟估测器

3 ***

4 控制器

5 移位器

6 信号分离器

7 声音分类器

8 数据库

9 受控器

10 受控设备

101 摄影机

102 电扇

103 冷气机

104 电视机

105 旋转座

S1～S9步骤

Claims

1.一种声控定位***，适用于以声音操控多个受控设备，包括：

多个接收器，每个接收器可接收声音信号；

延迟估测器，与该多个接收器电连接，并接收该多个接收器传来的声音信号，且可计算每两个接收器接收到的声音信号之间的时间延迟参数；

***，与该延迟估测器电连接，并可接收该延迟估测器计算出的时间延迟参数以定位出声音源所在的位置；

移位器，与该延迟估测器电连接，并可接收该延迟估测器计算出的时间延迟参数，以对该多个接收器接收到的声音信号做调整，使该多个声音信号在调整后具有相同的时间延迟；

信号分离器，与该移位器电连接，并可将该移位器处理后的信号中的噪声去除，且从该信号分离出至少一个独立的声音信号；

数据库，存储多种资料；

声音分类器，可接收该信号分离器分析出的信号，并与该数据库中的资料比较，以找出该独立声音信号所对应的指令，并将该指令送至该控制器；

多个受控器，分别与该多个受控设备电连接并可控制该多个受控设备的动作；及

控制器，接收该声音分类器传来的动作指令，及该***定位出的位置，并将该多个信息送至该命令所对应的受控器。

2.根据权利要求1所述的声控定位***，其中，该信号分离器是利用不同信号源相互独立的统计特性来分离出不同的独立信号。

3.根据权利要求1所述的声控定位***，其中，该信号分离器是利用特征提取的方式来判断哪个独立信号是命令信号。

4.根据权利要求1所述的声控定位***，其中，该信号分离器是利用声音的频率高低来判断哪个独立信号是命令信号。

5.根据权利要求1所述的声控定位***，其中，该信号分离器是利用声音的振幅波形来判断哪个独立信号是命令信号。

6.根据权利要求1所述的声控定位***，其中，每个接收器是一个麦克风。

7.根据权利要求1所述的声控定位***，其中，该控制器是利用有线传输的方式将该动作指令送至所对应的受控器。

8.根据权利要求1所述的声控定位***，其中，该控制器包括无线发射模块，而每个受控器都包括一个无线接收模块，且该多个无线接收模块可接收该控制器的无线发射模块发出的信号。

9.根据权利要求8所述的声控定位***，其中，该无线发射模块及每个无线接收模块所使用的传输技术为射频传输。

10.根据权利要求8所述的声控定位***，其中，该无线发射模块及每个无线接收模块所使用的传输技术为红外线传输。

11.一种声控定位方法，适用于以声音操控多个受控设备，包括步骤：

(A)接收声音信号；

(B)计算该多个声音信号之间的时间延迟参数；

(C)根据步骤(B)计算出的时间延迟参数定位出声音源的位置，且调整接收到的声音信号，使该多个声音信号具有相同的时间延迟；

(D)将声音信号的噪声去除，并将来自不同声音源的信号分离出来，且判断分离出的独立信号是否有需要分析的命令信号，当有需要分析的命令信号时，则执行步骤(E)，若否，则返回步骤(A)；

(E)判断此时的声音信号是否为一动作指令，若是，则执行步骤(F)，若否，则返回步骤(A)；和

(F)将该动作指令送至所对应的受控设备。

12.根据权利要求11所述的声控定位方法，其中，在步骤(D)中，是利用不同信号源相互独立的统计特性来分离出不同的独立信号。

13.根据权利要求11所述的声控定位方法，其中，在步骤(D)中，是利用特征提取的方式来判断哪个独立信号是命令信号。

14.根据权利要求11所述的声控定位方法，其中，在步骤(D)中，是利用声音的频率高低来判断哪个独立信号是命令信号。

15.根据权利要求11所述的声控定位方法，其中，在步骤(D)中，是利用声音的振幅波形来判断哪个独立信号是命令信号。

16.根据权利要求11所述的声控定位方法，其中，在步骤(F)中，是利用射频无线传输的方式将该动作指令送至所对应的受控设备。

17.根据权利要求11所述的声控定位方法，其中，在步骤(F)中，是利用红外线无线传输的方式将该动作指令送至所对应的受控设备。

18.根据权利要求11所述的声控定位方法，其中，在步骤(F)中，是利用有线传输的方式将该动作指令送至所对应的受控设备。