CN109215666A - 智能支架、音频信号的传输方法、人机交互的方法及终端 - Google Patents

智能支架、音频信号的传输方法、人机交互的方法及终端 Download PDF

Info

Publication number
CN109215666A
CN109215666A CN201811011276.4A CN201811011276A CN109215666A CN 109215666 A CN109215666 A CN 109215666A CN 201811011276 A CN201811011276 A CN 201811011276A CN 109215666 A CN109215666 A CN 109215666A
Authority
CN
China
Prior art keywords
audio signal
voice data
terminal
audio
supports made
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811011276.4A
Other languages
English (en)
Inventor
段乾帅
***
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yude Technology Co Ltd
Original Assignee
Shanghai Yude Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yude Technology Co Ltd filed Critical Shanghai Yude Technology Co Ltd
Priority to CN201811011276.4A priority Critical patent/CN109215666A/zh
Publication of CN109215666A publication Critical patent/CN109215666A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R11/00Arrangements for holding or mounting articles, not otherwise provided for
    • B60R11/02Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Mechanical Engineering (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例涉及智能设备领域,公开了一种智能支架、音频信号的传输方法、人机交互的方法及终端。本发明的智能支架,包括:声音采集模块、音频处理模块以及通信模块;声音采集模块用于采集周围的声音数据,并将采集的声音数据传输至音频处理模块,其中,声音采集模块包括至少两个拾音器;音频处理模块用于对采集的声音数据进行预处理,得到音频信号,并将音频信号传输至通信模块;通信模块用于将音频信号发送至终端,其中,终端根据接收的音频信号进行人机交互处理。本发明提供的智能支架,辅助智能移动设备提高人机交互的效率。

Description

智能支架、音频信号的传输方法、人机交互的方法及终端
技术领域
本发明实施例涉及智能设备领域,特别涉及一种智能支架、音频信号的传输方法、人机交互的方法及终端。
背景技术
随着科技的不断发展,移动智能设备已经融入到我们的生活中,例如,智能手机、智能平板电脑等。由于长时间手持移动智能设备,非常费力;且手持移动智能设备,导致屏幕不断抖动,损坏人眼视力,因此,目前市面上出现了为了固定移动智能设备的支架(例如,车载支架),从而无需人工长时间手持设备,解放双手处理其他的事情。
发明人发现现有技术中至少存在如下问题:目前的支架,一般用于固定移动智能设备,而在需要通过语音对移动智能设备进行人机交互的过程中,移动智能设备采集声音的效率差,不能准确识别出用户的语音命令,例如,在开车过程中,将移动智能设备放置在车载支架上,由于双手需要开车,只能通过语音控制手机(比如播放特定的歌曲),但是,由于移动智能设备与人之间存在一定的距离,移动智能设备采集声音的效果差,从而导致移动智能设备不能获取到准确的识别命令。
发明内容
本发明实施方式的目的在于提供一种智能支架、音频信号的传输方法、人机交互的方法及终端,辅助智能移动设备提高人机交互的效率。
为解决上述技术问题,本发明的实施方式提供了一种智能支架,包括:声音采集模块、音频处理模块以及通信模块;声音采集模块用于采集周围的声音数据,并将采集的声音数据传输至音频处理模块,其中,声音采集模块包括至少两个拾音器;音频处理模块用于对采集的声音数据进行预处理,得到音频信号,并将音频信号传输至通信模块;通信模块用于将音频信号发送至终端,其中,终端根据接收的音频信号进行人机交互处理。
本发明的实施方式还提供了一种音频信号的传输方法,应用于智能支架,包括:采集周围的声音数据,其中,声音数据由至少两个拾音器采集获得;对采集的声音数据进行预处理,得到音频信号;将音频信号发送至终端,其中,终端根据接收的音频信号进行人机交互处理。
本发明的实施方式还提供了一种人机交互的方法,应用于终端,包括:接收智能支架发送的音频信号;将音频信号传输至音频识别装置,其中,音频识别装置用于识别音频信号,并向终端返回识别结果;接收识别结果,并输出识别结果。
本发明的实施方式还提供了一种终端,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的人机交互的方法。
本发明实施方式相对于现有技术而言,智能支架通过声音采集模块采集周围的声源发出的声音数据,并将采集的声音数据传输至音频处理模块,通过音频处理模块对采集的声音进行预处理,得到音频信号,由于声音采集模块包括至少两个拾音器,增加了采集到主声源的声音的概率,提高采集到的声音数据的质量,确保了传输至终端的音频信号的质量,由于音频信号质量的提高,增大了音频信号被识别的概率,进而提高终端进行人机交互处理的效率;采用至少两个拾音器采集声音数据,使得声音数据的数据量大,由音频处理模块对声音数据进行预处理,而不是直接将采集到的声音数据传输至终端,减少了终端对声音数据的处理步骤,同时,将经过预处理后得到音频信号通过通信模块发送至终端,减轻传输数据的负担,从而加快了音频信号的传输速度,提高获取人机交互命令的速度,提高人机交互的效率。
另外,音频处理模块具体用于:按照预设采样速率对声音数据进行采样,得到该声音数据对应的音频信号。按照预设采样速率对声音数据进行采样,确保得到的音频信号所占容量不会过大,确保音频信号的传输速度。
另外,声音采集模块中每个拾音器分别用于采集周围的子声音数据,其中,所有子声音数据组成声音数据;音频处理模块具体用于:根据每个子声音数据的信息,确定主声源对应的子声音数据;并对主声源对应的子声音数据进行消噪处理;按照预设采样速率对进行消噪处理后的子声音数据进行采样,得到音频信号。对主声源对应的子声音数据进行消噪处理,提高主声源对应的子声音数据的质量,进而提高了音频信号的质量。
另外,通信模块,具体用于:对音频信号进行压缩处理,并将压缩后的音频信号发送至终端。对音频信号进行压缩,可以确保音频信号的快速传输。
另外,通信模块,还用于:在音频处理模块得到音频信号之前,将预设采样速率发送至音频处理模块。
另外,通信模块为蓝牙芯片。通信模块为蓝牙芯片,使得音频信号在传输过程中不会占用终端中其他的通信通道,使得终端的接收其他数据的速度不会受到影响。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据本发明第一实施方式提供的一种智能支架的具体结构示意图;
图2是根据本发明第二实施方式提供的一种智能支架中数据传输的示意图;
图3是根据本发明第三实施方式提供的一种智能支架中音频处理模块的具体结构示意图;
图4是根据本发明第四实施方式提供的一种音频信号的传输方法的具体流程示意图;
图5是根据本发明第五实施方式提供的一种人机交互的方法的具体流程示意图;
图6是根据本发明第六实施方式提供的一种人机交互的方法的具体流程示意图;
图7是根据本发明第七实施方式提供的一种人机交互的装置的具体结构示意图;
图8是根据本发明第八实施方式提供的一种终端的具体结构示意图;
图9是根据本发明第九实施方式提供的一种人机交互的***中信号传输的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明的第一实施方式涉及一种智能支架。该智能支架用于固定移动智能设备,例如,在车上通过该智能支架固定手机、平板电脑等。该智能支架10包括:声音采集模块101、音频处理模块102以及通信模块103,该智能支架10的具体结构如图1所示。
声音采集模块101用于采集周围的声音数据,并将采集的声音数据传输至音频处理模块102,其中,声音采集模块101包括至少两个拾音器;音频处理模块102用于对采集的声音数据进行预处理,得到音频信号,并将音频信号传输至通信模块103;通信模块103用于将音频信号发送至终端,其中,终端根据接收的音频信号进行人机交互处理。
具体的说,声音采集模块101包括至少两个拾音器,为了便于拾音器采集声音,可以将拾音器设置在支架面向用于固定终端的一面,例如,智能支架中A面为固定移动智能设备的一面,那么可以在A面的区域内设置拾音器。若声音采集模块101包括两个拾音器,拾音器之间的夹角可以在60~70度之间,以便两个拾音器的拾音范围覆盖最广,当然,两个拾音器之间的夹角也可以是其他度数,此处不作限制。若声音采集模块101包括两个以上的适拾音器,那么该声音采集模块101中的所有的拾音器的拾音范围应当尽量的广,本实施方式不对拾音器的具***置作限制,具体可以根据实际需要进行设置。可以理解的是,拾音器采集的声音数据为模拟信号。
声音采集模块101与音频处理模块102通信连接,声音采集模块101将采集到的声音数据传输至音频处理模块102,音频处理模块102将属于模拟信号的声音数据转化为数字信号,即得到该声音数据的音频信号。音频处理模块102将音频信号传输至通信模块103,通信模块103可以是近距离通信模块,例如:蓝牙芯片,NBIOT模块等,为了便于数据的传输,以及降低智能支架的成本,本实施方式中采用蓝牙芯片,在实际应用中,通信模块不限于本实施方式中所列举的蓝牙芯片。
蓝牙芯片中有单独的存储空间,可以用于存储待发送的音频信号,该智能支架的蓝牙芯片与终端的蓝牙芯片建立蓝牙链路,智能支架中的蓝牙芯片通过与终端建立的该蓝牙链路将音频信号传输至终端。终端在接收到该音频信号后,将该音频信号发送至服务端,由服务端对音频信号进行识别,获取音频信号中的携带的用户发出的语音指令,并根据识别出的语音指令,获取对应的识别结果,例如,识别该音频信号中用户的语音指令为“播放歌曲”,则服务端根据该指令在网络中查找对应的歌曲,并将该歌曲作为识别结果返回终端,由终端的喇叭播放该歌曲。
本发明实施方式相对于现有技术而言,智能支架通过声音采集模块采集周围的声源发出的声音数据,并将采集的声音数据传输至音频处理模块,通过音频处理模块对采集的声音进行预处理,得到音频信号,由于声音采集模块包括至少两个拾音器,增加了采集到主声源的声音的概率,提高采集到的声音数据的质量,确保了传输至终端的音频信号的质量,由于音频信号质量的提高,增大了音频信号被识别的概率,进而提高终端进行人机交互处理的效率;采用至少两个拾音器采集声音数据,使得声音数据的数据量大,由音频处理模块对声音数据进行预处理,而不是直接将采集到的声音数据传输至终端,减少了终端对声音数据的处理步骤,同时,将经过预处理后得到音频信号通过通信模块发送至终端,减轻传输数据的负担,从而加快了音频信号的传输速度,提高获取人机交互命令的速度,提高人机交互的效率。
本发明的第二实施方式涉及一种智能支架。第二实施方式是对第一实施方式的进一步改进,主要改进之处在于:在本发明第二实施方式中,音频处理模块102按照预设采样速率对声音数据进行采样,得到该声音数据对应的音频信号;通信模块103对接收的音频信号进行压缩处理。
一个具体的实现中,音频处理模块102按照预设采样速率对声音数据进行采样,得到该声音数据对应的音频信号。
具体的说,可以在音频处理模块102中设置预设采样速率,而采样速率的高低会影响生成的音频信号的质量,因而采样速率不应过低,预设采样速率是根据实际应用中通信模块103的存储空间以及允许传输的数据量的大小确定,例如,若通信模块为蓝牙芯片,那么可以为采用16KHz的频率,并采用16位(bite)的双通道的格式对声音数据进行采样,此时的采样速率为64KB/S,将64KB/S的采样速率作为预设采样速率。当然,预设采样速率还可以是根据预设采样格式确定出,此处不再一一列举。
在另一个具体的实现中,在音频处理模块102得到音频信号之前,通信模块103将预设采样速率发送至音频处理模块102。
具体的说,通信模块103可以包括接收子模块、存储子模块、压缩子模块以及发送子模块。由于预设采样速率的确定与该智能支架中的通信模块103的存储空间以及允许传输的数据量的大小相关,因此,预设采样速率可以由工程师基于通信模块的存储空间和允许传输的数据量的大小预先确定,并存储在该通信模块103中存储子模块中,可以理解的是,可以在通信模块103的存储子模块中存储多个预设采样速率,可以根据音频处理模块102得到的声音数据的信息(例如,前3个帧的信息分析出对应的预设采样速率),确定出该音频处理模块102合适的预设采样速率,并将确定的预设采样速率通过接收子模块传输给音频处理模块102。
需要说明的是,通信模块103通过内置集成电路(Inter-Integrated Circuit,简称“I2C”)总线传输该预设的采样速率给音频处理模块,音频处理模块102按照预设采样速率对接收到的声音数据进行采样,例如,接收到预设采样频率为64KB/S,那么音频处理模块将按照采用16KHz的频率,并采用16位(bite)的双通道的格式对声音数据进行采样。音频处理模块102将得到的音频信号通过集成电路内置音频总线(Inter—IC Sound,简称“I2S”)总线传输至该通信模块,如图2所示。
一个具体的实现中,通信模块103用于对音频信号进行压缩处理,并将压缩后的音频信号发送至终端。
具体的说,通讯模块103将接收的音频信号通过I2S总线传输至该通信模块103的存储子模块中,为了加快对音频信号的传输速度,通信模块103对存储子模块中的音频信号进行压缩处理,压缩的方式可以根据通信模块103的类型进行选择,例如,若通信模块103为蓝牙芯片,若蓝牙芯片传输数据的格式不支持高级音频编码(Advanced Audio Coding,简称“AAC”)时,可以采用子带编码(Sub-band coding,简称“SBC”)算法对音频数据进行压缩。经过压缩算法之后,原始音频信号的速率将变小,例如,若原始音频信号的速率为64KB/S,那么经过压缩后,可以变为8KB/S,这大大提高了对音频信号的传输速度。
需要说明的,若智能支架的通信模块103为蓝牙芯片,在传输压缩后的音频数据时,可以采用通用属性(generic Attributes,简称“GATT”)协议对传输数据。当然,此处仅为举例,还可以采用其他的通信协议,此处不再列举。
值得一提的是,终端接收到压缩后的音频信号后,需要按照相同算法,对该音频信号进行解压缩,还原为原始的音频信号的速率,例如,原始音频信号的数据格式为“采用16KHz的频率,并采用16位(bite)的双通道的格式”,即该音频信号的速率为64KB/S,压缩后的音频信号的速率为8KB/S,则终端将该压缩后的音频信号进行解压缩,还原为16KHz,并采用16位(bite)的双通道的格式的音频信号,即还原为64KB/S的音频信号。
本实施方式中提供的智能支架,按照预设采样速率对声音数据进行采样,确保生成的音频信号的质量,同时防止音频信号所占容量过大而影响音频信号传输至终端的速度,同时对音频信号进行压缩,可以确保音频信号的快速传输。
本发明的第三实施方式涉及一种智能支架。第三实施方式是对第二实施方式的进一步改进,主要改进之处在于:在本发明第三实施方式中,声音采集模块中每个拾音器分别用于采集周围的子声音数据,而音频处理模块102在确定出主声源对应的子声音数据后,对主声源对应的子声音数据进行消噪处理。
一个具体的实现中,声音采集模块中每个拾音器分别用于采集周围的子声音数据,其中,所有子声音数据组成该声音数据。而音频处理模块102包括主声源确定子模块1021、消噪子模块1022以及音频信号生成子模块1023,该音频处理模块102的具体结构如图3所示。
主声源确定子模块1021用于根据每个子声音数据的信息,确定主声源对应的子声音数据;消噪子模块1022用于对主声源对应的子声音数据进行消噪处理;音频信号生成子模块1023用于按照预设采样速率对进行消噪处理后的子声音数据进行采样,得到音频信号。
具体的说,每个拾音器都生成各自对应的子声音数据,子声音数据的信息可以包括:子声音数据的振幅、频率等信息,主声源确定子模块1021可以根据子声音数据中的振幅的大小以及频率,确定出主声源对应的子声音数据,在确定出主声源对应的子声音数据之后,消噪子模块1022根据主声源对应的子声音数据之外的子声音数据,对主声源对应的子声音数据进行消噪;音频信号生成子模块1023用于按照预设采样速率对进行消噪处理后的子声音数据进行采样,得到音频信号。下面以一个具体的例子进行说明。
例如,声音采集模块中包括3个拾音器,分别为拾音器1、拾音器2以及拾音器3,那么拾音器1采集到子声音数据A,拾音器2采集到子声音数据B,拾音器3采集到子声音数据C,声音数据即包括了子声音数据A、子声音数据B和子声音数据C,若子声音数据A的振动频率高于子声音数据B以及子声音数据C的振动频率;且子声音数据A的这幅也高于子声音数据B以及子声音数据C的振幅,则主声源确定子模块1021确定出主声源对应子声音数据A。消噪子模块1022将子声音数据B和子声音数据C作为当前环境的背景声音,可以消除子声音数据A中含有的子声音数据B以及子声音数据C,从而达到消噪的作用,当然,此处仅列举了一种简单的消噪方式,在实际应用中还可以有其他的消噪方法,例如,在智能支架中增加DSP芯片,对每个拾音器产生的子声音数据进行定位,并根据定位的结果,确定主声源对应的子声音数据,并对主声源对应的子声音数据进行消噪,此处不再一一列举。音频生成子模块按照预设采样频率对经过消噪处理后的子声音数据A进行采样,得到有效的音频信号,即主声源的音频信号。
音频生成子模块1023将生成的音频信号发送至通信模块103,由通信模块103将该音频信号传输至终端。
本实施方式中提供的智能支架,对主声源对应的子声音数据进行消噪处理,提高主声源对应的子声音数据的质量,进而提高了音频信号的质量。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明第四实施方式涉及一种音频信号的传输方法,该音频信号的传输方法应用于智能支架,例如,智能车载支架等。该音频信号的传输方法具体流程如图4所示。
步骤401:采集周围的声音数据,其中,声音数据由至少两个拾音器采集获得。
具体的说,智能支架上设置有至少两个拾音器,智能支架可以实时通过设置的至少两个拾音器采集周围的声音数据,由于每个拾音器采集得到周围的子声音数据,因而,声音数据包含每个拾音器采集到子声音数据。
步骤402:对采集的声音数据进行预处理,得到音频信号。
具体的说,预处理可以是对声音数据进行采样处理,将属于模拟信号的声音数据转化为属于数字信号的音频信号,预处理还可以根据每个子声音数据的信息(例如,子声音数据的振幅、频率等信息),确定出主声源对应的子声音数据,并对该主声源对应的子声音数据进行消噪处理,以提高主声源对应的子声音数据的质量,按照预设采样速率对消噪处理后的主声源对应的子声音数据进行采样,得到音频信号。其中,预设采样速率是根据智能支架传输信号的速度,以及存储空间的大小预先确定。
步骤403:将音频信号发送至终端,其中,终端根据接收的音频信号进行人机交互处理。
具体的说,智能支架将音频信号发送至终端,若终端接收到的音频信号是经过压缩的信号,那么终端还需要音频信号进行解压缩,并将解压缩后的音频信号发送至音频识别装置(如服务器),由音频识别装置对该音频进行识别,并将识别结果返回至终端,由终端输出该识别结果,如识别结果为某某歌曲,那么终端播放该歌曲。
不难发现,本实施方式为与第一实施方式相对应的方法实施例,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第五实施方式涉及一种人机交互的方法。该人机交互的方法应用于终端,终端可以智能手机、智能平板电脑等。该人机交互的方法的具体流程如图5所示。
步骤501:接收智能支架发送的音频信号。
具体的说,用户发出的语音命令,由智能支架采集获得,智能支架对用户发出的语音命令进行处理,提高采集到的语音命令的质量;智能支架将采集到的包含语音命令的音频信号发送给终端,终端接收智能支架发送的音频信号。
需要说明的是,终端可以通过近距离通信模块接收智能支架发送的音频信号,例如,蓝牙芯片等,采用近距离通信模块接收智能支架发送的音频信号,不会占用终端主要的信息传输通道,例如,4G/5G通信通道等。
步骤502:将音频信号传输至音频识别装置,其中,音频识别装置用于识别音频信号,并向终端返回识别结果。
具体的说,音频识别装置可以是服务端,如,服务器、云端等。音频信号可以通过4G/5G等长距离的通信通道传输至音频识别装置。音频识别装置对该音频进行识别,并将识别结果返回至终端,由终端输出该识别结果,如识别结果为某某歌曲,那么终端播放该歌曲。
步骤503:接收识别结果,并输出识别结果。
具体的说,若识别结果也为音频信号,则终端可以通过喇叭播放该音频信号。当然,终端还可以通过显示的方式输出该识别结果。
本发明实施方式相对于现有技术而言,智能支架获取人机交互的音频信号,由智能支架对人机交互的声音数据进行处理,而不是由终端直接采集人机交互的音频信号,减少了终端对声音数据的处理步骤,且由于智能支架包括至少两个拾音器,增加了采集到主声源的声音的概率,提高采集到的声音数据的质量,确保了传输至终端的音频信号的质量,由于音频信号质量的提高,增大了音频信号被识别的概率,进而提高终端进行人机交互的效率。
不难发现,本实施方式为与第一实施方式相对应的终端的方法实施例,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
本发明第六实施方式涉及一种人机交互的方法。第六实施方式是对第五实施方式的进一步改进,主要改进之处在于:在本发明第六实施方式中,接收智能支架发送的音频信号之后,且在将所述音频信号传输至音频识别装置之前,判断音频信号是否为压缩信号,根据判断结果对接收的音频信号进行处理。该人机交互的方法的具体流程如图6所示。
步骤601:接收智能支架发送的音频信号。
步骤602:判断音频信号是否为压缩信号,若是,则执行步骤603,否则直接执行步骤604。
具体的说,智能支架可以指定在音频信号特定帧中,标记是否对该音频信号进行过压缩处理。终端在接收到音频信号,根据特定帧的标记,即可确定出该音频信号是否为压缩信号。当然,还可以采用其他的方式对音频信号是否为压缩信号进行判断,此处不再一一列举。
步骤603:对音频信号进行解压缩处理。
具体的说,终端采用与智能支架相同的压缩算法,对音频信号进行解压缩,例如,若智能支架采用SBC方式对音频信号进行压缩,智能支架将该压缩的音频信号发送给终端,那么终端也采用相同的SBC算法对接收到的音频信号进行解压缩处理。
可以理解的是,终端和智能支架的压缩算法应当采用相同的配置格式。执行完该步骤后,执行步骤604。
步骤604:将音频信号传输至音频识别装置,其中,音频识别装置用于识别音频信号,并向终端返回识别结果。
步骤605:接收识别结果,并输出识别结果。
需要说明的是,本实施方式中步骤601、以及步骤604至步骤605与第五实施方式中的步骤501、以及步骤502至步骤503大致相同,此处将不再进行赘述。
本发明第七实施方式涉及一种人机交互的装置,该人机交互的装置70包括:第一通信模块701、第二通信模块702以及输出模块703;该人机交互的装置的具体结构如图7所示。
第一通信模块701用于接收智能支架发送的音频信号;第二通信模块702用于将音频信号传输至音频识别装置,其中,音频识别装置用于识别音频信号,并向该终端返回识别结果。第二通信模块702还用于接收该音频识别装置返回的识别结果;输出模块703用于根据输出识别结果。
不难发现,本实施方式为与第五实施方式相对应的装置实施例,本实施方式可与第五实施方式互相配合实施。第五实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第五实施方式中。
本发明第八实施方式涉及一种终端,该终端80包括:至少一个处理器801;以及,与至少一个处理器801通信连接的存储器;其中,存储器802存储有可被至少一个处理器801执行的指令,指令被至少一个处理器801执行,以使至少一个处理器801能够执行如第五实施方式或第六实施方式中的人机交互的方法。该终端的具体结构如图8所示。
其中,存储器802和处理器801采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器801和存储器802的各种电路链接在一起。总线还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器801处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器801。
处理器801负责管理总线和通常的处理,还可以提供各种功能,包括定时,***接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
本发明第九实施方式涉及一种人机交互的***,该人机交互的***包括智能支架和终端。该人机交互中信号传输的示意图如图9所示。
用户发出语音命令,智能支架通过声音采集模块101采集周围的声音数据,即将包含有语音命令的声音数据发送至音频处理模块102中;图9中的通信模块103包括:接收子模块、存储子模块、压缩子模块(采用SBC算法)以及发送子模块(采用GATT协议);该通信模块103在音频处理模块102对声音数据进行处理之前,将预设采样速率通过I2C总线发送至该音频处理模块102;音频处理模块102对该声音数据进行处理,将生成的音频信号通过I2S总线传输至通信模块103,通信模块103将接收到的音频信号传输存入到存储空间(即图9中的蓝牙芯片的内存)中,之后通过SBC算法对音频信号进行压缩,将压缩后的音频信号通过GATT协议传输至终端侧,由终端的第一通信模块701(图9中该第一通信模块包括:接收子模块以及对音频信号进行解压缩的解压子模块),终端按照SBC算法对该音频信号进行解压缩,将终端将解压缩后的音频信号通过第二通信模块702发送至服务端,由服务端识别该解压缩后的音频信号,并由服务端将识别结果返回至终端,由终端的输出模块703(如喇叭)输出该识别结果,完成此次的人机交互。需要说明的是,图9仅为说明音频信号的流向,实际应用中不限于图9的所列举的形式。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (10)

1.一种智能支架,其特征在于,包括:声音采集模块、音频处理模块以及通信模块;
所述声音采集模块用于采集周围的声音数据,并将采集的声音数据传输至所述音频处理模块,其中,所述声音采集模块包括至少两个拾音器;
所述音频处理模块用于对所述采集的声音数据进行预处理,得到音频信号,并将所述音频信号传输至所述通信模块;
所述通信模块用于将所述音频信号发送至终端,其中,所述终端根据接收的所述音频信号进行人机交互处理。
2.根据权利要求1所述的智能支架,其特征在于,所述音频处理模块具体用于:
按照预设采样速率对所述声音数据进行采样,得到所述声音数据对应的音频信号。
3.根据权利要求1所述的智能支架,其特征在于,所述声音采集模块中每个拾音器分别用于采集周围的子声音数据,其中,所有子声音数据组成所述声音数据;
所述音频处理模块具体用于:
根据每个子声音数据的信息,确定主声源对应的子声音数据;
并对所述主声源对应的子声音数据进行消噪处理;
按照预设采样速率对进行消噪处理后的子声音数据进行采样,得到所述音频信号。
4.根据权利要求1至3中任一项所述的智能支架,其特征在于,所述通信模块,具体用于:
对所述音频信号进行压缩处理,并将压缩后的音频信号发送至所述终端。
5.根据权利要求2所述的智能支架,其特征在于,所述通信模块,还用于:
在所述音频处理模块得到所述音频信号之前,将预设采样速率发送至所述音频处理模块。
6.根据权利要求1至3中任一项所述的智能支架,其特征在于,所述通信模块为蓝牙芯片。
7.一种音频信号的传输方法,其特征在于,应用于智能支架,包括:
采集周围的声音数据,其中,所述声音数据由至少两个拾音器采集获得;
对采集的声音数据进行预处理,得到音频信号;
将所述音频信号发送至终端,其中,所述终端根据接收的所述音频信号进行人机交互处理。
8.一种人机交互的方法,其特征在于,应用于终端,包括:
接收智能支架发送的音频信号;
将所述音频信号传输至音频识别装置,其中,所述音频识别装置用于识别所述音频信号,并向所述终端返回识别结果;
接收所述识别结果,并输出所述识别结果。
9.根据权利要求8所述的人机交互的方法,其特征在于,所述接收智能支架发送的音频信号之后,且在将所述音频信号传输至音频识别装置之前,所述人机交互的方法还包括:
判断所述音频信号是否为压缩信号,若是,则对所述音频信号进行解压缩处理。
10.一种终端,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求8至9任一所述的人机交互的方法。
CN201811011276.4A 2018-08-31 2018-08-31 智能支架、音频信号的传输方法、人机交互的方法及终端 Pending CN109215666A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811011276.4A CN109215666A (zh) 2018-08-31 2018-08-31 智能支架、音频信号的传输方法、人机交互的方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811011276.4A CN109215666A (zh) 2018-08-31 2018-08-31 智能支架、音频信号的传输方法、人机交互的方法及终端

Publications (1)

Publication Number Publication Date
CN109215666A true CN109215666A (zh) 2019-01-15

Family

ID=64985499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811011276.4A Pending CN109215666A (zh) 2018-08-31 2018-08-31 智能支架、音频信号的传输方法、人机交互的方法及终端

Country Status (1)

Country Link
CN (1) CN109215666A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110139246A (zh) * 2019-05-22 2019-08-16 广州小鹏汽车科技有限公司 车载蓝牙通话的处理方法和装置、汽车以及机器可读介质
CN110213683A (zh) * 2019-04-09 2019-09-06 深圳海岸语音技术有限公司 一种多方向独立拾音***及方法
CN110254364A (zh) * 2019-07-05 2019-09-20 斑马网络技术有限公司 车载支架转向控制方法、车载支架及电子设备
CN113640597A (zh) * 2021-07-16 2021-11-12 瑞芯微电子股份有限公司 一种检测智慧空间设备的方法、存储设备和检测设备的方法、***
CN113905119A (zh) * 2020-06-22 2022-01-07 阿里巴巴集团控股有限公司 终端支架及其控制方法、音频处理方法、音频处理***、电子设备以及计算机可读存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0591013A (ja) * 1991-09-30 1993-04-09 Toshiba Corp 車載用データ通信装置
CN1500311A (zh) * 2001-01-28 2004-05-26 �µ�ͨ�������޹�˾ɳ��Ѷ��·ֹ�˾ 操作车内移动电话的免提通话装置
CN105574952A (zh) * 2015-12-15 2016-05-11 重庆联导金宏电子有限公司 车载信息处理***
CN106412314A (zh) * 2016-10-24 2017-02-15 王家城 一种智能型的手机配件设备
CN106657493A (zh) * 2017-01-05 2017-05-10 尹吉忠 一种智能手机座
CN206210385U (zh) * 2016-12-02 2017-05-31 广州音书科技有限公司 用于远场拾音及移动充电的音频处理装置及***
CN206313849U (zh) * 2017-01-05 2017-07-07 尹吉忠 一种智能手机座
CN206759435U (zh) * 2017-03-29 2017-12-15 深圳分云智能科技有限公司 一种基于语音识别的智能穿戴装置
CN108184182A (zh) * 2017-12-28 2018-06-19 宇龙计算机通信科技(深圳)有限公司 一种耳机及其音频消噪方法
CN108260051A (zh) * 2018-01-15 2018-07-06 深圳前海黑鲸科技有限公司 语音遥控***、便携式传输设备及智能设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0591013A (ja) * 1991-09-30 1993-04-09 Toshiba Corp 車載用データ通信装置
CN1500311A (zh) * 2001-01-28 2004-05-26 �µ�ͨ�������޹�˾ɳ��Ѷ��·ֹ�˾ 操作车内移动电话的免提通话装置
CN105574952A (zh) * 2015-12-15 2016-05-11 重庆联导金宏电子有限公司 车载信息处理***
CN106412314A (zh) * 2016-10-24 2017-02-15 王家城 一种智能型的手机配件设备
CN206210385U (zh) * 2016-12-02 2017-05-31 广州音书科技有限公司 用于远场拾音及移动充电的音频处理装置及***
CN106657493A (zh) * 2017-01-05 2017-05-10 尹吉忠 一种智能手机座
CN206313849U (zh) * 2017-01-05 2017-07-07 尹吉忠 一种智能手机座
CN206759435U (zh) * 2017-03-29 2017-12-15 深圳分云智能科技有限公司 一种基于语音识别的智能穿戴装置
CN108184182A (zh) * 2017-12-28 2018-06-19 宇龙计算机通信科技(深圳)有限公司 一种耳机及其音频消噪方法
CN108260051A (zh) * 2018-01-15 2018-07-06 深圳前海黑鲸科技有限公司 语音遥控***、便携式传输设备及智能设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110213683A (zh) * 2019-04-09 2019-09-06 深圳海岸语音技术有限公司 一种多方向独立拾音***及方法
CN110139246A (zh) * 2019-05-22 2019-08-16 广州小鹏汽车科技有限公司 车载蓝牙通话的处理方法和装置、汽车以及机器可读介质
CN110254364A (zh) * 2019-07-05 2019-09-20 斑马网络技术有限公司 车载支架转向控制方法、车载支架及电子设备
CN113905119A (zh) * 2020-06-22 2022-01-07 阿里巴巴集团控股有限公司 终端支架及其控制方法、音频处理方法、音频处理***、电子设备以及计算机可读存储介质
CN113905119B (zh) * 2020-06-22 2024-06-04 阿里巴巴集团控股有限公司 终端支架及其控制方法、音频处理方法、音频处理***、电子设备以及计算机可读存储介质
CN113640597A (zh) * 2021-07-16 2021-11-12 瑞芯微电子股份有限公司 一种检测智慧空间设备的方法、存储设备和检测设备的方法、***

Similar Documents

Publication Publication Date Title
CN109215666A (zh) 智能支架、音频信号的传输方法、人机交互的方法及终端
CN109246671B (zh) 数据传输方法、装置及***
CN110457256A (zh) 数据存储方法、装置、计算机设备及存储介质
CN103457903B (zh) 一种数字式水下语音通信装置及水下语音通信方法
CN103918284B (zh) 语音控制装置、语音控制方法和程序
CN103514882A (zh) 一种语音识别方法及***
CN113689864B (zh) 一种音频数据处理方法、装置及存储介质
CN106961639A (zh) 一种水下对讲机通信方法及应用该方法的水下通信***
WO2017000772A1 (zh) 一种前端音频处理***
CN108540677A (zh) 语音处理方法及***
CN106372203A (zh) 一种智能终端的信息响应方法、装置和智能终端
CN108111790A (zh) 一种行车记录仪
CN116665692A (zh) 语音降噪方法和终端设备
CN112099655A (zh) 语音鼠标移动办公的实现方法、装置、计算机设备及存储介质
CN208538475U (zh) 一种智能机器人
CN108538295A (zh) 智能车载支架
CN111404998A (zh) 语音交互方法、第一电子设备及可读存储介质
CN108010533A (zh) 音频数据码率的自动识别方法和装置
CN203911924U (zh) 一种带有语音唤醒的蓝牙装置
CN110085231A (zh) 基于usb端口的多mic语音助理模块
CN204614442U (zh) 一种纸质文本音频化与播放***
CN107172521A (zh) 一种用于实时语音识别的蓝牙耳机及***
CN113409788A (zh) 语音唤醒方法、***、设备及存储介质
CN208445563U (zh) 一种高速水声语音通信***
CN112073739A (zh) 一种移动录播控制***及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190115