CN108269570A - 语音控制背景音乐主机的方法、装置、设备及存储介质 - Google Patents

语音控制背景音乐主机的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN108269570A
CN108269570A CN201810045466.1A CN201810045466A CN108269570A CN 108269570 A CN108269570 A CN 108269570A CN 201810045466 A CN201810045466 A CN 201810045466A CN 108269570 A CN108269570 A CN 108269570A
Authority
CN
China
Prior art keywords
background music
system time
mentioned
host
music host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810045466.1A
Other languages
English (en)
Other versions
CN108269570B (zh
Inventor
叶凯
王飞强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Point Interactive Technology Co
Original Assignee
Shenzhen Point Interactive Technology Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Point Interactive Technology Co filed Critical Shenzhen Point Interactive Technology Co
Priority to CN201810045466.1A priority Critical patent/CN108269570B/zh
Publication of CN108269570A publication Critical patent/CN108269570A/zh
Application granted granted Critical
Publication of CN108269570B publication Critical patent/CN108269570B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/0635Clock or time synchronisation in a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明揭示了一种语音控制背景音乐主机的方法、装置、设备及存储介质,包括:接收通过上位设备特殊翻译的语音控制信号,所述翻译过程包括抓取指定声音组合的语音段落,判定所述语音段落的音长,根据所述语音段落以及音长判定匹配对应的功能命令并生成所述语音控制信号;根据所述语音控制信号进行指定操作。本发明的语音控制背景音乐主机的方法、装置、设备及存储介质的有益效果为:通过增加了语音处理过程,使背景音乐主机能够直接通过使用者的语音控制进行操作,通过增加对语音的判断提高了对使用者语音的识别度,通过增加了时间同步的步骤降低了多设备间同步执行的误差,提高了同步精度。

Description

语音控制背景音乐主机的方法、装置、设备及存储介质
技术领域
本发明涉及到无线通讯领域,特别是涉及到一种语音控制背景音乐主机的方法、装置、设备及存储介质。
背景技术
随着人们生活水平提高,社会科学技术进步,迫切需求智能生活。因此,市场上出现大量的智能家居企业,生产了丰富的智能设备,包括智能网关,智能插座,智能面板等。虽然智能产品丰富,但是传统的交互方式却不能提高用户体验,还需要用户的查找。
普通的背景音乐主机,只能依靠屏幕或者按键和用户进行交互,不能提供语音识别控制进行交互。
发明内容
本发明的主要目的为提供一种语音控制背景音乐主机的方法、装置、设备及存储介质,以达到语音识别控制背景音乐主机的目的。
本发明提出一种语音控制背景音乐主机的方法,包括步骤:
接收通过上位设备特殊翻译的语音控制信号,上述翻译过程包括抓取指定声音组合的语音段落,判定上述语音段落特定语音的音长和音调,根据上述语音段落、音长和音调判定匹配对应的功能命令并生成上述语音控制信号;
根据上述语音控制信号进行指定操作。
进一步地,上述的语音控制背景音乐主机的方法,在上述接收通过上位机翻译的语音控制信号的步骤之前包括步骤:
判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值;
若是,对背景音乐主机的***时间进行同步修正,并将上述差值设为新的判定值。
进一步地,上述的多个无线设备间***时间同步的方法,在上述判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值的步骤之前,还包括步骤:
进行若干次***时间的预同步测试,获取每次同步的上述差值并储存至缓存列表;
将缓存列表内的上述差值进行相互比较得出最小差值,并将上述最小差值设定为判定值。
进一步地,上述的多个无线设备间***时间同步的方法,上述将上述差值设为新的判定值的步骤包括步骤:
将上述差值储存至缓存列表,并将上述缓存列表中的上述差值的最小值作为上述新的判定值。
进一步地,上述的多个无线设备间***时间同步的方法,在上述判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值的步骤之后,还包括步骤:
若否,放弃本次同步,并将上述差值储存至缓存列表。
进一步地,上述的多个无线设备间***时间同步的方法,根据以下公式对背景音乐主机的***时间进行同步修正,
T为背景音乐主机同步修正后的***时间;T1为发起同步请求时背景音乐主机的***时间;T2为接受到同步请求时上位设备的***时间;T3为接收到上位设备同步回复时背景音乐主机的***时间。
进一步地,上述的多个无线设备间***时间同步的方法,在上述判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值的步骤之前,还包括步骤:
获取发起同步请求时背景音乐主机的***时间;
获取接收到上位设备同步回复时背景音乐主机的***时间。
本发明提出一种背景音乐主机,包括:
接收模块,用于接收通过上位机翻译的语音控制信号,上述翻译过程包括抓取指定声音组合的语音段落,判定上述语音段落特定语音的音长和音调,根据上述语音段落、音长和音调判定匹配对应的功能命令并生成上述语音控制信号;
执行模块,用于根据上述语音控制信号进行指定操作。
本发明提出一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,上述处理器执行上述程序时实现如发明实施例中任意一项上述的方法。
本发明提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如发明实施例中任意一项上述的方法。
本发明的语音控制背景音乐主机的方法、装置、设备及存储介质的有益效果为:通过增加了语音处理过程,使背景音乐主机能够直接通过使用者的语音控制进行操作,通过增加对语音的判断提高了对使用者语音的识别度,通过增加了时间同步的步骤降低了多设备间同步执行的误差,提高了同步精度,且同步后误差抖动范围小,同步过程中受网络延时的影响低,还降低了多设备在同步播放时对硬件的依赖程度低,只要设备间可以通过网络相互访问即可完成,通用性强。
附图说明
图1为本发明一实施例的语音控制背景音乐主机的方法的流程示意图;
图2为本发明一实施例的语音控制背景音乐主机的方法的流程示意图;
图3为本发明一实施例的语音控制背景音乐主机的装置的模块结构示意图;
图4为本发明一实施例的语音控制背景音乐主机的装置的模块结构示意图;
图5为本发明一实施例的一种计算机设备的结构示意图。
12、计算机设备;14、外部设备;16、处理单元;18、总线;20、网络适配器;22、(I/O)接口;24、显示器;28、***存储器;30、随机存取存储器(RAM);32、高速缓存存储器;34、存储***;40、程序/实用工具;42、程序模块;101、接收模块;102、执行模块;401、第四判定模块;402、修改模块;403、预测试模块;404、比较模块;405、第二更新模块;501、第一获取模块;502、第二获取模块;601、第一更新子模块。
本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
另外,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参照图1,在本发明实施例中,本发明提供一种语音控制背景音乐主机的方法,包括步骤:
S101、接收通过上位设备特殊翻译的语音控制信号,上述翻译过程包括抓取指定声音组合的语音段落,判定上述语音段落特定语音的音长和音调,根据上述语音段落、音长和音调判定匹配对应的功能命令并生成上述语音控制信号;
S102、根据上述语音控制信号进行指定操作。
如上述步骤S101,接收通过上位设备特殊翻译的语音控制信号,上述翻译过程包括抓取指定声音组合的语音段落,判定上述语音段落特定语音的音长和音调,根据上述语音段落、音长和音调判定匹配对应的功能命令并生成上述语音控制信号,上述上位设备一般在接收到使用者的语音后对该语音进行特殊翻译,已达到将使用者的语音转化成语音控制信号的目的,步骤如下:搜索并抓取指定声音组合的语音段落,如降低、增加、提高、音量、打开、关闭等特殊语音;判定每段声音组合的音长,由于在人类之间的沟通中,一个词语的音长不同往往会导致一个词语或语句的意思完全颠覆,如,降低,当使用者说出降低时的音长和音调不同,其需要降低的声音往往不同,当使用者说出降低时的音长较短,音调较高时,其需要降低的音量远大于在音长较长,音调较低的时候,因此,判定步骤如下:
同时判定上述语音段落中,每个字音的音长是否大于第一指定值,音调是否高于第二指定值;当音长小于第一指定值且音调高于第二指定值时,将使用者的语音要求的程度提高15-25%;当音长小于第一指定值且音调低于或等于第二指定值时,将使用者的语音要求的程度提高2-3%;当音长大于或等于第一指定值且音调高于第二指定值时,将使用者的语音要求的功能提高5-10%;当音长大于或等于第一指定值且音调低于或等于第二指定值时,维持使用者的语音要求的程度。
但是由于每个人说话的存在差异性,在上位设备判定前一般需要使用者使用平和语气进行朗读特定的文章以测量出上述第一指定值和上述第二指定值。
在判定结束后根据判定结果以及语音段落的内容与预设的功能列表进行对应的匹配生成对应的上述语音控制信号。
如上述步骤S102,根据上述语音控制信号进行指定操作,背景音乐主机在执行上述步骤S101后,对上述语音控制信号进行执行。
参照图4,在本实施例中,上述的语音控制背景音乐主机的方法,在上述接收上位设备按指定方式生成的音频信号的步骤之前,还包括步骤:
S401、判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值;
S402、若是,对背景音乐主机的***时间进行同步修正,并将上述差值设为新的判定值。
由于无线设备之间的通讯存在网络延迟的影响,导致在时间同步的过程中,背景音乐主机在收到上位设备发送的同步回复的信号时会存在有时间误差,导致在工作时无法达到精准的同步,因此,在每次上述步骤S101执行前一般需要进行时间同步校准。
如上述步骤S401,判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值,背景音乐主机一般在接收到上位设备反馈的同步回复后进行对上述差值的判断,上述差值的大小一般受网络延迟及设备硬件的影响,在本发明实施例中,上述判定值一般为在最近若干次同步过程中上述差值的最小值,但也可以为使用者认为输入的定值或区间值。
如上述步骤S402,若是,对背景音乐主机的***时间进行同步修正,并将上述差值设为新的判定值,在本发明实施例中,一般根据以下公式对背景音乐主机的***时间进行同步修正:
T为背景音乐主机同步修正后的***时间;T1为发起同步请求时背景音乐主机的***时间;T2为接受到同步请求时上位设备的***时间;T3为接收到上位设备同步回复时背景音乐主机的***时间。
在上述公式中设(T3-T1)/2为上位设备发送同步回复至背景音乐主机确认接收的时间延时,在网络延时较平稳时一般上位设备和背景音乐主机之间的信号联系的时间延时相同或接近相同,因此当(T3-T1)(即上述差值)大于或等于上述判定值(即在最近若干同步过程中上述差值的最小值)时,背景音乐主机放弃该次同步,当判定在过程中上述差值小于上述判定值时,背景音乐主机进行时间同步,其中,在背景音乐主机进行时间同步时,一般还将上述差值跟新为新的判定值。通过上述公式对背景音乐主机进行时间同步修正一般修正后误差可以保持在3ms以内,达到高精度无线设备的时间同步要求。
在本实施例中,在上述的语音控制背景音乐主机的方法中,在上述判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值的步骤之前,还包括步骤:
S403、进行若干次***时间的预同步测试,获取每次同步的上述差值并储存至缓存列表;
S404、将缓存列表内的上述差值进行相互比较得出最小差值,并将上述最小差值设定为判定值。
如上述步骤S403,进行若干次***时间的预同步测试,获取每次同步的上述差值并储存至缓存列表,在执行上述步骤S401前,背景音乐主机一般会向上位设备发送预同步测试请求,在预同步测试时,背景音乐主机一般仅进行与上位设备之间信号的联系,以得出在若干次预同步测试中的上述差值作为在执行上述步骤S401时生成上述判定值的基准和参考,并储存至上述缓存列表,其中,一般进行15-25次的预同步测试,优选为20次;
在本发明实施例中,背景音乐主机可以通过查询云数据库中,同规格设备之间同步的历史数据,以获取在执行上述步骤S401时生成上述判定值的基准和参考,以代替上述步骤S403;
在本发明实施例中,使用者还可以直接根据个人的使用习惯对生成上述步骤S401的上述判定值的基准和参考进行调节,已达到最优效果。
如上述步骤S404,将缓存列表内的上述差值进行相互比较得出最小差值,并将上述最小差值设定为判定值,在上述步骤S403执行完后,对缓存列表内的上述差值进行大小比较得出上述差值的最小值,并将该最小值设定为上述判定值,其中,由于该缓存列表一般仅储存的上述差值一般为最近的15-25次同步的上述差值,优选为最近20次同步的上述差值。
在本实施例中,在上述的语音控制背景音乐主机的方法中,在上述判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值的步骤之后,还包括步骤:
S405、若否,放弃本次同步,并将上述差值储存至缓存列表。
如上述步骤S405,若否,放弃本次同步,并将上述差值储存至缓存列表,当上述步骤S401判断所述差值大于或等于所述判定值时,背景音乐主机放弃本次同步,但将上述差值储存至上述缓存列表,此时不跟新上述判定值。
在本实施例中,上述的语音控制背景音乐主机的方法,在上述判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值的步骤之前,还包括步骤:
S501、获取发起同步请求时背景音乐主机的***时间;
S502、获取接收到上位设备同步回复时背景音乐主机的***时间。
如上述步骤S501,获取发起同步请求时背景音乐主机的***时间,背景音乐主机在发送时间同步请求后,记录发送时间,其中,改时间记录一般精确至毫秒级,在本实施例中,优选精确至纳秒级的时间。
如上述步骤S502,获取接收到上位设备同步回复时背景音乐主机的***时间,背景音乐主机在获取接收到上位设备同步回复后,记录发送时间,其中,改时间记录一般精确至毫秒级,在本实施例中,优选精确至纳秒级的时间,其中,由于上背景音乐主机之间存在通讯是否成功的问题,因此在本发明实施例中,设有背景音乐主机与上位设备之间的通信等待默认时间,当背景音乐主机等待时长超过该默认时间则认定为通讯失败,该默认时间一般为150-500ms,优选为200ms。
在本实施例中,上述的语音控制背景音乐主机的方法,上述将上述差值设为新的判定值的步骤包括步骤:
S601、将上述差值储存至缓存列表,并将上述缓存列表中的上述差值的最小值作为上述新的判定值。
如上述步骤S601,将上述差值储存至缓存列表,并将上述缓存列表中的上述差值的最小值作为上述新的判定值,当上述步骤S401判定上述差值小于上述判定值后,将上述差值储存至上述缓存列表,并将上述差值跟新为所述新的判定值,以提高该背景音乐主机和上位设备间的时间同步精度。
参照图5,本发明提出一种语音控制背景音乐主机的装置,包括:
接收模块101,用于接收通过上位设备特殊翻译的语音控制信号,上述翻译过程包括抓取指定声音组合的语音段落,判定上述语音段落特定语音的音长和音调,根据上述语音段落、音长和音调判定匹配对应的功能命令并生成上述语音控制信号;
执行模块102,用于根据上述语音控制信号进行指定操作。
上述接收模块101,一般用于接收通过上位设备特殊翻译的语音控制信号,上述翻译过程包括抓取指定声音组合的语音段落,判定上述语音段落特定语音的音长和音调,根据上述语音段落、音长和音调判定匹配对应的功能命令并生成上述语音控制信号,上述上位设备一般在接收到使用者的语音后对该语音进行特殊翻译,已达到将使用者的语音转化成语音控制信号的目的,步骤如下:搜索并抓取指定声音组合的语音段落,如降低、增加、提高、音量、打开、关闭等特殊语音;判定每段声音组合的音长,由于在人类之间的沟通中,一个词语的音长不同往往会导致一个词语或语句的意思完全颠覆,如,降低,当使用者说出降低时的音长和音调不同,其需要降低的声音往往不同,当使用者说出降低时的音长较短,音调较高时,其需要降低的音量远大于在音长较长,音调较低的时候,因此,判定步骤如下:
同时判定上述语音段落中,每个字音的音长是否大于第一指定值,音调是否高于第二指定值;当音长小于第一指定值且音调高于第二指定值时,将使用者的语音要求的程度提高15-25%;当音长小于第一指定值且音调低于或等于第二指定值时,将使用者的语音要求的程度提高2-3%;当音长大于或等于第一指定值且音调高于第二指定值时,将使用者的语音要求的功能提高5-10%;当音长大于或等于第一指定值且音调低于或等于第二指定值时,维持使用者的语音要求的程度。
但是由于每个人说话的存在差异性,在上位设备判定前一般需要使用者使用平和语气进行朗读特定的文章以测量出上述第一指定值和上述第二指定值。
在判定结束后根据判定结果以及语音段落的内容与预设的功能列表进行对应的匹配生成对应的上述语音控制信号。
上述执行模块102,一般用于根据上述语音控制信号进行指定操作,背景音乐主机在上述接收模块101执行后,对上述语音控制信号进行执行。
参照图4,在本实施例中,上述的语音控制背景音乐主机的装置,还包括:
第四判定模块401,用于判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值,
修改模块402,用于若是,对背景音乐主机的***时间进行同步修正,并将上述差值设为新的判定值。
上述第四判定模块401,一般用于判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值,背景音乐主机一般在接收到上位设备反馈的同步回复后进行对上述差值的判断,上述差值的大小一般受网络延迟及设备硬件的影响,在本发明实施例中,上述判定值一般为在最近若干次同步过程中上述差值的最小值,但也可以为使用者认为输入的定值或区间值。
上述修改模块402,一般用于若是,对背景音乐主机的***时间进行同步修正,并将上述差值设为新的判定值,在本发明实施例中,一般根据以下公式对背景音乐主机的***时间进行同步修正:
T为背景音乐主机同步修正后的***时间;T1为发起同步请求时背景音乐主机的***时间;T2为接受到同步请求时上位设备的***时间;T3为接收到上位设备同步回复时背景音乐主机的***时间。
在上述公式中设(T3-T1)/2为上位设备发送同步回复至背景音乐主机确认接收的时间延时,在网络延时较平稳时一般上位设备和背景音乐主机之间的信号联系的时间延时相同或接近相同,因此当(T3-T1)(即上述差值)大于或等于上述判定值(即在最近若干同步过程中上述差值的最小值)时,背景音乐主机放弃该次同步,当判定在过程中上述差值小于上述判定值时,背景音乐主机进行时间同步,其中,在背景音乐主机进行时间同步时,一般还将上述差值跟新为新的判定值。通过上述公式对背景音乐主机进行时间同步修正一般修正后误差可以保持在3ms以内,达到高精度无线设备的时间同步要求。
在本实施例中,在上述的语音控制背景音乐主机的装置中,还包括:
预测试模块403,用于进行若干次***时间的预同步测试,获取每次同步的上述差值并储存至缓存列表;
比较模块404,用于将缓存列表内的上述差值进行相互比较得出最小差值,并将上述最小差值设定为判定值。
上述预测试模块403,一般用于进行若干次***时间的预同步测试,获取每次同步的上述差值并储存至缓存列表,在上述第四判定模块401驱动前,背景音乐主机一般会向上位设备发送预同步测试请求,在预同步测试时,背景音乐主机一般仅进行与上位设备之间信号的联系,以得出在若干次预同步测试中的上述差值作为在上述第四判定模块401运行时生成上述判定值的基准和参考,并储存至上述缓存列表,其中,一般进行15-25次的预同步测试,优选为20次;
在本发明实施例中,背景音乐主机可以通过查询云数据库中,同规格设备之间同步的历史数据,以获取在上述第四判定模块401驱动时生成上述判定值的基准和参考,以代替上述预测试模块403得出的结果;
在本发明实施例中,使用者还可以直接根据个人的使用习惯对上述第四判定模块401生成的上述判定值的基准和参考进行调节,已达到最优效果。
上述比较模块404,一般用于将缓存列表内的上述差值进行相互比较得出最小差值,并将上述最小差值设定为判定值,在上述预测试模块403驱动完后,对缓存列表内的上述差值进行大小比较得出上述差值的最小值,并将该最小值设定为上述判定值,其中,由于该缓存列表一般仅储存的上述差值一般为最近的15-25次同步的上述差值,优选为最近20次同步的上述差值。
在本实施例中,在上述的语音控制背景音乐主机的装置中,还包括:
第二更新模块405,用于若否,放弃本次同步,并将上述差值储存至缓存列表。
上述第二更新模块405,一般用于若否,放弃本次同步,并将上述差值储存至缓存列表,当上述第四判定模块401判断所述差值大于或等于所述判定值时,背景音乐主机放弃本次同步,但将上述差值储存至上述缓存列表,此时不跟新上述判定值。
在本实施例中,在上述的语音控制背景音乐主机的装置中,上述修改模块402包括:
第一更新子模块601,用于将上述差值储存至缓存列表,并将上述缓存列表中的上述差值的最小值作为上述新的判定值。
上述第一更新子模块601,一般用于将上述差值储存至缓存列表,并将上述缓存列表中的上述差值的最小值作为上述新的判定值,当上述第四判定模块401判定上述差值小于上述判定值后,将上述差值储存至上述缓存列表,并将上述差值跟新为所述新的判定值,以提高该背景音乐主机和上位设备间的时间同步精度。
参照图4,在本实施例中,在上述的语音控制背景音乐主机的装置中,还包括:
第一获取模块501,用于获取发起同步请求时背景音乐主机的***时间;
第二获取模块502,用于获取接收到上位设备同步回复时背景音乐主机的***时间。
上述第一获取模块501,一般用于获取发起同步请求时背景音乐主机的***时间,背景音乐主机在发送时间同步请求后,记录发送时间,其中,改时间记录一般精确至毫秒级,在本实施例中,优选精确至纳秒级的时间。
上述第二获取模块502,一般用于获取接收到上位设备同步回复时背景音乐主机的***时间,背景音乐主机在获取接收到上位设备同步回复后,记录发送时间,其中,改时间记录一般精确至毫秒级,在本实施例中,优选精确至纳秒级的时间,其中,由于上背景音乐主机之间存在通讯是否成功的问题,因此在本发明实施例中,设有背景音乐主机与上位设备之间的通信等待默认时间,当背景音乐主机等待时长超过该默认时间则认定为通讯失败,该默认时间一般为150-500ms,优选为200ms。
参照图5,在本发明实施例中,本发明还提供一种计算机设备,上述计算机设备12以通用计算设备的形式表现,计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线18结构中的一种或多种,包括存储器总线18或者存储器控制器,***总线18,图形加速端口,处理器或者使用多种总线18结构中的任意总线18结构的局域总线18。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线18,微通道体系结构(MAC)总线18,增强型ISA总线18、视频电子标准协会(VESA)局域总线18以及***组件互连(PCI)总线18。
计算机设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其他移动/不可移动的、易失性/非易失性计算机体统存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD~ROM,DVD~ROM或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块42,这些程序模块42被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器中,这样的程序模块42包括——但不限于——操作***、一个或者多个应用程序、其他程序模块42以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24、摄像头等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)),广域网(WAN)和/或公共网络(例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其他模块通信。应当明白,尽管图5中未示出,可以结合计算机设备12使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元16、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***34等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的语音控制背景音乐主机的方法。
也即,上述处理单元16执行上述程序时实现:接收通过上位设备特殊翻译的语音控制信号,上述翻译过程包括抓取指定声音组合的语音段落,判定上述语音段落特定语音的音长和音调,根据上述语音段落、音长和音调判定匹配对应的功能命令并生成上述语音控制信号;根据上述语音控制信号进行指定操作。
在本发明实施例中,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有实施例提供的语音控制背景音乐主机的方法:
也即,给程序被处理器执行时实现:接收通过上位设备特殊翻译的语音控制信号,上述翻译过程包括抓取指定声音组合的语音段落,判定上述语音段落特定语音的音长和音调,根据上述语音段落、音长和音调判定匹配对应的功能命令并生成上述语音控制信号;根据上述语音控制信号进行指定操作。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机克顿信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦可编程只读存储器(EPOM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD~ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,改计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言——诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行或者完全在远程计算机或者服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本发明的语音控制背景音乐主机的方法、装置、设备及存储介质的有益效果为:通过增加了语音处理过程,使背景音乐主机能够直接通过使用者的语音控制进行操作,通过增加对语音的判断提高了对使用者语音的识别度,通过增加了时间同步的步骤降低了多设备间同步执行的误差,提高了同步精度,且同步后误差抖动范围小,同步过程中受网络延时的影响低,还降低了多设备在同步播放时对硬件的依赖程度低,只要设备间可以通过网络相互访问即可完成,通用性强。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种语音控制背景音乐主机的方法,其特征在于,包括步骤:
接收通过上位设备特殊翻译的语音控制信号,所述翻译过程包括抓取指定声音组合的语音段落,判定所述语音段落特定语音的音长和音调,根据所述语音段落、音长和音调判定匹配对应的功能命令并生成所述语音控制信号;
根据所述语音控制信号进行指定操作。
2.根据权利要求1所述的语音控制背景音乐主机的方法,其特征在于,在所述接收通过上位机翻译的语音控制信号的步骤之前包括步骤:
判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值;
若是,对背景音乐主机的***时间进行同步修正,并将所述差值设为新的判定值。
3.根据权利要求2所述的多个无线设备间***时间同步的方法,其特征在于,在所述判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值的步骤之前,还包括步骤:
进行若干次***时间的预同步测试,获取每次同步的所述差值并储存至缓存列表;
将缓存列表内的所述差值进行相互比较得出最小差值,并将所述最小差值设定为判定值。
4.根据权利要求2所述的多个无线设备间***时间同步的方法,其特征在于,所述将所述差值设为新的判定值的步骤包括步骤:
将所述差值储存至缓存列表,并将所述缓存列表中的所述差值的最小值作为所述新的判定值。
5.根据权利要求2所述的多个无线设备间***时间同步的方法,其特征在于,在所述判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值的步骤之后,还包括步骤:
若否,放弃本次同步,并将所述差值储存至缓存列表。
6.根据权利要求2所述的多个无线设备间***时间同步的方法,其特征在于,根据以下公式对背景音乐主机的***时间进行同步修正,
T为背景音乐主机同步修正后的***时间;T1为发起同步请求时背景音乐主机的***时间;T2为接受到同步请求时上位设备的***时间;T3为接收到上位设备同步回复时背景音乐主机的***时间。
7.根据权利要求2所述的多个无线设备间***时间同步的方法,其特征在于,在所述判定接收到上位设备同步回复时背景音乐主机的***时间与发起同步请求时背景音乐主机的***时间的差值是否小于判定值的步骤之前,还包括步骤:
获取发起同步请求时背景音乐主机的***时间;
获取接收到上位设备同步回复时背景音乐主机的***时间。
8.一种背景音乐主机,其特征在于,包括:
接收模块,用于接收通过上位机翻译的语音控制信号,所述翻译过程包括抓取指定声音组合的语音段落,判定所述语音段落的音长,根据所述语音段落以及音长判定匹配对应的功能命令并生成所述语音控制信号;
执行模块,用于根据所述语音控制信号进行指定操作。
9.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~7中任意一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~7中任意一项所述的方法。
CN201810045466.1A 2018-01-17 2018-01-17 语音控制背景音乐主机的方法、装置、设备及存储介质 Active CN108269570B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810045466.1A CN108269570B (zh) 2018-01-17 2018-01-17 语音控制背景音乐主机的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810045466.1A CN108269570B (zh) 2018-01-17 2018-01-17 语音控制背景音乐主机的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN108269570A true CN108269570A (zh) 2018-07-10
CN108269570B CN108269570B (zh) 2020-09-11

Family

ID=62775802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810045466.1A Active CN108269570B (zh) 2018-01-17 2018-01-17 语音控制背景音乐主机的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN108269570B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060682A (zh) * 2019-04-28 2019-07-26 Oppo广东移动通信有限公司 音箱控制方法和装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1311611A (zh) * 2000-03-01 2001-09-05 朗迅科技公司 基站收发信机到无线电网络控制器的同步过滤功能
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
CN102520789A (zh) * 2011-11-18 2012-06-27 上海聚力传媒技术有限公司 一种用于实现语音控制受控设备的方法与设备
CN104113634A (zh) * 2013-04-22 2014-10-22 三星电子(中国)研发中心 一种对语音进行处理的方法
CN104123938A (zh) * 2013-04-29 2014-10-29 富泰华工业(深圳)有限公司 语音控制***、电子装置及语音控制方法
CN105280180A (zh) * 2014-06-11 2016-01-27 中兴通讯股份有限公司 一种终端控制方法、装置、语音控制装置及终端
CN105334743A (zh) * 2015-11-18 2016-02-17 深圳创维-Rgb电子有限公司 一种基于情感识别的智能家居控制方法及其***
CN105680969A (zh) * 2015-12-31 2016-06-15 浙江中控技术股份有限公司 一种时钟同步方法及装置
CN105719646A (zh) * 2016-01-22 2016-06-29 史唯廷 语音控制音乐播放方法及语音控制音乐播放装置
CN106228978A (zh) * 2016-08-04 2016-12-14 成都佳荣科技有限公司 一种语音识别方法
CN107147936A (zh) * 2017-04-21 2017-09-08 合网络技术(北京)有限公司 弹幕的显示控制方法及装置
KR20170135598A (ko) * 2016-05-31 2017-12-08 홍덕기 특정인의 합성된 가상 음성을 이용한 음성 대화 시스템 및 방법

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1311611A (zh) * 2000-03-01 2001-09-05 朗迅科技公司 基站收发信机到无线电网络控制器的同步过滤功能
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
CN102520789A (zh) * 2011-11-18 2012-06-27 上海聚力传媒技术有限公司 一种用于实现语音控制受控设备的方法与设备
CN104113634A (zh) * 2013-04-22 2014-10-22 三星电子(中国)研发中心 一种对语音进行处理的方法
CN104123938A (zh) * 2013-04-29 2014-10-29 富泰华工业(深圳)有限公司 语音控制***、电子装置及语音控制方法
CN105280180A (zh) * 2014-06-11 2016-01-27 中兴通讯股份有限公司 一种终端控制方法、装置、语音控制装置及终端
CN105334743A (zh) * 2015-11-18 2016-02-17 深圳创维-Rgb电子有限公司 一种基于情感识别的智能家居控制方法及其***
CN105680969A (zh) * 2015-12-31 2016-06-15 浙江中控技术股份有限公司 一种时钟同步方法及装置
CN105719646A (zh) * 2016-01-22 2016-06-29 史唯廷 语音控制音乐播放方法及语音控制音乐播放装置
KR20170135598A (ko) * 2016-05-31 2017-12-08 홍덕기 특정인의 합성된 가상 음성을 이용한 음성 대화 시스템 및 방법
CN106228978A (zh) * 2016-08-04 2016-12-14 成都佳荣科技有限公司 一种语音识别方法
CN107147936A (zh) * 2017-04-21 2017-09-08 合网络技术(北京)有限公司 弹幕的显示控制方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060682A (zh) * 2019-04-28 2019-07-26 Oppo广东移动通信有限公司 音箱控制方法和装置

Also Published As

Publication number Publication date
CN108269570B (zh) 2020-09-11

Similar Documents

Publication Publication Date Title
US10839803B2 (en) Contextual hotwords
CN109196532B (zh) 数字助理请求的异步处理的方法、***、计算机可读介质
EP3477637B1 (en) Integration of embedded and network speech recognizers
US9697829B1 (en) Evaluating pronouns in context
KR101752119B1 (ko) 다수의 디바이스에서의 핫워드 검출
WO2019118633A1 (en) Architecture for a hub configured to control a second device while a connection to a remote system is unavailable
KR20190113927A (ko) 장치에 대한 다중 사용자 인증
JP6918255B1 (ja) 局所的なテキスト応答マップを利用する、ユーザの口頭発話への応答のレンダリング
US20200034108A1 (en) Dynamic Volume Adjustment For Virtual Assistants
JP7300435B2 (ja) 音声インタラクションするための方法、装置、電子機器、およびコンピュータ読み取り可能な記憶媒体
Olwal et al. Interaction techniques using prosodic features of speech and audio localization
EP3469489A1 (en) Follow-up voice query prediction
US10170122B2 (en) Speech recognition method, electronic device and speech recognition system
KR20040105787A (ko) 자연어 서버를 사용하는 가정용 엔터테인먼트 시스템 제어
EP4022602A1 (en) Customizable keyword spotting system with keyword adaptation
JP7230804B2 (ja) 情報処理装置、及び情報処理方法
US11019116B2 (en) Conference system, conference server, and program based on voice data or illumination light
CN108269570A (zh) 语音控制背景音乐主机的方法、装置、设备及存储介质
CN116888664A (zh) 在单个话语中组合设备或助理专用热词
CN106990917B (zh) 文件读写方法及***
US20210287666A1 (en) Natural Language Recognition Assistant Which Handles Information in Data Sessions
CN108259107A (zh) 多个无线设备间***时间同步的方法、装置、设备及存储介质
TWI770395B (zh) 語音控制電視版銀行轉帳之裝置與方法
AU2014200663B2 (en) Integration of embedded and network speech recognizers
CN110473535A (zh) 示教再现方法及装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant