CN114187915A - 一种互动方法 - Google Patents

一种互动方法 Download PDF

Info

Publication number
CN114187915A
CN114187915A CN202111541981.7A CN202111541981A CN114187915A CN 114187915 A CN114187915 A CN 114187915A CN 202111541981 A CN202111541981 A CN 202111541981A CN 114187915 A CN114187915 A CN 114187915A
Authority
CN
China
Prior art keywords
voice
information
waveform
storage unit
signal waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111541981.7A
Other languages
English (en)
Inventor
朱俊杰
缪文南
姚泽彬
陈少武
薛浩鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou City University of Technology
Original Assignee
Guangzhou City University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou City University of Technology filed Critical Guangzhou City University of Technology
Priority to CN202111541981.7A priority Critical patent/CN114187915A/zh
Publication of CN114187915A publication Critical patent/CN114187915A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提一种互动方法,控制芯片识别到唤醒信号后,语音识别单元再对语音输入信息就行识别,提高语音识别单元识别语音输入信息的准确性;然后识别声纹信息;控制芯片从若干个第一储存单元中识别与当前声纹信息匹配的第一储存单元;然后根据语音输入信息;输出当前第一储存单元中对应的第一语音输出信息和第一互动信息;通过识别声纹信息区分不同的使用者,实现与不同使用者产生不同的互动效果;对同一使用使用者输入不同的语音输入信息,输出对应的语音输出信息和互动信息;也能产生不同的互动效果。

Description

一种互动方法
技术领域
本发明涉及数据处理技术领域,具体涉及一种互动方法。
背景技术
电子宠物是由电子元件(硬件和软件)构成的电子玩具,现在也指使用电脑或因特网服务器上运行的特定程序,目前的电子宠物概念在有显示屏的电子器件(如宠物机,手机,电脑)的应用都比较广泛。电子宠物具有和真实宠物同样的生命特性。
在中国申请号为201610414739 .6,公布日为2017.9.26的专利文献公开了一种智能电子宠物语音交互***及方法;统包括启动模块、语音控制模块、本地处理模块、云端存储模块以及本地存储模块;所述启动模块用于设定成长任务;所述语音控制模块用于控制语音的输入、输出以及识别;所述本地处理模块用于调用本地存储模块内的数据对用户的语音信息进行确定、判断并根据判断结果执行相应的操作;所述云端存储模块用于在云端存储数据;所述本地存储模块用于存储数据。
该***通过对语音信息进行确定、判断并执行相应的操作;但是该***只能对语音信息的波形进行判断;并根波形输出对应的语音信息;其不能通过输入语音信息区分不同的使用者;不能与不同使用者产生不同的交互效果。
发明内容
本发明提供一种与不同使用者产生不同的交互效果的互动方法。
为达到上述目的,本发明的技术方案是:一种互动方法,互动装置包括控制芯片、语音识别模块、语音输出模块和显示装置;语音识别模块包括语音唤醒单元、语音识别单元和声纹识别单元;语音唤醒单元用于识别唤醒信号,并将唤醒信号转换为唤醒波形;语音识别单元用于识别语音输入信息,并将语音输入信息转换为语音波形;声纹识别单元用于识别声纹信息。
控制芯片设有声纹储存单元、第二储存单元和一个以上的第一储存单元,一个第一储存单元根据一种声纹信息对应设置;第二储存单元储存有第二信号波形,控制芯片用于对比唤醒波形和第二信号波形,并根据对比结果控制语音识别单元和声纹识别单元启动;第一储存单元储存有第一信号波形、第一语音输出信息和第一互动信息;第一信号波形与第一语音输出信息和第一互动信息对应设置;控制芯片用于对比语音波形和第一信号波形,并根据对比结果控制语音输出模块输出对应储存单元的第一语音输出信息、控制显示装置输出对应储存单元的第一互动信息。
控制芯片还包括第三储存单元;第三储存单元储存有第三信号波形、第三语音输出信息和第三互动信息;控制芯片用于对比语音波形和第三信号波形,并根据对比结果控制语音输出模块输出第三语音输出信息、显示装置输出第三互动信息。
互动方法包括以下步骤:
(1).预录入声纹信息,一种声纹信息与一个第一储存单元对应。
(2).在第一储存单元中预录入第一信号波形,并根据第一信号波形录入语音输出信息和互动信息。
(3).语音唤醒单元实时接收语音信息,并将接收的语音信息转为为唤醒波形;控制芯片将当前的唤醒波形和第二信号波形进行对比;若当前的唤醒波形与第二信号波形相似,则进行步骤(4);若当前的唤醒波形与第二信号波形不相似,则重复进行步骤(3)。
(4).控制芯片判断当前唤醒波形为唤醒信号,控制芯片控制语音识别模块启动。
(4.1).语音识别模块接收语音信息,若语音识别模块接收到语音信息,则进行步骤(5)。
(5).声纹识别单元识别当前语音信息中的声纹信息,语音识别单元识别当前语音信息中的语音输入信息,并将接收的语音输入信息转换为语音波形;控制芯片检测声纹储存单元中是否存在当前识别到声纹信息,若存在,则进行步骤(6)。
(6). 识别与该声纹信息匹配的第一储存单元,控制芯片当前的语音波形与当前第一储存单元中的第一信号波形进行对比;若语音波形与第一信号波形相似,则进行步骤(7);若当前的语音波形与第一信号波形不相似,则进行步骤(4.1)。
(7).语音输出模块输出与该第一信号波形波形对应的语音输出信息;显示装置输出该第一信号波形波形对应的互动信息。
以上方法,当控制芯片识别到唤醒信号后,语音识别单元再对语音输入信息就行识别,高语音识别单元识别语音输入信息的准确性;然后对语音信息中的声纹信息进行识别后;控制芯片从若干个第一储存单元中识别与当前声纹信息匹配的第一储存单元;然后对语音信息中的语音输入信息进行识别,并转换为语音波形;输出当前第一储存单元中与当前语音波形对应的第一语音输出信息和第一互动信息;通过识别声纹信息区别不同的使用者,输出对应使用者的第一储存单元中的信息;根据当前使用者的语音输入信息,输出对应的第一语音输出信息和第一互动信息;实现与不同使用者产生不同的互动效果;同时同一使用使用者输入不同的语音输入信息,也能产生不同的互动效果。同时若当前的语音波形与第一信号波形不相似,则可以重复输入语音信息,提高语音识别单元识别结果的准确性。
进一步的,步骤(5)还包括,控制芯片检测声纹储存单元中是否存在当前识别到声纹信息,若不存在,则进行步骤(8)。
(8).控制芯片将当前的语音波形与第三信号波形进行对比;若当前的语音波形与第三信号波形相似,则进行步骤(9)。
(9).语音输出模块输出与该第三信号波形波形对应的语音输出信息;显示装置输出该第三信号波形波形对应的互动信息。
以上方法,在声纹储存单元中没有储存声纹信息的使用者与互动装置进行互动时,也能产生互动效果。
附图说明
图1为使用本发明的互动装置的示意图。
图2为本发明的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步详细说明。
如图1-2所示;一种互动方法;互动装置包括控制芯片1、语音识别模块、语音输出模块2和显示装置3;语音识别模块包括语音唤41醒单元、语音识别单元42和声纹识别单元43;语音唤醒单元41用于识别唤醒信号,并将唤醒信号转换为唤醒波形;语音识别单元42用于识别语音输入信息,并将语音输入信息转换为语音波形;声纹识别单元43用于识别声纹信息。
控制芯片设有声纹储存单元、第二储存单元和一个以上的第一储存单元,一个第一储存单元根据一种声纹信息对应设置;第二储存单元储存有第二信号波形,控制芯片用于对比唤醒波形和第二信号波形,并根据对比结果控制语音识别单元和声纹识别单元启动;第一储存单元储存有第一信号波形、第一语音输出信息和第一互动信息;第一信号波形与第一语音输出信息和第一互动信息对应设置;控制芯片用于对比语音波形和第一信号波形,并根据对比结果控制语音输出模块输出对应储存单元的第一语音输出信息、控制显示装置输出对应储存单元的第一互动信息;
控制芯片还包括第三储存单元;第三储存单元储存有第三信号波形、第三语音输出信息和第三互动信息;控制芯片用于对比语音波形和第三信号波形,并根据对比结果控制语音输出模块输出第三语音输出信息、显示装置输出第三互动信息。
互动方法包括以下步骤:
(1).预录入声纹信息,一种声纹信息与一个第一储存单元对应。
(2).在第一储存单元中预录入第一信号波形,并根据第一信号波形录入语音输出信息和互动信息。
(3).语音唤醒单元实时接收语音信息,并将接收的语音信息转为为唤醒波形;控制芯片将当前的唤醒波形和第二信号波形进行对比;若当前的唤醒波形与第二信号波形相似,则进行步骤(4);若当前的唤醒波形与第二信号波形不相似,则重复进行步骤(3)。
(4).控制芯片判断当前唤醒波形为唤醒信号,控制芯片控制语音识别模块启动。
(4.1).语音识别模块接收语音信息,若语音识别模块接收到语音信息,则进行步骤(5)。
(5).声纹识别单元识别当前语音信息中的声纹信息,语音识别单元识别当前语音信息中的语音输入信息,并将接收的语音输入信息转换为语音波形;控制芯片检测声纹储存单元中是否存在当前识别到声纹信息,若存在,则进行步骤(6)。
(6). 识别与该声纹信息匹配的第一储存单元,控制芯片当前的语音波形与当前第一储存单元中的第一信号波形进行对比;若语音波形与第一信号波形相似,则进行步骤(7);若当前的语音波形与第一信号波形不相似,则进行步骤(4.1)。
(7).语音输出模块输出与该第一信号波形波形对应的第一语音输出信息;显示装置输出该第一信号波形波形对应的第一互动信息。
以上方法,当控制芯片识别到唤醒信号后,语音识别单元再对语音输入信息就行识别,高语音识别单元识别语音输入信息的准确性;然后对语音信息中的声纹信息进行识别后;控制芯片从若干个第一储存单元中识别与当前声纹信息匹配的第一储存单元;然后对语音信息中的语音输入信息进行识别,并转换为语音波形;输出当前第一储存单元中与当前语音波形对应的第一语音输出信息和第一互动信息;通过识别声纹信息区别不同的使用者,输出对应使用者的第一储存单元中的信息;根据当前使用者的语音输入信息,输出对应的第一语音输出信息和第一互动信息;实现与不同使用者产生不同的互动效果;同时同一使用使用者输入不同的语音输入信息,也能产生不同的互动效果。同时若当前的语音波形与第一信号波形不相似,则可以重复输入语音信息,提高语音识别单元识别结果的准确性。
上述方法:
步骤(5)还包括,控制芯片检测声纹储存单元中是否存在当前识别到声纹信息,若不存在,则进行步骤(8)。
(8).控制芯片将当前的语音波形与第三信号波形进行对比;若当前的语音波形与第三信号波形相似,则进行步骤(9)。
(9).语音输出模块输出与该第三信号波形波形对应的语音输出信息;显示装置输出该第三信号波形波形对应的互动信息。在声纹储存单元中没有储存声纹信息的使用者与互动装置进行互动时,也能产生互动效果。
步骤(1)还包括:预设计数阈值;步骤(6)中还包括,若当前的语音波形与第一信号波形不相似,则进行步骤(4.1),并一次计数;若技术数值达到计数阈值,则进行步骤(10)。
(10).发出添加新的第一信号波形的信号提醒。

Claims (3)

1.一种互动方法,其特征在于:互动装置包括控制芯片、语音识别模块、语音输出模块和显示装置;语音识别模块包括语音唤醒单元、语音识别单元和声纹识别单元;语音唤醒单元用于识别唤醒信号,并将唤醒信号转换为唤醒波形;语音识别单元用于识别语音输入信息,并将语音输入信息转换为语音波形;声纹识别单元用于识别声纹信息;
控制芯片设有声纹储存单元、第二储存单元和一个以上的第一储存单元,一个第一储存单元根据一种声纹信息对应设置;第二储存单元储存有第二信号波形,控制芯片用于对比唤醒波形和第二信号波形,并根据对比结果控制语音识别单元和声纹识别单元启动;第一储存单元储存有第一信号波形、第一语音输出信息和第一互动信息;第一信号波形与第一语音输出信息和第一互动信息对应设置;控制芯片用于对比语音波形和第一信号波形,并根据对比结果控制语音输出模块输出对应储存单元的第一语音输出信息、控制显示装置输出对应储存单元的第一互动信息;
控制芯片还包括第三储存单元;第三储存单元储存有第三信号波形、第三语音输出信息和第三互动信息;控制芯片用于对比语音波形和第三信号波形,并根据对比结果控制语音输出模块输出第三语音输出信息、显示装置输出第三互动信息;
互动方法包括以下步骤:
(1).预录入声纹信息,一种声纹信息与一个第一储存单元对应;
(2).在第一储存单元中预录入第一信号波形,并根据第一信号波形录入语音输出信息和互动信息;
(3).语音唤醒单元实时接收语音信息,并将接收的语音信息转为为唤醒波形;控制芯片将当前的唤醒波形和第二信号波形进行对比;若当前的唤醒波形与第二信号波形相似,则进行步骤(4);若当前的唤醒波形与第二信号波形不相似,则重复进行步骤(3);
(4).控制芯片判断当前唤醒波形为唤醒信号,控制芯片控制语音识别模块启动;
(4.1).语音识别模块接收语音信息,若语音识别模块接收到语音信息,则进行步骤(5);
(5).声纹识别单元识别当前语音信息中的声纹信息,语音识别单元识别当前语音信息中的语音输入信息,并将接收的语音输入信息转换为语音波形;控制芯片检测声纹储存单元中是否存在当前识别到声纹信息,若存在,则进行步骤(6);
(6).识别与该声纹信息匹配的第一储存单元,控制芯片当前的语音波形与当前第一储存单元中的第一信号波形进行对比;若语音波形与第一信号波形相似,则进行步骤(7);若当前的语音波形与第一信号波形不相似,则进行步骤(4.1);
(7).语音输出模块输出与该第一信号波形波形对应的第一语音输出信息;显示装置输出该第一信号波形波形对应的第一互动信息。
2.根据权利要求1所述的一种互动方法,其特征在于:步骤(5)还包括,控制芯片检测声纹储存单元中是否存在当前识别到声纹信息,若不存在,则进行步骤(8);
(8).控制芯片将当前的语音波形与第三信号波形进行对比;若当前的语音波形与第三信号波形相似,则进行步骤(9);
(9).语音输出模块输出与该第三信号波形波形对应的第三语音输出信息;显示装置输出该第三信号波形波形对应的第三互动信息。
3.根据权利要求1所述的一种互动方法,其特征在于:步骤(1)还包括:预设计数阈值;步骤(6)中还包括,若当前的语音波形与第一信号波形不相似,则进行步骤(4.1),并一次计数;若技术数值达到计数阈值,则进行步骤(10);
(10).发出添加新的第一信号波形的信号提醒。
CN202111541981.7A 2021-12-16 2021-12-16 一种互动方法 Pending CN114187915A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111541981.7A CN114187915A (zh) 2021-12-16 2021-12-16 一种互动方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111541981.7A CN114187915A (zh) 2021-12-16 2021-12-16 一种互动方法

Publications (1)

Publication Number Publication Date
CN114187915A true CN114187915A (zh) 2022-03-15

Family

ID=80605279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111541981.7A Pending CN114187915A (zh) 2021-12-16 2021-12-16 一种互动方法

Country Status (1)

Country Link
CN (1) CN114187915A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023109415A1 (zh) * 2021-12-16 2023-06-22 广州城市理工学院 一种全息互动***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023109415A1 (zh) * 2021-12-16 2023-06-22 广州城市理工学院 一种全息互动***

Similar Documents

Publication Publication Date Title
US10733978B2 (en) Operating method for voice function and electronic device supporting the same
CN110265040B (zh) 声纹模型的训练方法、装置、存储介质及电子设备
CN104254884B (zh) 用于分析数字化音频流的低功率集成电路
CN110689889B (zh) 人机交互方法、装置、电子设备及存储介质
CN108986826A (zh) 自动生成会议记录的方法、电子装置及可读存储介质
CN108831477B (zh) 一种语音识别方法、装置、设备及存储介质
CN103559880B (zh) 语音输入***和方法
CN110534109B (zh) 语音识别方法、装置、电子设备及存储介质
CN110047481A (zh) 用于语音识别的方法和装置
CN111161726B (zh) 一种智能语音交互方法、设备、介质及***
CN112669842A (zh) 人机对话控制方法、装置、计算机设备及存储介质
CN110544468B (zh) 应用唤醒方法、装置、存储介质及电子设备
CN109032345A (zh) 设备控制方法、装置、设备、服务端和存储介质
CN112581967B (zh) 一种声纹检索方法及前端后端服务器、后端服务器
US20220269724A1 (en) Audio playing method, electronic device, and storage medium
WO2021128846A1 (zh) 电子文件的控制方法、装置、计算机设备及存储介质
CN111326154B (zh) 语音交互的方法、装置、存储介质及电子设备
CN107885482A (zh) 音频播放方法、装置、存储介质及电子设备
CN114187915A (zh) 一种互动方法
WO2020024415A1 (zh) 声纹识别处理方法、装置、电子设备及存储介质
CN114582333A (zh) 语音识别方法、装置、电子设备及存储介质
CN111506183A (zh) 一种智能终端及用户交互方法
CN111625636B (zh) 一种人机对话的拒绝识别方法、装置、设备、介质
CN108989551B (zh) 位置提示方法、装置、存储介质及电子设备
US9894193B2 (en) Electronic device and voice controlling method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination