CN114913849A - 虚拟角色的语音调节方法、***、介质及装置 - Google Patents

虚拟角色的语音调节方法、***、介质及装置 Download PDF

Info

Publication number
CN114913849A
CN114913849A CN202110170453.9A CN202110170453A CN114913849A CN 114913849 A CN114913849 A CN 114913849A CN 202110170453 A CN202110170453 A CN 202110170453A CN 114913849 A CN114913849 A CN 114913849A
Authority
CN
China
Prior art keywords
voice
user
adjusting
virtual character
foreground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110170453.9A
Other languages
English (en)
Inventor
王岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Pateo Network Technology Service Co Ltd
Original Assignee
Shanghai Pateo Network Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Pateo Network Technology Service Co Ltd filed Critical Shanghai Pateo Network Technology Service Co Ltd
Priority to CN202110170453.9A priority Critical patent/CN114913849A/zh
Publication of CN114913849A publication Critical patent/CN114913849A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing (AREA)
  • Evolutionary Computation (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供一种虚拟角色的语音调节方法、***、介质及装置,所述方法包括以下步骤:获取用户的语音信息和前台运行的应用信息;基于所述语音信息和/或所述前台运行的应用信息通过语音调节规则获取对应的角色语音;基于所述角色语音调节虚拟角色的语音,以使所述虚拟角色使用调节后的语音与用户进行互动。本发明的一种虚拟角色的语音调节方法、***、介质及装置,用于自动、智能的为用户调节合适的虚拟角色的语音。

Description

虚拟角色的语音调节方法、***、介质及装置
技术领域
本发明涉及车辆技术领域,特别是涉及一种虚拟角色的语音调节方法、***、介质及装置。
背景技术
在行车途中用户可能会在车辆自带的多媒体设备、收音机等装置进行操作。而现今的车辆往往配备智能语音助手,所述智能语音助手为虚拟角色,用于与用户进行互动、沟通,基于用户指令进行相应操作。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题。
在不同的用户使用车辆自带的多媒体设备、收音机等装置时,为了适应不同的用户的感官需求,需要对虚拟角色的语音进行调节,以让用户有更好的使用感受。
因此,希望能够解决如何自动、智能的为用户调节合适的虚拟角色的语音的问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种虚拟角色的语音调节方法、***、介质及装置,用于解决现有技术中如何自动、智能的为用户调节合适的虚拟角色的语音的问题。
为实现上述目的及其他相关目的,本发明提供一种虚拟角色的语音调节方法,应用于车辆终端,包括以下步骤:获取用户的语音信息和用户正在使用的前台运行的应用信息;基于所述语音信息和/或所述前台运行的应用信息通过语音调节规则获取对应的角色语音;基于所述角色语音调节虚拟角色的语音,以使所述虚拟角色使用调节后的语音与用户进行互动。
为实现上述目的,本发明还提供一种虚拟角色的语音调节***,包括:获取模块和调节模块;所述获取模块用于获取用户的语音信息和用户正在使用的前台运行的应用信息;所述调节模块用于基于所述语音信息和/或所述前台运行的应用信息通过语音调节规则获取对应的角色语音;基于所述角色语音调节虚拟角色的语音,以使所述虚拟角色使用调节后的语音与用户进行互动。
为实现上述目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一上述虚拟角色的语音调节方法。
为实现上述目的,本发明还提供一种虚拟角色的语音调节装置,包括:处理器和存储器;所述存储器用于存储计算机程序;所述处理器与所述存储器相连,用于执行所述存储器存储的计算机程序,以使所述虚拟角色的语音调节装置执行任一上述的虚拟角色的语音调节方法。
如上所述,本发明的一种虚拟角色的语音调节方法、***、介质及装置,具有以下有益效果:用于自动、智能的为用户调节合适的虚拟角色的语音。
附图说明
图1a显示为本发明的虚拟角色的语音调节方法于一实施例中的应用场景架构示意图;
图1b显示为本发明的虚拟角色的语音调节方法于一实施例中的流程图;
图1c显示为本发明的虚拟角色的语音调节方法于又一实施例中的流程图;
图2显示为本发明的虚拟角色的语音调节***于一实施例中的结构示意图;
图3显示为本发明的虚拟角色的语音调节装置于一实施例中的结构示意图。
元件标号说明
21 获取模块
22 调节模块
31 处理器
32 存储器
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,故图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明的虚拟角色的语音调节方法、***、介质及装置,用于自动、智能的为用户调节合适的虚拟角色的语音。
如图1a所示,本发明的虚拟角色的语音调节方法、***、介质及装置应用于具有虚拟角色的车辆终端的应用场景下。所述车辆终端设有与用户互动的虚拟角色,那么如何基于用户的的性别、用户的年龄;用户使用的前台运行的应用类别、前台运行的应用当前页面展示的内容进行相应虚拟角色的语音的调节,以给用户带来更好的使用感受。例如图1a中的小女孩为当前与用户互动的虚拟角色,而此时的虚拟角色的性别和腔调分别为女性、童腔。那么如何进行相应虚拟角色的语音的调节在下文中具体展示。
如图1b所示,于一实施例中,本发明的虚拟角色的语音调节方法,包括以下步骤:
步骤S11、获取用户的语音信息和前台运行的应用信息。
具体地,所述获取用户的语音信息包括:
如图1c所示,于一实施例中,本发明的虚拟角色的语音调节方法,包括以下步骤:
步骤S111、基于语音采集装置获取用户的语音。
所述语音采集装置包括:麦克风。用户的语音是指用户说话的语句。
步骤S112、基于所述语音获取用户的语音信息,所述语音信息包括:用户的性别、用户的年龄段。
基于语音识别模型识别所述语音,获取用户的语音信息。所述语音识别模型包括:于动态时间规整(Dynamic Time Warping)的算法、基于参数模型的隐马尔可夫模型(HMM)的方法、基于人工神经网络(ANN)的算法。所述用户的性别包括:男性、女性。所述用户的年龄段包括:童龄段、青年段、老年段。
具体地,所述前台运行的应用信息包括:前台运行的应用类别。所述前台运行的应用类别包括:新闻类、工具类、儿童娱乐类、非儿童娱乐类。所述新闻前台运行的应用是指播放、展现新闻的前台运行的应用,例如播放交通新闻的广播前台运行的应用。所述工具类前台运行的应用是指作为车载工具使用的前台运行的应用,例如导航前台运行的应用。所述儿童娱乐类前台运行的应用是指播放、展示儿童娱乐节目的前台运行的应用,例如,正在播放儿童歌曲的音乐前台运行的应用,那么所述前台运行的应用类别就是儿童娱乐类。所述非儿童娱乐类前台运行的应用是指播放、展示非儿童娱乐节目的前台运行的应用,例如,正在播放非儿童歌曲的音乐前台运行的应用,那么所述前台运行的应用类别就是非儿童娱乐类。
步骤S12、基于所述语音信息和/或所述前台运行的应用信息通过语音调节规则获取对应的角色语音;基于所述角色语音调节虚拟角色的语音,以使所述虚拟角色使用调节后的语音与用户进行互动。
具体地,所述基于所述语音信息和/或所述前台运行的应用信息通过语音调节规则获取对应的角色语音包括:基于所述语音信息和/或所述前台运行的应用信息获取角色语音的性别和腔调。
具体地,所述基于所述语音信息和/或所述前台运行的应用信息获取角色语音的性别和腔调包括:预设用户的性别与角色语音的性别的对应关系,以基于用户的性别获取角色语音的性别;预设用户年龄段与角色语音的腔调的对应关系,以基于用户的年龄段获取角色语音的腔调;和/或预设前台运行的应用信息与角色语音的腔调的对应关系,以基于前台运行的应用信息获取角色语音的腔调。例如预设用户性别为女时,角色性别也为女,用户性别为男时,角色性别也为男。那么在用户性别为女时,基于用户的性别获取角色语音的性别为女。或者例如预设用户性别为女时,角色性别为男,用户性别为男时,角色性别为女。那么在用户性别为女时,基于用户的性别获取角色语音的性别为男。例如预设用户年龄段与角色语音的腔调的对应关系,当用户年龄段在1至16岁时,对应角色语音的腔调为童腔,当用户年龄段在17至45岁时,对应角色语音的腔调为中年腔,当用户年龄段在46岁以上时,对应角色语音的腔调为老年腔。和/或预设前台运行的应用信息与角色语音的腔调的对应关系,以基于前台运行的应用信息获取角色语音的腔调。预设新闻类前台运行的应用与角色语音的腔调的对应关系为播音腔,预设工具类前台运行的应用与角色语音的腔调的对应关系为播音腔,预设儿童娱乐类前台运行的应用与角色语音的腔调的对应关系为儿童腔,非儿童娱乐类前台运行的应用与角色语音的腔调的对应关系为中年腔。这样可以基于用户自身的年龄、用户使用的前台运行的应用实时调节虚拟角色的语音,更加符合用户的需求,且不需要用户主动调节。给用户提供一种更自然,更沉浸式的与虚拟角色的交互方式。
具体地,还包括设定用户年龄段和前台运行的应用信息的优先级关系,以基于所述优先级进行角色语音的腔调的设定。例如,设定用户年龄段的优先级高于前台运行的应用信息的优先级,那么,在用户年龄段与角色语音的腔调的对应关系和前台运行的应用信息与角色语音的腔调的对应关系冲突时,按照用户年龄段与角色语音的腔调的对应关系进行角色语音的腔调的设定,这样就防止出现冲突。
具体地,还包括基于用户的指令调节所述虚拟角色的语音。即用户发出指定性别和腔调的信息后,就基于用户的指令进行虚拟角色的语音的性别和腔调的调节,以满足用户的即兴需求。
如图2所示,于一实施例中,本发明的虚拟角色的语音调节***,包括获取模块21和调节模块22。
所述获取模块21用于获取用户的语音信息和用户正在使用的前台运行的应用信息。
所述调节模块22用于基于所述语音信息和/或所述前台运行的应用信息通过语音调节规则获取对应的角色语音;基于所述角色语音调节虚拟角色的语音,以使所述虚拟角色使用调节后的语音与用户进行互动。
具体地,所述获取用户的语音信息包括:基于语音采集装置获取用户的语音;基于所述语音获取用户的语音信息,所述语音信息包括:用户的性别、用户的年龄段。
需要说明的是:获取模块21和调节模块22的结构和原理与上述虚拟角色的语音调节方法中的步骤一一对应,故在此不再赘述。
需要说明的是,应理解以上***的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,x模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(Micro Processor Uint,简称MPU),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上***(system-on-a-chip,简称SOC)的形式实现。
于本发明一实施例中,本发明还包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一所述虚拟角色的语音调节方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
如图3所示,于一实施例中,本发明的虚拟角色的语音调节装置包括:处理器31和存储器32;所述存储器32用于存储计算机程序;所述处理器31与所述存储器32相连,用于执行所述存储器32存储的计算机程序,以使所述虚拟角色的语音调节装置执行任一所述的虚拟角色的语音调节方法。
具体地,所述存储器32包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
优选地,所述处理器31可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
综上所述,本发明虚拟角色的语音调节方法、***、介质及装置,用于自动、智能的为用户调节合适的虚拟角色的语音。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种虚拟角色的语音调节方法,其特征在于,应用于车辆终端,包括以下步骤:
获取用户的语音信息和前台运行的应用信息;
基于所述语音信息和/或所述前台运行的应用信息通过语音调节规则获取对应的角色语音;基于所述角色语音调节虚拟角色的语音,以使所述虚拟角色使用调节后的语音与用户进行互动。
2.根据权利要求1所述的虚拟角色的语音调节方法,所述获取用户的语音信息包括:
基于语音采集装置获取用户的语音;
基于所述语音获取用户的语音信息,所述语音信息包括:用户的性别、用户的年龄段。
3.根据权利要求1所述的虚拟角色的语音调节方法,所述前台运行的应用信息包括:前台运行的应用类别。
4.根据权利要求1所述的虚拟角色的语音调节方法,所述基于所述语音信息和/或所述前台运行的应用信息通过语音调节规则获取对应的角色语音包括:
基于所述语音信息和/或所述前台运行的应用信息获取角色语音的性别和腔调。
5.根据权利要求4所述的虚拟角色的语音调节方法,所述基于所述语音信息和/或所述前台运行的应用信息获取角色语音的性别和腔调包括:
预设用户的性别与角色语音的性别的对应关系,以基于用户的性别获取角色语音的性别;预设用户年龄段与角色语音的腔调的对应关系,以基于用户的年龄段获取角色语音的腔调;
和/或预设前台运行的应用信息与角色语音的腔调的对应关系,以基于前台运行的应用信息获取角色语音的腔调。
6.根据权利要求1所述的虚拟角色的语音调节方法,还包括基于用户的指令调节所述虚拟角色的语音。
7.一种虚拟角色的语音调节***,其特征在于,包括:获取模块和调节模块;
所述获取模块用于获取用户的语音信息和前台运行的应用信息;
所述调节模块用于基于所述语音信息和/或所述前台运行的应用信息通过语音调节规则获取对应的角色语音;基于所述角色语音调节虚拟角色的语音,以使所述虚拟角色使用调节后的语音与用户进行互动。
8.根据权利要求7所述的虚拟角色的语音调节***,所述获取用户的语音信息包括:
基于语音采集装置获取用户的语音;
基于所述语音获取用户的语音信息,所述语音信息包括:用户的性别、用户的年龄段。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行,以实现权利要求1至6中任一项所述虚拟角色的语音调节方法。
10.一种虚拟角色的语音调节装置,其特征在于,包括:处理器和存储器;
所述存储器用于存储计算机程序;
所述处理器与所述存储器相连,用于执行所述存储器存储的计算机程序,以使所述虚拟角色的语音调节装置执行权利要求1至6中任一项所述的虚拟角色的语音调节方法。
CN202110170453.9A 2021-02-08 2021-02-08 虚拟角色的语音调节方法、***、介质及装置 Pending CN114913849A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110170453.9A CN114913849A (zh) 2021-02-08 2021-02-08 虚拟角色的语音调节方法、***、介质及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110170453.9A CN114913849A (zh) 2021-02-08 2021-02-08 虚拟角色的语音调节方法、***、介质及装置

Publications (1)

Publication Number Publication Date
CN114913849A true CN114913849A (zh) 2022-08-16

Family

ID=82761563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110170453.9A Pending CN114913849A (zh) 2021-02-08 2021-02-08 虚拟角色的语音调节方法、***、介质及装置

Country Status (1)

Country Link
CN (1) CN114913849A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107564510A (zh) * 2017-08-23 2018-01-09 百度在线网络技术(北京)有限公司 一种语音虚拟角色管理方法、装置、服务器和存储介质
KR101894573B1 (ko) * 2017-03-14 2018-09-04 박홍식 3d 디지털 액터형 스마트폰 인터페이스 운용시스템
CN108668024A (zh) * 2018-05-07 2018-10-16 维沃移动通信有限公司 一种语音处理方法及终端
CN109358923A (zh) * 2018-08-29 2019-02-19 华为技术有限公司 一种虚拟机器人形象的呈现方法及装置
CN109523986A (zh) * 2018-12-20 2019-03-26 百度在线网络技术(北京)有限公司 语音合成方法、装置、设备以及存储介质
CN111383346A (zh) * 2020-03-03 2020-07-07 深圳创维-Rgb电子有限公司 基于智能语音的交互方法、***、智能终端和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101894573B1 (ko) * 2017-03-14 2018-09-04 박홍식 3d 디지털 액터형 스마트폰 인터페이스 운용시스템
CN107564510A (zh) * 2017-08-23 2018-01-09 百度在线网络技术(北京)有限公司 一种语音虚拟角色管理方法、装置、服务器和存储介质
CN108668024A (zh) * 2018-05-07 2018-10-16 维沃移动通信有限公司 一种语音处理方法及终端
CN109358923A (zh) * 2018-08-29 2019-02-19 华为技术有限公司 一种虚拟机器人形象的呈现方法及装置
CN109523986A (zh) * 2018-12-20 2019-03-26 百度在线网络技术(北京)有限公司 语音合成方法、装置、设备以及存储介质
CN111383346A (zh) * 2020-03-03 2020-07-07 深圳创维-Rgb电子有限公司 基于智能语音的交互方法、***、智能终端和存储介质

Similar Documents

Publication Publication Date Title
CN109791767B (zh) 用于语音识别的***和方法
CN109923608B (zh) 利用神经网络对混合语音识别结果进行评级的***和方法
US10489435B2 (en) Method, device and equipment for acquiring answer information
CN110400575B (zh) 通道间特征提取方法、音频分离方法和装置、计算设备
WO2021047201A1 (zh) 一种语音识别方法及装置
US9202459B2 (en) Methods and systems for managing dialog of speech systems
CN111508472B (zh) 一种语种切换方法、装置及存储介质
CN114064858A (zh) 一种对话机器人的对话处理方法、装置、电子设备和介质
CN112447168A (zh) 语音识别***、方法、音箱、显示设备和交互平台
CN114913849A (zh) 虚拟角色的语音调节方法、***、介质及装置
EP3765954A1 (en) Spatial characteristics of multi-channel source audio
CN106372203A (zh) 一种智能终端的信息响应方法、装置和智能终端
CN107729983A (zh) 一种利用机器视觉实现人机对弈的方法、装置及电子设备
CN110309284B (zh) 一种基于贝叶斯网络推理的自动对答方法及装置
CN115424614A (zh) 人机交互方法、装置、电子设备及车辆
CN107966900A (zh) 一种基于蚂蚁算法的人工智能优化方法
EP4030335A1 (en) Artificial intelligence-based semantic identification method, device, and semantic identification apparatus
CN114220421A (zh) 字级别的时间戳的生成方法、装置、电子设备和存储介质
CN111382322B (zh) 字符串相似度的确定方法和装置
CN107066567B (zh) 文字对话中基于话题侦测的用户画像建模方法及***
TW202423125A (zh) 視頻流中基於關鍵字的物件***
WO2023159749A1 (zh) 客服机器人的对话流程控制方法、装置、服务器及介质
CN115129847B (zh) 智能回答方法及装置
US20170294187A1 (en) Systems and method for performing speech recognition
CN115641845A (zh) 一种车辆的语音交互方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination