CN114036257A - 信息查询方法、装置、电子设备和存储介质 - Google Patents

信息查询方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN114036257A
CN114036257A CN202111212231.5A CN202111212231A CN114036257A CN 114036257 A CN114036257 A CN 114036257A CN 202111212231 A CN202111212231 A CN 202111212231A CN 114036257 A CN114036257 A CN 114036257A
Authority
CN
China
Prior art keywords
information query
target
coefficient sequence
broadcast data
voice broadcast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111212231.5A
Other languages
English (en)
Inventor
董浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111212231.5A priority Critical patent/CN114036257A/zh
Publication of CN114036257A publication Critical patent/CN114036257A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开提供了信息查询方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及人机交互、自然语言处理、深度学习、智能搜索领域。具体实现方案为:获取信息查询请求,并根据信息查询请求获取信息查询结果;根据信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及信息查询结果对应的第一语音播报数据,其中,第一动画系数序列用于调整第一目标部位对应的渲染模型的顶点;将第一动画系数序列和第一语音播报数据发送给客户端。本公开提供的信息查询方法,避免了信息查询层级太深,信息查询耗时极长等问题,提高了信息查询过程中的效率,同时使信息查询结果的显示更加直观,提高了用户体验。

Description

信息查询方法、装置、电子设备和存储介质
技术领域
本公开涉及人工智能技术领域中的人机交互、自然语言处理、深度学习、智能搜索领域,尤其涉及一种信息查询方法、装置、电子设备和存储介质。
背景技术
信息搜索(Information Seek),指的是从信息集合中找出所需要的信息的过程,广泛应用于各种业务场景中。特别地,针对银行类业务、通信类业务以及娱乐类业务等具有查询功能的APP(Application,应用程序),高效、准确的信息查询过程更是成为了主流业务之一。
然而,相关技术中,往往采用传统的信息查询模式进行查询及展示,极可能造成信息查询效率低、耗时久、用户体验极差等问题。因此,如何在确保信息查询结果准确性的同时,提高信息查询过程中的效率以提升用户体验,已成为了亟待解决的问题。
发明内容
本公开提供了一种信息查询方法、装置、电子设备和存储介质。
根据本公开的一方面,提供了一种信息查询方法,包括:获取信息查询请求,并根据所述信息查询请求获取信息查询结果;根据所述信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及所述信息查询结果对应的第一语音播报数据,其中,所述第一动画系数序列用于调整所述第一目标部位对应的渲染模型的顶点;将所述第一动画系数序列和所述第一语音播报数据发送给客户端。
根据本公开的另一方面,提供了一种信息查询方法,包括:向服务器发送信息查询请求,以指示所述服务器根据所述信息查询请求获取信息查询结果;接收所述服务器发送的根据所述信息查询结果生成的目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及所述信息查询结果对应的第一语音播报数据,其中,所述第一动画系数序列用于调整所述第一目标部位对应的渲染模型的顶点;将所述目标虚拟数据人在第一展示页面上展示,且驱动所述第一目标部位按照所述第一动画系数序列动作并同步播放所述第一语音播报数据。
根据本公开的另一方面,提供了一种信息查询装置,包括:获取模块,用于获取信息查询请求,并根据所述信息查询请求获取信息查询结果;生成模块,用于根据所述信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及所述信息查询结果对应的第一语音播报数据,其中,所述第一动画系数序列用于调整所述第一目标部位对应的渲染模型的顶点;发送模块,用于将所述第一动画系数序列和所述第一语音播报数据发送给客户端。
根据本公开的另一方面,提供了一种信息查询装置,包括:发送模块,用于向服务器发送信息查询请求,以指示所述服务器根据所述信息查询请求获取信息查询结果;接收模块,用于接收所述服务器发送的根据所述信息查询结果生成的目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及所述信息查询结果对应的第一语音播报数据,其中,所述第一动画系数序列用于调整所述第一目标部位对应的渲染模型的顶点;展示模块,用于将所述目标虚拟数据人在第一展示页面上展示,且驱动所述第一目标部位按照所述第一动画系数序列动作并同步播放所述第一语音播报数据。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的一方面所述的信息查询方法,或者执行本公开的另一方面所述的信息查询方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开的一方面所述的信息查询方法,或者执行根据本公开的另一方面所述的信息查询方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开的一方面所述的信息查询方法的步骤,或者实现根据本公开的另一方面所述的信息查询方法的步骤。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的信息查询方法的流程示意图;
图2是根据本公开一种发送信息查询请求的示意图;
图3是根据本公开另一种发送信息查询请求的示意图;
图4是根据本公开服务器将数据发送给客户端的流程示意图;
图5是根据本公开第二实施例的信息查询方法的流程示意图;
图6是根据本公开第三实施例的信息查询方法的流程示意图;
图7是根据本公开第四实施例的信息查询方法的流程示意图;
图8是根据本公开第五实施例的信息查询方法的流程示意图;
图9是根据本公开调用展示页面的示意图;
图10是根据本公开第六实施例的信息查询方法的流程示意图;
图11是根据本公开一种信息查询过程的示意图;
图12是用来实现本公开实施例的信息查询方法的信息查询装置的框图;
图13是用来实现本公开实施例的信息查询方法的信息查询装置的框图;
图14是用来实现本公开实施例的信息查询方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
人工智能(Artificial Intelligence,简称AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门技术科学。目前,AI技术具有自动化程度高、精确度高、成本低的优点,得到了广泛的应用。
人机交互(Human–Computer Interaction,HCI)是一门研究***与用户之间的交互关系的学问。***可以是各种各样的机器,也可以是计算机化的***和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与***交流,并进行操作。
自然语言处理(Natural Language Processing,NLP)是研究能有效地实现自然语言通信的计算机***,特别是其中的软件***的一门科学,是计算机科学领域与人工智能领域中的一个重要方向。
深度学习(Deep Learning,简称DL),是机器学习(Machine Learning,简称ML)领域中一个新的研究方向,学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。就具体研究内容而言,主要包括基于卷积运算的神经网络***,即卷积神经网络;基于多层神经元的自编码神经网络;以多层自编码神经网络的方式进行预训练,进而结合鉴别信息进一步优化神经网络权值的深度置信网络。深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。
智能搜索是结合了人工智能技术的新一代搜索引擎,除了能提供传统的快速检索、相关度排序等功能,还能提供用户角色登记、用户兴趣自动识别、内容的语义理解、智能信息化过滤和推送等功能。
下面结合附图描述本公开实施例的信息查询方法、装置、电子设备和存储介质。
图1是根据本公开第一实施例的信息查询方法的流程示意图。
如图1所示,本公开实施例提供的信息查询方法,执行主体为服务器,具体方法可包括以下步骤:
S101,获取信息查询请求,并根据信息查询请求获取信息查询结果。
其中,信息查询请求,可以为用户输入的针对任一信息的查询请求,例如,信息查询请求可以为针对账单明细的查询请求;又例如,信息查询请求可以为针对人民币兑美元汇率的查询请求;再例如,信息查询请求可以为针对电影播放场次的查询请求。
需要说明的是,本公开中,用户可以通过多种方式发送信息查询请求,可选地,用户可以通过点击对应的控件发送信息查询请求,例如,如图2所示,用户甲可以通过点击控件2-1发送针对账单明细的查询请求2-2;可选地,用户可以通过输入语音指令发送信息查询请求,例如,如图3所示,用户乙可以在点击控件3-1后输入内容为“查询账单明细”的语音指令3-2,以通过输入语音的方式发送信息查询请求。
需要说明的是,由于客户端的展示界面面积受限等原因,一般不会将过多的控件同时进行展示,这样一来,往往需要用户依次点击多个业务范围逐渐减小的控件才能实现与预期匹配的信息查询请求的发送。例如,若用户甲试图发送的信息查询请求为“查询账单明细”,则需要用户甲依次点击“***-查询-查询账单-查询账单明细”共4个控件才能实现信息查询请求的发送。此种情况下,极可能存在信息查询层级太深,信息查询耗时极长等不便。
相较于点击对应的控件发送信息查询请求,输入语音指令发送信息查询请求的方式往往存在更明显的优势。由此,本公开中,为了进一步提升信息查询效率,优选地,用户可以通过输入语音指令发送信息查询请求。
相应地,服务器可以通过多种方式获取信息查询请求,可选地,服务器可以通过对对应的控件进行检测,并在检测到对应的控件触发后确认获取到信息查询请求;可选地,服务器可以通过获取并识别麦克风拾取的语音指令来获取信息查询请求。
进一步地,在服务器获取信息查询请求之后,可以根据信息查询请求获取信息查询结果。其中,信息查询请求中可以携带查询关键词、用户标识等信息。
举例而言,若获取到用户甲输入的信息查询请求为“查询账单明细”,此种情况下,服务器可以根据查询关键词、用户标识等信息获取用户甲的账单明细,并将用户甲的账单明细作为信息查询结果。
S102,根据信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及信息查询结果对应的第一语音播报数据,其中,第一动画系数序列用于调整第一目标部位对应的渲染模型的顶点。
具体的,服务器根据步骤S101中获取的信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及信息查询结果对应的第一语音播报数据。
其中,目标虚拟数字人,可以是用于辅助展示信息查询结果的任一虚拟数字人。本公开实施例中,虚拟数字人为采用数字技术建模,可通过广播、网络等通信传媒与用户进行交互的仿真人形象,可根据用户的指令修改3D建模的相关参数进行相应的动作。
其中,第一动画系数序列,可以为用于调整目标虚拟数字人的第一目标部位对应的渲染模型的顶点的任一系数序列,例如,第一动画系数序列可以为BlendShap(简称BS)系数序列。BS系数,指的是通过单个网格变形以实现多种预定义形状进行混合/变形的技术,在一些应用场景下,又称混合形状或变形目标,例如通过单个网格是默认形状的基本形状(例如无表情的面),实现不同的表达(笑、皱眉、闭合眼皮)。
其中,第一语音播报数据,对应于信息查询结果。
可选地,第一语音播报数据可以仅包括信息查询结果对应的语音,即言,第一语音播报数据可以与信息查询结果对应的语音一致。举例而言,若信息查询结果为账单明细的具体内容,此种情况下,第一语音播报数据即为账单明细的具体内容。
可选地,第一语音播报数据可以同时包括默认语音以及仅包括信息查询结果对应的语音,即言,第一语音播报数据可以与信息查询结果对应的语音不一致。举例而言,若默认语音为“感谢您的耐心等待,下面为您播报信息查询结果”,且信息查询结果为账单明细的具体内容,此种情况下,第一语音播报数据即为“感谢您的耐心等待,下面为您播报信息查询结果”以及账单明细的具体内容。
S103,将第一动画系数序列和第一语音播报数据发送给客户端。
具体的,服务器将步骤S102中生成的第一动画系数序列和第一语音播报数据发送给客户端,以指示客户端根据第一动画系数序列调整目标虚拟数字人的第一目标部位对应的渲染模型的顶点,进而使得客户端驱动第一目标部位按照第一动画系数序列动作并同步播放第一语音播报数据。
相应地,客户端可以接收第一动画系数序列和第一语音播报数据,并根据第一动画系数序列调整目标虚拟数字人的第一目标部位对应的渲染模型的顶点,进而驱动第一目标部位按照第一动画系数序列动作并同步播放第一语音播报数据。
举例而言,如图4所示,服务器将第一动画系数序列和第一语音播报数据发送给客户端。相应地,客户端可以接收第一动画系数序列和第一语音播报数据,并根据第一动画系数序列调整目标虚拟数字人4-1的第一目标部位4-2对应的渲染模型的顶点,进而驱动第一目标部位4-2按照第一动画系数序列动作并同步播放第一语音播报数据4-3。
综上,本公开实施例的信息查询方法,服务器可以先获取信息查询请求,并根据信息查询请求获取信息查询结果,再根据信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及信息查询结果对应的第一语音播报数据,并将第一动画系数序列和第一语音播报数据发送给客户端,使得客户端能够展示目标虚拟数据人并驱动第一目标部位按照第一动画系数序列动作并同步播放第一语音播报数据,避免了信息查询层级太深,信息查询耗时极长等问题,提高了信息查询过程中的效率,同时,通过目标虚拟数字人展示信息查询结果,能够使信息查询结果的显示更加直观,通过使用户在体验沉浸式信息查询的过程中提高用户体验。
图5是根据本公开第二实施例的信息查询方法的流程示意图。如图5所示,在上述实施例的基础上,本公开实施例的信息查询方法具体可包括以下步骤:
S501,获取信息查询请求,并根据信息查询请求获取信息查询结果。
具体的,本公开实施例中的步骤S501与上述实施例中步骤S101相同,此处不再赘述。
需要说明的是,本公开实施例中,在根据信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列之前,可以通过多种方式确定第一目标部分,具体实现方式本公开不作限定,可以根据实际情况进行选取。
作为一种可能的实现方式,在上述实施例中的步骤S102“根据信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列”之前,可包括以下步骤S502-S503。
S502,获取信息查询请求对应的业务类型。
需要说明的是,由于针对信息查询请求对应的不同的业务类型,能够更加贴切地展示信息查询结果的目标虚拟数字人的第一目标部位也是不同的。
其中,业务类据具体可包括但不限于查询、转账等。
S503,根据业务类型,确定第一目标部位。
本公开实施例中,可以预先设定有业务类型与第一目标部位之间的映射关系,在获取到业务类型后,可以根据业务类型查询映射,以确定匹配的第一目标部位。
其中,第一目标部位,至少包括目标虚拟数字人的唇部,还可以包括目标虚拟数字人的手臂、手掌、手指等。
举例而言,若信息查询请求对应的业务类型为查询,则根据业务类型查询映射,以确定匹配的第一目标部位为唇部和手掌;若信息查询请求对应的业务类型为转账,则根据业务类型查询映射,以确定匹配的第一目标部位为唇部、手掌和手指。
上述实施例中的步骤S102“根据信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及信息查询结果对应的第一语音播报数据”具体可包括以下步骤S504-S505。
S504,对信息查询结果进行从文本到语音TTS处理,以获取第一语音播报数据。
具体的,服务器中对信息查询结果进行从文本到语音TTS(Text To Speech)处理转换为目标格式的音频,例如,wav(波形声音文件)格式的音频,并将对应的wav音频作为第一语音播报数据。
其中,TTS处理,指的是通过多个阶段的处理,以将文本转化为语音的过程。可选地,可以编写包括汉字和汉语拼音的文本数据,并寻找汉字对应的音频数据。进一步地,获取待转化汉字或者汉语拼音,并进行codecs解码,以寻找匹配的音频,即第一语音播报数据。
S505,根据第一语音播报数据,获取第一目标部位对应的第一动画系数序列。
具体的,服务器可以基于语音动画合成VTA(Voice-To-Animation)算法,根据第一语音播报数据和信息查询结果的文本,获取BS系数,即第一目标部位的第一动画系数序列。
其中,VTA算法,指的是将具体的语音转换为对应的动画系数(3D模型中面部的n组顶点数据),以基于动画系数设置具体的顶点数据驱动模型进行微调,从而实现微笑、说话等面部表情的方法。
作为一种可能的实现方式,如图6所示,在上述实施例的基础上,步骤S505“根据第一语音播报数据,获取第一目标部位对应的第一动画系数序列”具体可包括:
S601,按照预设策略对第一语音播报数据进行切割,以得到至少一个分段语音数据。
其中,本公开对于预设策略不作限定,可以根据实际情况进行设定。例如,可以设定预设策略为按照字符对第一语音播报数据进行切割,此种情况下,分段语音数据的数量与字符的数量一致;又例如,可以设定预设策略为按照词组对第一语音播报数据进行切割,此种情况下,分段语音数据的数量与词组的数量一致。
S602,根据分段语音数据,获取第一目标部位对应的第一动画系数序列。
本公开实施例中,分段语音数据的数量与第一动画系数序列中包括得到第一动画系数的数量一致。
举例而言,针对按照n个字符对第一语音播报数据进行切割后得到的n个分段语音数据,可以获取到包括n个第一动画系数的第一动画系数序列。
S506,将第一动画系数序列和第一语音播报数据发送给客户端。
具体的,本公开实施例中的步骤S506与上述步骤S103相同,此处不再赘述。
综上,本公开实施例的信息查询方法,服务器可以通过TTS技术将查询结果的文字转换为第一语音播报数据,并基于VTA算法将第一语音播报数据和信息查询结果对应的文本转化为第一动画系数序列,为第一语音播报数据和第一动画系数序列的同步展示奠定了基础,进一步地提高了信息查询过程中的效率,同时使信息查询结果的显示更加符合人体工学规律,提高了用户体验。
图7是根据本公开第四实施例的信息查询方法的流程示意图。
如图7所示,本公开实施例提出的信息查询方法,执行主体为客户端,具体方法可包括以下步骤:
S701,向服务器发送信息查询请求,以指示服务器根据信息查询请求获取信息查询结果。
其中,信息查询请求,可以为用户输入的针对任一信息的查询请求,例如,信息查询请求可以为针对账单明细的查询请求;又例如,信息查询请求可以为针对人民币兑美元汇率的查询请求;再例如,信息查询请求可以为针对电影播放场次的查询请求。
需要说明的是,本公开中,用户可以通过多种方式发送信息查询请求,可选地,用户可以通过点击对应的控件发送信息查询请求;可选地,用户可以通过输入语音指令发送信息查询请求。
需要说明的是,由于客户端的展示界面面积受限等原因,一般不会将过多的控件同时进行展示,这样一来,往往需要用户依次点击多个业务范围逐渐减小的控件才能实现与预期匹配的信息查询请求的发送。例如,若用户甲试图发送的信息查询请求为“查询账单明细”,则需要用户甲依次点击“***-查询-查询账单-查询账单明细”共4个控件才能实现信息查询请求的发送。此种情况下,极可能存在信息查询层级太深,信息查询耗时极长等不便。
相较于点击对应的控件发送信息查询请求,输入语音指令发送信息查询请求的方式往往存在更明显的优势。由此,本公开中,为了进一步提升信息查询效率,优选地,用户可以通过输入语音指令发送信息查询请求。
相应地,服务器可以通过多种方式获取信息查询请求,可选地,服务器可以通过对对应的控件进行检测,并在检测到对应的控件触发后确认获取到信息查询请求;可选地,服务器可以通过获取并识别麦克风拾取的语音指令来获取信息查询请求。
进一步地,在服务器获取信息查询请求之后,可以根据信息查询请求获取信息查询结果。其中,信息查询请求中可以携带查询关键词、用户标识等信息。
举例而言,若获取到用户甲输入的信息查询请求为“查询账单明细”,此种情况下,服务器可以根据查询关键词、用户标识等信息获取用户甲的账单明细,并将用户甲的账单明细作为信息查询结果。
S702,接收服务器发送的根据信息查询结果生成的目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及信息查询结果对应的第一语音播报数据,其中,第一动画系数序列用于调整第一目标部位对应的渲染模型的顶点。
其中,目标虚拟数字人,可以是用于辅助展示信息查询结果的任一虚拟数字人。本公开实施例中,虚拟数字人为采用数字技术建模,可通过广播、网络等通信传媒与用户进行交互的仿真人形象,可根据用户的指令修改3D建模的相关参数进行相应的动作。
其中,第一动画系数序列,可以为用于调整目标虚拟数字人的第一目标部位对应的渲染模型的顶点的任一系数序列,例如,第一动画系数序列可以为BlendShap(简称BS)系数序列。BS系数,指的是通过单个网格变形以实现多种预定义形状进行混合/变形的技术,在一些应用场景下,又称混合形状或变形目标,例如通过单个网格是默认形状的基本形状(例如无表情的面),实现不同的表达(笑、皱眉、闭合眼皮)。
其中,第一语音播报数据,对应于信息查询结果。
可选地,第一语音播报数据可以仅包括信息查询结果对应的语音,即言,第一语音播报数据可以与信息查询结果对应的语音一致。举例而言,若信息查询结果为账单明细的具体内容,此种情况下,第一语音播报数据即为账单明细的具体内容。
可选地,第一语音播报数据可以同时包括默认语音以及仅包括信息查询结果对应的语音,即言,第一语音播报数据可以与信息查询结果对应的语音不一致。举例而言,若默认语音为“感谢您的耐心等待,下面为您播报信息查询结果”,且信息查询结果为账单明细的具体内容,此种情况下,第一语音播报数据即为“感谢您的耐心等待,下面为您播报信息查询结果”以及账单明细的具体内容。
S703,将目标虚拟数据人在第一展示页面上展示,且驱动第一目标部位按照第一动画系数序列动作并同步播放第一语音播报数据。
其中,第一展示页面,至少展示有目标虚拟数据人,且第一目标部位按照第一动画系数序列动作并同步播放第一语音播报数据。进一步地,还可以包括信息查询结果对应的文本。其中,信息查询结果对应的文本的展示形式不作限定,可以根据实际情况进行设定。例如,可以为表格形式、可以为图表形式、也可以为动态图像形式等。
需要说明的是,在第一目标部位按照第一动画系数序列动作并同步播放第一语音播报数据时,以第一目标部位仅为唇部为例,唇部的动作在与第一语音播报数据同步进行播报之外,唇部的连续的形状变化,也与第一语音播报数据对应的汉字发音时的口型一致。
综上,本公开实施例的信息查询方法,客户端可以向服务器发送信息查询请求,并接收服务器发送的第一动画系数序列以及第一语音播报数据,进而将目标虚拟数据人在第一展示页面上展示,且驱动第一目标部位按照第一动画系数序列动作并同步播放第一语音播报数据,通过目标虚拟数字人展示信息查询结果,能够使信息查询结果的显示更加直观,通过使用户在体验沉浸式信息查询的过程中提高用户体验。可选地,以第一目标部位仅为唇部为例,唇部的动作在与第一语音播报数据同步进行播报之外,唇部的连续的形状变化,也与第一语音播报数据对应的汉字发音时的口型一致,进一步提高了用户体验。
图8是根据本公开第五方面实施例的信息查询方法的流程示意图。如图8所示,在上述实施例的基础上,本公开实施例的信息查询方法具体可包括以下步骤:
S801,调用第二展示页面,第二展示页面包括至少一个虚拟数字人。
其中,第二展示页面,可以用于提供至少一个虚拟数字人供用户进行选择,进一步地,还可以用于提供多种类型的业务供用户进行选择。
其中,虚拟数字人,可以包括但不限于男性、女性、儿童、成年人等。进一步地,不同的虚拟数字人可以配置有不同的音色、音调等特征。
举例而言,如图9所示,在进入银行类业务APP中展示的营业大厅后,可以调用第二展示页面9-1,并在第二展示页面9-1上展示有两个虚拟数字人,分别为虚拟数字人甲9-2(男性)和虚拟数字人乙9-3(女性)。
S802,从至少一个虚拟数字人中确定目标虚拟数字人。
需要说明的是,本公开中,用户可以通过多种方式确定目标虚拟数字人,可选地,用户可以通过点击对应的控件确定目标虚拟数字人;可选地,用户可以通过输入语音指令确定目标虚拟数字人。
S803,获取第二展示页面配置的至少一类业务。
需要说明的是,本公开中,用户可以通过多种方式获取第二展示页面配置的至少一类业务,可选地,用户可以通过点击对应的控件获取第二展示页面配置的至少一类业务;可选地,用户可以通过输入语音指令获取第二展示页面配置的至少一类业务。
S804,获取至少一类业务对应的目标虚拟数字人的第二目标部位对应的第二动画系数序列,以及至少一类业务对应的第二语音播报数据。
需要说明的是,本公开中,可以通过多种方式获取第二动画系数序列以及第二语音播报数据。
作为一种可能的实现方式,可选地,可以从本地缓存中获取第二动画系数序列以及第二语音播报数据。
作为另一种可能的实现方式,可选地,也可通过服务器进行获取。在客户端获取业务类型(至少一类业务)后,可以将业务类型发送给服务器,以使服务器基于业务类型的文本信息,生成第二动画系数序列和第二语音播报数据。
需要说明的是,为了进一步使用户能够对信息查询过程的不同阶段有更加直观且清晰的感受,可以设定第二语音播报数据为具有较为宽泛语义的语音数据。例如,可以设定第二语音播报数据为“请选择您要查询的业务”。
S805,将目标虚拟数据人在第二展示页面上展示,且驱动第二目标部位按照第二动画系数序列动作并同步播放第二语音播报数据。
进一步地,在将目标虚拟数据人在第二展示页面上展示,且驱动第二目标部位按照第二动画系数序列动作并同步播放第二语音播报数据的同时,还可以于第二展示页面上展示与被选取业务对应的控件。
上述实施例中的步骤S701“向服务器发送信息查询请求,以指示服务器根据信息查询请求获取信息查询结果”具体可包括以下步骤S806-S809。
S806,从至少一类业务中确定目标业务,并调用目标业务对应的第三展示页面。
其中,目标业务种类的划分可以根据实际情况进行设定,本公开不作限定,例如,可以划分为较为宽泛的母业务(对应于子业务)类型,分别为查询、转账等。
需要说明的是,本公开中,用户可以通过多种方式确定目标业务,可选地,用户可以通过点击对应的控件确定目标业务;可选地,用户可以通过输入语音指令确定目标业务。
进一步地,在确定目标业务后,可以调用目标业务对应的第三展示页面。
其中,第三展示页面,可以用于提供目标业务对应的多种子业务供用户进行选择。
S807,获取目标业务所包括的子业务,并获取子业务对应的目标虚拟数字人的第三目标部位对应的第三动画系数序列,以及子业务对应的第三语音播报数据。
其中,目标业务所包括的子业务为相较于目标业务而言更加局限、具体的业务类型,例如“查询”业务下的“查询持仓”、“查询信用”等子业务。
S808,将目标虚拟数据人在第三展示页面上展示,且驱动第三目标部位按照第三动画系数序列动作并同步播放第三语音播报数据。
需要说明的是,为了进一步使用户能够对信息查询过程的不同阶段有更加直观且清晰的感受,可以设定第三语音播报数据为具有较为局限、具体语义的语音数据。例如,可以设定第三语音播报数据为“请问您想要查询持仓情况还是信用等级”等。
S809,响应于检测到针对任一子业务的选取指令,则根据选取指令,生成信息查询请求。
需要说明的是,本公开中,可以通过多种方式发送针对任一子业务的选取指令,可选地,可以通过点击对应的控件选取子业务,从而发送选取指令;可选地,用户可以通过输入语音指令选取子业务,从而发送选取指令。
相应地,客户端可以通过监控对应的控件的点击情况和/或语音指令,生成信息查询请求。
S810,接收服务器发送的根据信息查询结果生成的目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及信息查询结果对应的第一语音播报数据,其中,第一动画系数序列用于调整第一目标部位对应的渲染模型的顶点。
本公开实施例中的步骤S810与上述实施例中步骤S702相同,此处不再赘述。
S811,将目标虚拟数据人在第一展示页面上展示,且驱动第一目标部位按照第一动画系数序列动作并同步播放第一语音播报数据。
其中,本公开中可以通过多种方式驱动第一目标部位按照第一动画系数序列动作,作为一种可能的实现方式,可以将第一动画系数序列输入3D渲染引擎中,由3D渲染引擎基于第一动画系数序列对第一目标部位对应的顶点进行位置调整,以驱动第一目标部位按照第一动画系数序列进行动作。
具体的,客户端将第一动画系数序列输入3D渲染引擎中,3D渲染引擎通过第一动画系数序列实时调整目标虚拟数字人的第一目标部位的位置,实现第一目标部位的渲染,从而实现第一目标部位按照第一动画系数序列进行行动。
需要说明的是,本公开实施例中,第一目标部位、第二目标部位和第三目标部位均至少包括唇部,且第一目标部位、第二目标部位和第三目标部位可以一致,也可以不一致。
举例而言,第一目标部位为唇部、手掌和手指;第二目标部位仅为唇部;第三目标部位为唇部、手掌和手指。
综上,本公开实施例的信息查询方法,客户端可以通过调用多个页面的方式,使用户体验到浸式信息查询,且尽可能的降低了用户的学习成本,并缩短了信息查询耗时,从而提高了信息查询过程中的效率。
图10是根据本公开第六实施例的信息查询方法的流程示意图。
如图10所示,本公开实施例提供的信息查询方法,整体方法可包括以下步骤:
S1001,客户端向服务器发送信息查询请求,以指示服务器根据信息查询请求获取信息查询结果。
S1002,服务器获取信息查询请求,并根据信息查询请求获取信息查询结果。
S1003,服务器根据信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及信息查询结果对应的第一语音播报数据,其中,第一动画系数序列用于调整第一目标部位对应的渲染模型的顶点。
S1004,服务器将第一动画系数序列和第一语音播报数据发送给客户端。
S1005,客户端接收服务器发送的根据信息查询结果生成的目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及信息查询结果对应的第一语音播报数据,其中,第一动画系数序列用于调整第一目标部位对应的渲染模型的顶点。
S1006,客户端将目标虚拟数据人在第一展示页面上展示,且驱动第一目标部位按照第一动画系数序列动作并同步播放第一语音播报数据。
需要说明的是,本公开提供的信息查询方法适用于多种应用场景,下面以进入手机银行查询账单的应用场景为例进行解释说明。
如图11所示,用户以手机银行作为渠道,即言手机银行为业务办理底层实现,与智能感知平台和5G线上营业厅进行交互,从而实现账单的查询。其中,智能感知平台,包括负责将语言转为文字的智能语音子***TTS,以及通过输入的文字,判断是办理的业务,调起具体的办理接口,并返回结果给5G线上营业厅的NLP子***。其中,5G线上营业厅,包括调用手机银行和NLP子***的具体接口进行业务办理,办理业务可以通过界面控件点击,语言交互等方式调起的具体业务办理,通过目标虚拟人播报业务办理结果(信息查询结果)。
可选地,通过手机银行入口进入5G营业大厅后,可以通过点击导航键或通过语音发起“我要查账进入查账专区”,客户端通过自然语言处理NLP识别用户语音选取操作进入查账专区。
进一步地,在进入查账专区后,可以调起手机银行的相关接口,进行查询,手机银行将查询信息返回查账专区。此种情况下,客户端可以将查账信息发送给服务器,服务器调用TTS服务,将查询结果的文本转为wav音频(第一语音播报数据),再基于VTA算法,根据wav音频和账单明细传给VTA算法获取BlendShap系数序列(第一动画系数序列)。
进一步地,服务器将wav音频和BlendShap系数返回客户端查账专区,客户端查账专区通过展示具体账单并播放wav音频,同时将BlendShap系数传给3D渲染引擎,3D渲染引擎通过BlendShap系数实时调整虚拟数字人进行唇部动画播放,从而实现账单明细的查询。
图12是根据本公开提出的信息查询装置1200,包括:获取模块1201、生成模块1202和发送模块1203。其中,
获取模块1201,用于获取信息查询请求,并根据所述信息查询请求获取信息查询结果;
生成模块1202,用于根据所述信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及所述信息查询结果对应的第一语音播报数据,其中,所述第一动画系数序列用于调整所述第一目标部位对应的渲染模型的顶点;
发送模块1203,用于将所述第一动画系数序列和所述第一语音播报数据发送给客户端。
进一步的,生成模块1202,还用于:
对所述信息查询结果进行从文本到语音TTS处理,以获取所述第一语音播报数据;
根据所述第一语音播报数据,获取所述第一目标部位对应的所述第一动画系数序列。
进一步的,生成模块1202,还用于:
按照预设策略对所述第一语音播报数据进行切割,以得到至少一个分段语音数据;
根据所述分段语音数据,获取所述第一目标部位对应的所述第一动画系数序列。
进一步的,生成模块1202,还用于:
获取所述信息查询请求对应的业务类型;
根据所述业务类型,确定所述第一目标部位。
进一步的,所述第一目标部位至少包括所述目标虚拟数字人的唇部。
综上,本公开实施例的信息查询装置,服务器可以先获取信息查询请求,并根据信息查询请求获取信息查询结果,再根据信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及信息查询结果对应的第一语音播报数据,并将第一动画系数序列和第一语音播报数据发送给客户端,使得客户端能够展示目标虚拟数据人并驱动第一目标部位按照第一动画系数序列动作并同步播放第一语音播报数据,避免了信息查询层级太深,信息查询耗时极长等问题,提高了信息查询过程中的效率,同时,通过目标虚拟数字人展示信息查询结果,能够使信息查询结果的显示更加直观,通过使用户在体验沉浸式信息查询的过程中提高用户体验。
图13是根据本公开提出的信息查询装置1300,包括:发送模块1301、接收模块1302和展示模块1303。其中,
发送模块1301,用于向服务器发送信息查询请求,以指示所述服务器根据所述信息查询请求获取信息查询结果;
接收模块1302,用于接收所述服务器发送的根据所述信息查询结果生成的目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及所述信息查询结果对应的第一语音播报数据,其中,所述第一动画系数序列用于调整所述第一目标部位对应的渲染模型的顶点;
展示模块1303,用于将所述目标虚拟数据人在第一展示页面上展示,且驱动所述第一目标部位按照所述第一动画系数序列动作并同步播放所述第一语音播报数据。
进一步的,展示模块1303,还用于:
将所述第一动画系数序列输入3D渲染引擎中,由所述3D渲染引擎基于所述第一动画系数序列对所述第一目标部位对应的顶点进行位置调整,以驱动所述第一目标部位按照所述第一动画系数序列进行动作;
进一步的,发送模块1301,还用于:
调用第二展示页面,所述第二展示页面包括至少一个虚拟数字人;
从所述至少一个虚拟数字人中确定所述目标虚拟数字人;
进一步的,发送模块1301,还用于:
获取所述第二展示页面配置的至少一类业务;
获取所述至少一类业务对应的所述目标虚拟数字人的第二目标部位对应的第二动画系数序列,以及所述至少一类业务对应的第二语音播报数据;
将所述目标虚拟数据人在所述第二展示页面上展示,且驱动所述第二目标部位按照所述第二动画系数序列动作并同步播放所述第二语音播报数据;
进一步的,发送模块1301,还用于:
从所述至少一类业务中确定目标业务,并调用所述目标业务对应的第三展示页面;
获取所述目标业务所包括的子业务,并获取所述子业务对应的所述目标虚拟数字人的第三目标部位对应的第三动画系数序列,以及所述子业务对应的第三语音播报数据;
将所述目标虚拟数据人在所述第三展示页面上展示,且驱动所述第三目标部位按照所述第三动画系数序列动作并同步播放所述第三语音播报数据;
响应于检测到针对任一所述子业务的选取指令,则根据所述选取指令,生成所述信息查询请求。
进一步的,发送模块1301,还用于:
所述第一目标部位、所述第二目标部位和所述第三目标部位均至少包括所述目标虚拟人的唇部。
综上,本公开实施例的信息查询装置,客户端可以向服务器发送信息查询请求,并接收服务器发送的第一动画系数序列以及第一语音播报数据,进而将目标虚拟数据人在第一展示页面上展示,且驱动第一目标部位按照第一动画系数序列动作并同步播放第一语音播报数据,通过目标虚拟数字人展示信息查询结果,能够使信息查询结果的显示更加直观,通过使用户在体验沉浸式信息查询的过程中提高用户体验。可选地,以第一目标部位仅为唇部为例,唇部的动作在与第一语音播报数据同步进行播报之外,唇部的连续的形状变化,也与第一语音播报数据对应的汉字发音时的口型一致,进一步提高了用户体验。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图14示出了可以用来实施本公开的实施例的示例电子设备1400的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图14所示,电子设备1400包括计算单元1401,其可以根据存储在只读存储器(ROM)1402中的计算机程序或者从存储单元1408加载到随机访问存储器(RAM)1403中的计算机程序,来执行各种适当的动作和处理。在RAM 1403中,还可存储设备1400操作所需的各种程序和数据。计算单元1401、ROM 1402以及RAM 1403通过总线1404彼此相连。输入/输出(I/O)接口1405也连接至总线1404。
设备1400中的多个部件连接至I/O接口1405,包括:输入单元1406,例如键盘、鼠标等;输出单元1407,例如各种类型的显示器、扬声器等;存储单元1408,例如磁盘、光盘等;以及通信单元1409,例如网卡、调制解调器、无线通信收发机等。通信单元1409允许设备1400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1401执行上文所描述的各个方法和处理,例如图1至图11所示的信息查询方法。例如,在一些实施例中,信息查询方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1408。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1402和/或通信单元1409而被载入和/或安装到设备1400上。当计算机程序加载到RAM 1403并由计算单元1401执行时,可以执行上文描述的信息查询方法的一个或多个步骤。备选地,在其他实施例中,计算单元1401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行信息查询方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网以及区块链网络。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式***的服务器,或者是结合了区块链的服务器。
根据本公开的实施例,本公开还提供了一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时实现根据本公开上述实施例所示的信息查询方法的步骤。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (25)

1.一种信息查询方法,包括:
获取信息查询请求,并根据所述信息查询请求获取信息查询结果;
根据所述信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及所述信息查询结果对应的第一语音播报数据,其中,所述第一动画系数序列用于调整所述第一目标部位对应的渲染模型的顶点;
将所述第一动画系数序列和所述第一语音播报数据发送给客户端。
2.根据权利要求1所述的信息查询方法,其中,所述根据所述信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及所述信息查询结果对应的第一语音播报数据,包括:
对所述信息查询结果进行从文本到语音TTS处理,以获取所述第一语音播报数据;
根据所述第一语音播报数据,获取所述第一目标部位对应的所述第一动画系数序列。
3.根据权利要求2所述的信息查询方法,其中,所述根据所述第一语音播报数据,获取所述第一目标部位对应的所述第一动画系数序列,包括:
按照预设策略对所述第一语音播报数据进行切割,以得到至少一个分段语音数据;
根据所述分段语音数据,获取所述第一目标部位对应的所述第一动画系数序列。
4.根据权利要求1-3中任一项所述的信息查询方法,其中,所述根据所述信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列之前,还包括:
获取所述信息查询请求对应的业务类型;
根据所述业务类型,确定所述第一目标部位。
5.根据权利要求4所述的信息查询方法,其中,所述第一目标部位至少包括所述目标虚拟数字人的唇部。
6.一种信息查询方法,包括:
向服务器发送信息查询请求,以指示所述服务器根据所述信息查询请求获取信息查询结果;
接收所述服务器发送的根据所述信息查询结果生成的目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及所述信息查询结果对应的第一语音播报数据,其中,所述第一动画系数序列用于调整所述第一目标部位对应的渲染模型的顶点;
将所述目标虚拟数据人在第一展示页面上展示,且驱动所述第一目标部位按照所述第一动画系数序列动作并同步播放所述第一语音播报数据。
7.根据权利要求6所述的信息查询方法,其中,所述驱动所述第一目标部位按照所述第一动画系数序列动作,包括:
将所述第一动画系数序列输入3D渲染引擎中,由所述3D渲染引擎基于所述第一动画系数序列对所述第一目标部位对应的顶点进行位置调整,以驱动所述第一目标部位按照所述第一动画系数序列进行动作。
8.根据权利要求6所述的信息查询方法,其中,所述向服务器发送信息查询请求之前,还包括:
调用第二展示页面,所述第二展示页面包括至少一个虚拟数字人;
从所述至少一个虚拟数字人中确定所述目标虚拟数字人。
9.根据权利要求8所述的信息查询方法,其中,所述方法还包括:
获取所述第二展示页面配置的至少一类业务;
获取所述至少一类业务对应的所述目标虚拟数字人的第二目标部位对应的第二动画系数序列,以及所述至少一类业务对应的第二语音播报数据;
将所述目标虚拟数据人在所述第二展示页面上展示,且驱动所述第二目标部位按照所述第二动画系数序列动作并同步播放所述第二语音播报数据。
10.根据权利要求9所述的信息查询方法,其中,所述向服务器发送信息查询请求,包括:
从所述至少一类业务中确定目标业务,并调用所述目标业务对应的第三展示页面;
获取所述目标业务所包括的子业务,并获取所述子业务对应的所述目标虚拟数字人的第三目标部位对应的第三动画系数序列,以及所述子业务对应的第三语音播报数据;
将所述目标虚拟数据人在所述第三展示页面上展示,且驱动所述第三目标部位按照所述第三动画系数序列动作并同步播放所述第三语音播报数据;
响应于检测到针对任一所述子业务的选取指令,则根据所述选取指令,生成所述信息查询请求。
11.根据权利要求10所述的信息查询方法,其中,所述第一目标部位、所述第二目标部位和所述第三目标部位均至少包括所述目标虚拟人的唇部。
12.一种信息查询装置,包括:
获取模块,用于获取信息查询请求,并根据所述信息查询请求获取信息查询结果;
生成模块,用于根据所述信息查询结果,生成目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及所述信息查询结果对应的第一语音播报数据,其中,所述第一动画系数序列用于调整所述第一目标部位对应的渲染模型的顶点;
发送模块,用于将所述第一动画系数序列和所述第一语音播报数据发送给客户端。
13.根据权利要求12所述的信息查询装置,其中,所述生成模块,还用于:
对所述信息查询结果进行从文本到语音TTS处理,以获取所述第一语音播报数据;
根据所述第一语音播报数据,获取所述第一目标部位对应的所述第一动画系数序列。
14.根据权利要求13所述的信息查询装置,其中,所述生成模块,还用于:
按照预设策略对所述第一语音播报数据进行切割,以得到至少一个分段语音数据;
根据所述分段语音数据,获取所述第一目标部位对应的所述第一动画系数序列。
15.根据权利要求12-14中任一项所述的信息查询装置,所述生成模块,还用于:
获取所述信息查询请求对应的业务类型;
根据所述业务类型,确定所述第一目标部位。
16.根据权利要求15所述的信息查询装置,所述第一目标部位至少包括所述目标虚拟数字人的唇部。
17.一种信息查询装置,包括:
发送模块,用于向服务器发送信息查询请求,以指示所述服务器根据所述信息查询请求获取信息查询结果;
接收模块,用于接收所述服务器发送的根据所述信息查询结果生成的目标虚拟数字人的第一目标部位对应的第一动画系数序列,以及所述信息查询结果对应的第一语音播报数据,其中,所述第一动画系数序列用于调整所述第一目标部位对应的渲染模型的顶点;
展示模块,用于将所述目标虚拟数据人在第一展示页面上展示,且驱动所述第一目标部位按照所述第一动画系数序列动作并同步播放所述第一语音播报数据。
18.根据权利要求17所述的信息查询装置,其中,所述展示模块,还用于:
将所述第一动画系数序列输入3D渲染引擎中,由所述3D渲染引擎基于所述第一动画系数序列对所述第一目标部位对应的顶点进行位置调整,以驱动所述第一目标部位按照所述第一动画系数序列进行动作。
19.根据权利要求17所述的信息查询装置,所述发送模块,还用于:
调用第二展示页面,所述第二展示页面包括至少一个虚拟数字人;
从所述至少一个虚拟数字人中确定所述目标虚拟数字人。
20.根据权利要求19所述的信息查询装置,所述发送模块,还用于:
获取所述第二展示页面配置的至少一类业务;
获取所述至少一类业务对应的所述目标虚拟数字人的第二目标部位对应的第二动画系数序列,以及所述至少一类业务对应的第二语音播报数据;
将所述目标虚拟数据人在所述第二展示页面上展示,且驱动所述第二目标部位按照所述第二动画系数序列动作并同步播放所述第二语音播报数据。
21.根据权利要求20所述的信息查询装置,其中,所述发送模块,还用于:
从所述至少一类业务中确定目标业务,并调用所述目标业务对应的第三展示页面;
获取所述目标业务所包括的子业务,并获取所述子业务对应的所述目标虚拟数字人的第三目标部位对应的第三动画系数序列,以及所述子业务对应的第三语音播报数据;
将所述目标虚拟数据人在所述第三展示页面上展示,且驱动所述第三目标部位按照所述第三动画系数序列动作并同步播放所述第三语音播报数据;
响应于检测到针对任一所述子业务的选取指令,则根据所述选取指令,生成所述信息查询请求。
22.根据权利要求21所述的信息查询装置,其中,所述第一目标部位、所述第二目标部位和所述第三目标部位均至少包括所述目标虚拟人的唇部。
23.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法,或者执行权利要求6-11中任一项所述的方法。
24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-5中任一项所述的方法,或者执行权利要求6-11中任一项所述的方法。
25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-5中任一项所述方法的步骤,或者实现根据权利要求6-11中任一项所述方法的步骤。
CN202111212231.5A 2021-10-18 2021-10-18 信息查询方法、装置、电子设备和存储介质 Pending CN114036257A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111212231.5A CN114036257A (zh) 2021-10-18 2021-10-18 信息查询方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111212231.5A CN114036257A (zh) 2021-10-18 2021-10-18 信息查询方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN114036257A true CN114036257A (zh) 2022-02-11

Family

ID=80141843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111212231.5A Pending CN114036257A (zh) 2021-10-18 2021-10-18 信息查询方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114036257A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150206525A1 (en) * 2014-01-22 2015-07-23 Rory Ryder Searching and content delivery system
CN111724457A (zh) * 2020-03-11 2020-09-29 长沙千博信息技术有限公司 基于ue4的真实感虚拟人多模态交互实现方法
CN111785246A (zh) * 2020-06-30 2020-10-16 联想(北京)有限公司 虚拟角色语音处理方法、装置及计算机设备
CN112162628A (zh) * 2020-09-01 2021-01-01 魔珐(上海)信息科技有限公司 基于虚拟角色的多模态交互方法、装置及***、存储介质、终端
CN112967010A (zh) * 2021-02-07 2021-06-15 中国工商银行股份有限公司 基于数字人引导的业务办理方法、装置、电子设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150206525A1 (en) * 2014-01-22 2015-07-23 Rory Ryder Searching and content delivery system
CN111724457A (zh) * 2020-03-11 2020-09-29 长沙千博信息技术有限公司 基于ue4的真实感虚拟人多模态交互实现方法
CN111785246A (zh) * 2020-06-30 2020-10-16 联想(北京)有限公司 虚拟角色语音处理方法、装置及计算机设备
CN112162628A (zh) * 2020-09-01 2021-01-01 魔珐(上海)信息科技有限公司 基于虚拟角色的多模态交互方法、装置及***、存储介质、终端
CN112967010A (zh) * 2021-02-07 2021-06-15 中国工商银行股份有限公司 基于数字人引导的业务办理方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
US11593984B2 (en) Using text for avatar animation
US20210090314A1 (en) Multimodal approach for avatar animation
JP6701206B2 (ja) ユーザーエクスペリエンスを向上させるためにあいまいな表現を弁別すること
US11735182B2 (en) Multi-modal interaction between users, automated assistants, and other computing services
US10217260B1 (en) Real-time lip synchronization animation
US20190340200A1 (en) Multi-modal interaction between users, automated assistants, and other computing services
US11830491B2 (en) Determining whether to automatically resume first automated assistant session upon cessation of interrupting second session
CN105869633A (zh) 语言模型的跨语种初始化
US20190341040A1 (en) Multi-modal interaction between users, automated assistants, and other computing services
CN115309877A (zh) 对话生成方法、对话模型训练方法及装置
CN113536007A (zh) 一种虚拟形象生成方法、装置、设备以及存储介质
US20230087244A1 (en) Digital assistant for providing visualization of snippet information
CN113407850A (zh) 一种虚拟形象的确定和获取方法、装置以及电子设备
US20240055017A1 (en) Multiple state digital assistant for continuous dialog
CN112860995A (zh) 交互方法、装置、客户端、服务器以及存储介质
JP7372402B2 (ja) 音声合成方法、装置、電子機器及び記憶媒体
CN114238594A (zh) 服务的处理方法、装置、电子设备及存储介质
CN114036257A (zh) 信息查询方法、装置、电子设备和存储介质
CN113379879A (zh) 交互方法、装置、设备、存储介质以及计算机程序产品
CN116348950A (zh) 在执行任何语音命令时从周围环境进行基于ar(增强现实)的选择性声音包括
CN113327311A (zh) 基于虚拟角色的显示方法、装置、设备、存储介质
KR20220069403A (ko) 하이라이팅 기능이 포함된 감정 분석 서비스를 위한 방법 및 장치
CN113785540B (zh) 使用机器学习提名方生成内容宣传的方法、介质和***
CN114360535B (zh) 语音对话的生成方法、装置、电子设备及存储介质
US20230343336A1 (en) Multi-modal interaction between users, automated assistants, and other computing services

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination