CN111767465A

CN111767465A - 信息的推荐方法、装置、计算设备和介质

Info

Publication number: CN111767465A
Application number: CN202010659863.5A
Authority: CN
Inventors: 郭志军; 罗涛; 施佳子
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2020-07-09
Filing date: 2020-07-09
Publication date: 2020-10-13

Abstract

本公开提供了一种信息的推荐方法，包括：获取用户与数字人的交互数据；根据所述交互数据，确定用户的前序操作序列；根据所述前序操作序列，确定推荐信息；以及输出所述推荐信息。本公开还提供了一种信息的推荐装置、一种计算设备以及一种计算机存储介质。

Description

信息的推荐方法、装置、计算设备和介质

技术领域

本公开涉及计算机技术领域，更具体地，涉及一种信息的推荐方法、装置、计算设备以及一种计算机存储介质。

背景技术

以虚拟形象展示，语音交互技术为核心的人工智能产品逐渐应用于各大领域。据预测，在2020年，人与商业之间产生的90％的商业互动都是由数字助手来完成。智能人像生成、智能语音技术的快速发展正在突破人们的想象。

数字人是指在用户端使用移动设备自身硬件能力或云端算力，通过语音驱动3D虚拟形象说话及反馈情绪动作，并赋予3D虚拟形象智能化、拟人化的交互能力的技术。该技术将深度学习神经网络、计算机图形学、语音合成、自然语言处理、语音识别等多学科融合，让计算机能够理解语音的内容并精细驱动虚拟形象，生成极具逼真感的虚拟形象。在5G时代，3D数字人可为用户带来更为直观、亲和的服务体验。

但是数字人技术仍属于近年的新兴技术，现有的数字人的服务能力较差。

发明内容

本公开的一个方面提供了一种信息的推荐方法，包括：获取用户与数字人的交互数据；根据所述交互数据，确定用户的前序操作序列；根据所述前序操作序列，确定推荐信息；以及输出所述推荐信息。

可选地，所述获取用户与数字人的交互数据，包括：获取用户输入的语音数据；以及对所述语音数据进行语音识别，以将所述语音数据转换为所述交互数据。

可选地，所述交互数据包括多个文本数据；所述根据所述交互数据，确定用户的前序操作序列，包括：利用经训练的语言模型，对每个所述文本数据进行分类，以得到前序操作节点；以及根据所述前序操作节点，确定所述前序操作序列。

可选地，所述根据所述前序操作序列，确定推荐信息，包括：利用经训练的深度学习模型，对所述前序操作序列进行预测，以确定所述用户下一步将要执行的目标操作；以及根据所述目标操作，生成推荐信息。

可选地，所述方法还包括：生成数字人图像；以及通过所述数字人图像，展示所述推荐信息。

本公开的另一个方面提供了一种信息的推荐装置，包括：获取模块，用于获取用户与数字人的交互数据；第一确定模块，用于根据所述交互数据，确定用户的前序操作序列；第二确定模块，用于根据所述前序操作序列，确定推荐信息；以及输出模块，用于输出所述推荐信息。

可选地，所述获取模块，包括：获取子模型，用于获取用户输入的语音数据；以及识别子模块，用于对所述语音数据进行语音识别，以将所述语音数据转换为所述交互数据。

可选地，所述装置还包括：生成模块，用于生成数字人图像；以及展示模块，用于通过所述数字人图像，展示所述推荐信息。

本公开的另一个方面提供了一种计算设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上所述的方法。

本公开的另一方面提供了一种计算机可读存储介质，存储有计算机可执行指令，所述指令在被执行时用于实现如上所述的方法。

本公开的另一方面提供了一种计算机程序，所述计算机程序包括计算机可执行指令，所述指令在被执行时用于实现如上所述的方法。

根据本公开的实施例，通过用户与数字人的交互数据，为用户的下一步操作确定推荐信息，从而智能推荐用户需求的目标，提高了数字人的服务能力，节省了用户的操作流程时间，改善了用户体验。

附图说明

为了更完整地理解本公开及其优势，现在将参考结合附图的以下描述，其中：

图1示意性示出了根据本公开的实施例的信息的推荐方法和信息的推荐装置的应用场景；

图2示意性示出了根据本公开的实施例的信息的推荐方法的流程图；

图3示意性示出了根据本公开的实施例的根据所述交互数据，确定用户的前序操作序列的流程图；

图4示意性示出了根据本公开的实施例的根据前序操作序列，确定推荐信息的流程图；

图5示意性示出了根据本公开另一实施例的信息的推荐方法的流程图；

图6示例性示出了根据本公开的实施例的BERT模型的示意图；

图7示例性示出了根据本公开的实施例的利用BERT模型进行分类的示意图；

图8示例性示出了根据本公开的实施例的GRU模型的示意图；

图9示例性示出了根据本公开的实施例的利用GRU模型确定用户下一步操作的示意图；

图10示意性示出了根据本公开的实施例的推荐方法的装置的框图；

图11示意性示出了根据本公开另一实施例的推荐方法的装置的框图；以及

图12示意性示出了根据本公开另一实施例的计算机***的框图。

具体实施方式

以下，将参照附图来描述本公开的实施例。但是应该理解，这些描述只是示例性的，而并非要限制本公开的范围。在下面的详细描述中，为便于解释，阐述了许多具体的细节以提供对本公开实施例的全面理解。然而，明显地，一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本公开的概念。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B或C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。

附图中示出了一些方框图和/或流程图。应理解，方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外，本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式，该计算机程序产品可供指令执行***使用或者结合指令执行***使用。

本公开的实施例提供了一种信息的推荐方法以及能够应用该方法的信息的推荐装置。该方法包括获取用户与数字人的交互数据；根据交互数据，确定用户的前序操作序列；根据前序操作序列，确定推荐信息；以及输出推荐信息。

图1示意性示出了根据本公开的实施例的信息的推荐方法和信息的推荐装置的应用场景。需要注意的是，图1所示仅为可以应用本公开实施例的场景的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。

如图1所示，在个人使用手机银行用户端的场景中，用户可通过语音唤醒手机银行用户端的数字人功能后，手机银行App界面上弹出数字人(包括但不限于数字人及背景)的悬浮窗口。用户可以通过对话方式可向数字人提出问题，例如“请问如何办理***”。手机银行用户端的后台服务器采用语音识别技术(ASR)将用户声音转换为文本内容。然后将文本内容传递给自然语言处理***(NLP)。自然语言处理***理解用户文本内容并生成相应的回答内容，并将回答内容以文本形式发送给语音合成***(TTS)。语音合成***将应答的文本内容转换为对应的音频及控制流数据，并发送到用户端。用户端根据控制流数据调整数字人的嘴型变化等，并通过播放音频，以向用户展示回答内容，例如如何办理引用卡流程。

根据本公开的实施例，数字人显示界面可以位于本地终端。而语音识别技术(ASR)、自然语言处理(NLP)、下一步推荐和语音合成***(TTS)均可以位于后台服务器。

图2示意性示出了根据本公开的实施例的信息的推荐方法的流程图。

如图2所示，该方法包括操作S210～S240。

在操作S210，获取用户与数字人的交互数据。

根据本公开的实施例，操作S210例如可以包括获取用户输入的语音数据，对语音数据进行语音识别，以将语音数据转换为交互数据。

根据本公开的实施例，用户输入的语音数据例如可以包括用户与数字人进行对话时输入的多个语音信息。相应地，在操作S210中，可以分别对语音数据中的每个语音信息进行语音识别，以得到与每个语音数据对应的文本数据，作为交互数据。

在操作S220，根据交互数据，确定用户的前序操作序列。

图3示意性示出了根据本公开的实施例的根据所述交互数据，确定用户的前序操作序列的流程图。如图3所示，操作S220例如可以包括操作S321～S322。

在操作S321，利用经训练的语言模型，对每个文本数据进行分类，以得到前序操作节点。

根据本公开的实施例，语言模型可以识别文本数据中包含的语义信息，根据语义信息确定用户之前执行过的操作，并根据操作的类型，对文本数据进行分类。语言模型例如可以为BERT模型。BERT全称为“Bidirectional Encoder Representation fromTransformers”，即转换器的双向编码表示。

根据本公开的实施例，可以将交互数据中的每个文本数据输入BERT模型，以输出每个文本数据的分类标签。分类标签例如可以为操作的种类名，例如行情查询、账户贵金属交易明细、账户贵金属管理挂单等。

举例说明，用户与数字人语音交互时，用户的交互内容如下：

用户Q：小智(假定数字人唤醒名称)，我要查询账户情况；

数字人A：请问您要查询理财明细，还是汇款明细呢？

用户Q：小智，我要查询汇款明细；

数字人A：以下是您本月汇款明细；

用户Q：小智，仅显示境内汇款明细；

数字人A：以下是您本月境内汇款明细；

用户Q：……

可以将“小智(假定数字人唤醒名称)，我要查询账户情况”输入BERT模型。BERT模型根据文本数据所对应的操作类型将文本数据分类为“行情查询”。类似地，可将上述交互内容中的每个文本数据输入BERT模型。BERT模型可以根据对话流程，将文本数据抽象为“行情查询→账户贵金属交易明细→账户贵金属管理挂单→……”的标签流程。

根据本公开的实施例，为了方便表示，可以将每个分类标签数字字典化，以用不同的数字标签表示每个操作，例如，可以将行情查询表示为0001，账户贵金属交易明细表示为0002，账户贵金属管理挂单表示为0003等。本实施例中，将数字字典化后的分类标签称为操作节点。利用经训练的语言模型，对每个文本数据进行分类，并数字字典化后得到的数字标签分类标签称为前序操作节点，用以代表用户之前进行过的操作。

在操作S322，根据前序操作节点，确定前序操作序列。

根据本公开的实施例，可以将所有前序操作节点按照对应操作的发生时间先后进行排序，得到前序操作序列。

例如，对于“行情查询→账户贵金属交易明细→账户贵金属管理挂单→……”的标签流程，前序操作序列可以为“0001，0002，0003，......”

在操作S230，根据前序操作序列，确定推荐信息。

图4示意性示出了根据本公开的实施例的根据前序操作序列，确定推荐信息的流程图。如图4所示，操作S230例如可以包括操作S431～S432。

在操作S431，利用经训练的深度学习模型，对前序操作序列进行预测，以确定用户下一步将要执行的目标操作。

根据本公开的实施例，深度学习模型例如可以为GRU模型。GRU(Gated RecurrentUnit，门控循环单元)是LSTM(Long Shot-TermMemory，长短期记忆网络)的一种变种。相比LSTM，GRU仅有重置门(reset gate)和更新门(update gate)。本实施例中，可以利用GRU模型训练学习用户交互规律并挖掘用户意图，以确定用户下一步将要执行的目标操作。

根据本公开的实施例，可以通过GRU模型预测用户下一步可能要做的多个操作的概率，取概率最高的n个操作作为目标操作，其中n为正整数。

在操作S432，根据目标操作，生成推荐信息。

根据本公开的实施例，推荐信息例如可以包括目标操作的介绍信息、与目标操作相关的其他操作信息、与目标操作相关的产品信息等信息。

在操作S240，输出推荐信息。

根据本公开的实施例，可以一并将n个目标操作所对应的推荐信息输出，以将这些推荐信息一起推荐给用户，让用户做选择。

图5示意性示出了根据本公开另一实施例的信息的推荐方法的流程图。

如图5所示，除了操作S210～S240之外，该方法还可以包括操作S550～S560。

具体地，在操作S550，生成数字人图像。

在操作S560，通过数字人图像，展示推荐信息。

根据本公开的实施例，可以通过语音合成***将推荐信息转换为对应的音频数据及控制流数据，根据控制流数据生成对应的数字人图像，并调整数字人的形态，例如调整数字人的嘴型变化等，同时播放音频数据，以向展示推荐信息。

根据本公开的实施例，通过数字人向用户展示推荐信息，能够提供更为直观、亲和的推荐服务，从而提高了用户体验。

下面参考图6～图7，结合具体实施例对BERT模型做进一步说明。本领域技术人员可以理解，以下示例实施例仅用于理解本公开，本公开并不局限于此。

图6示例性示出了根据本公开的实施例的BERT模型的示意图。如图6所示，BERT模型的输入为每个词embedding后的词向量E_i，i∈[1，N]，E_i为第i个词向量，N为大于1的整数。图6中的Trm是Transformer(转换器)的Encoder(编码器)。BERT模型中可以包含多个转换器的编码器。每个转换器的编码器可一次性读取整个序列，而不是自左向右或自右向左地按顺序读取。这使模型能够基于词的两侧学习文本之间的上下文关系。BERT模型的输出为T_i，i∈[1，N]，T_i为第i个词向量。BERT旨在通过联合调节所有层中的上下文来预先训练深度双向表示。

图7示例性示出了根据本公开的实施例的利用BERT模型进行分类的示意图。如图7所示，Tok 1～Tok N为单句(Single Sentence)中的字，C为分类标签(Class Label)。实际预训练时，由于基于词两侧的内容学***的注意力分配使无法直接用来表示文本分类。所以，BERT预训练前首先需要在文本前添加“[CLS]”标识符，并将该标识符对应的输出向量作为整个文本的语义表示，用于文本分类。因为与文本已有的其他字相比，这个无明显语义信息的符号会更“公平”关注每个字，更好地融合文本中各个字的语义信息。

示例性地，本实施例中，在BERT数据标注时，共有10个操作类型，对应的数字化后的分类标签例如“0_0，1_0，2_0，3_0，4_0，5_0，6_0，7_0，8_0，9_0”。数字标签下划线前的数字代表分类情况(从0至9，即对应10个操作类型)。数字标签下划线后的数字存在0和1两种情况，其中0表示文本信息不属于该操作类型，1表示文本信息属于该操作类型。

以文本“小智，查询近期汇款情况”为例，该文本的分类标签为汇款明细。若汇款明细分类对应0号类型，则数字标签为“0_1，1_0，2_0，3_0，4_0，5_0，6_0，7_0，8_0，9_0”。

本实施例中，由于数字标签下划线前的数字共10类，下划线后数字共2类，因此数字标签存在20种情况。在送入BERT模型前需将数字标签转为一串20位的数字，例如上述数字标签“0_1，1_0，2_0，3_0，4_0，5_0，6_0，7_0，8_0，9_0”可转换为“01101010101010101010”，即表1的标注数字位。

表1

在大量数据标注数字标签后，批量将标签及文本数据送入BERT模型。下述仍以上述样例文本和数字标签为例进行说明。上述样例文本送入BERT模型后，自动添加CLS标识符为“[CLS]小智，查询近期汇款情况”；对每文本中的每个字进行embedding生成如图7所示的向量E_[CLS]和E_i，i∈[1，N]。向量通过多层Transformer的encoder后得到的“C”已融合文本中各个字的语义信息。通过“C”与分类器连接进行模型训练，即可获取文本对应的分类概率。

示例性地，模型一轮迭代完成后，输出为表2所示的概率。

表2

表2是预测数字位表，如上表所示，若0_0，0_1均表示汇款明细标签，0_0(不是汇款明细)的概率为0.00000445，0_1(是汇款明细)的概率为0.99999535。两者加和近似1，0_0的概率小于0_1的概率，即该文本包含汇款明细标签。标签位的两位(如0_0和0_1)进行概率比较，概率较大的预测数字位赋值为1，概率较小的预测数字位赋值为0，即生成表2所示的预测数字位。训练迭代过程中，不断缩小表1的标注数字位与表2的预测数字位之间的平均误差。模型一旦收敛，即完成BERT分类模型的训练，得到标签分类模型。

根据本公开的实施例，可以通过数据分析生成大量用户的流程序列，作为训练集数据。根据各个用户在某一时间段内与数字人交互内容，生成对应的数字标签序列，同时要求数字标签序列中的数字标签数不少于3，即用户与数字人的交互流程长度不短于3。

下面参考图8～图9，结合具体实施例对GRU模型做进一步说明。本领域技术人员可以理解，以下示例实施例仅用于理解本公开，本公开并不局限于此。

GRU(Gated Recurrent Unit)是LSTM(Long Shot-Term Memory，长短期记忆网络)的一种变种。相比LSTM，GRU仅有重置门(reset gate)和更新门(update gate)。图8示例性示出了根据本公开的实施例的GRU模型的示意图。如图8所示，z_t代表更新门，r_t代表重置门。更新门控制上一时刻的状态信息h_t-1传入到当前状态x_t中的程度。重置门控制上一时刻有多少信息被写入到当前候选集

h_t为输出。

图9示例性示出了根据本公开的实施例的利用GRU模型确定用户下一步操作的示意图。如图9所示，操作1、操作2、……、操作n即对应前序操作节点序列，即0001，0002等。对每个操作节点进行emb(embedding)处理，生成操作对应的低维向量。按照流程序列顺序依次送入GRU单元，以得到输出结果。输出结果为N维向量，向量的第i维表示第i个内容推荐用户的概率。其中，N与推荐内容数量相关，例如若推荐给用户的内容共100种，即输出结果为100维向量。

图10示意性示出了根据本公开的实施例的推荐方法的装置的框图。

如图10所示，推荐方法的装置1000例如可以包括获取模块1010、第一确定模块1020、第二确定模块1030和输出模块1040。该推荐方法的装置1000可以执行上面参考图2～图4描述的方法。

具体地，获取模块1010，可以用于获取用户与数字人的交互数据。

第一确定模块1020，可以用于根据所述交互数据，确定用户的前序操作序列。

第二确定模块1030，可以用于根据所述前序操作序列，确定推荐信息。

输出模块1040，可以用于输出所述推荐信息。

根据本公开的实施例，所述获取模块可以包括：获取子模型，用于获取用户输入的语音数据；以及识别子模块，用于对所述语音数据进行语音识别，以将所述语音数据转换为所述交互数据。

图11示意性示出了根据本公开另一实施例的推荐方法的装置的框图。

如图11所示，除了获取模块1010、第一确定模块1020、第二确定模块1030和输出模块1040之外，推荐方法的装置1100还可以包括生成模块1110和展示模块1120。

具体地，生成模块1110，用于生成数字人图像。

展示模块1120，用于通过所述数字人图像，展示所述推荐信息。

根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

例如，获取模块1010、第一确定模块1020、第二确定模块1030、输出模块1040、生成模块1110和展示模块1120。中的任意多个可以合并在一个模块中实现，或者其中的任意一个模块可以被拆分成多个模块。或者，这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合，并在一个模块中实现。根据本公开的实施例，获取模块1010、第一确定模块1020、第二确定模块1030、输出模块1040、生成模块1110和展示模块1120中的至少一个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，获取模块1010、第一确定模块1020、第二确定模块1030、输出模块1040、生成模块1110和展示模块1120中的至少一个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

图12示意性示出了根据本公开实施例的适于实现上文描述的方法的计算机***的方框图。图12示出的计算机***仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图12所示，计算机***1200包括处理器1210以及计算机可读存储介质1220。该计算机***1200可以执行根据本公开实施例的方法。

具体地，处理器1210例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(ASIC))，等等。处理器1210还可以包括用于缓存用途的板载存储器。处理器1210可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

计算机可读存储介质1220，例如可以是非易失性的计算机可读存储介质，具体示例包括但不限于：磁存储装置，如磁带或硬盘(HDD)；光存储装置，如光盘(CD-ROM)；存储器，如随机存取存储器(RAM)或闪存；等等。

计算机可读存储介质1220可以包括计算机程序1221，该计算机程序1221可以包括代码/计算机可执行指令，其在由处理器1210执行时使得处理器1210执行根据本公开实施例的方法或其任何变形。

计算机程序1221可被配置为具有例如包括计算机程序模块的计算机程序代码。例如，在示例实施例中，计算机程序1221中的代码可以包括一个或多个程序模块，例如包括1221A、模块1221B、……。应当注意，模块的划分方式和个数并不是固定的，本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合，当这些程序模块组合被处理器1210执行时，使得处理器1210可以执行根据本公开实施例的方法或其任何变形。

根据本发明的实施例，获取模块1010、第一确定模块1020、第二确定模块1030、输出模块1040、生成模块1110和展示模块1120中的至少一个可以实现为参考图12描述的计算机程序模块，其在被处理器1210执行时，可以实现上面描述的相应操作。

本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的；也可以是单独存在，而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被执行时，实现根据本公开实施例的方法。

根据本公开的实施例，计算机可读存储介质可以是非易失性的计算机可读存储介质，例如可以包括但不限于：便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

附图中的流程图和框图，图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

本领域技术人员可以理解，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合，即使这样的组合或结合没有明确记载于本公开中。特别地，在不脱离本公开精神和教导的情况下，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。

尽管已经参照本公开的特定示例性实施例示出并描述了本公开，但是本领域技术人员应该理解，在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下，可以对本公开进行形式和细节上的多种改变。因此，本公开的范围不应该限于上述实施例，而是应该不仅由所附权利要求来进行确定，还由所附权利要求的等同物来进行限定。

Claims

1.一种信息的推荐方法，包括：

获取用户与数字人的交互数据；

根据所述交互数据，确定用户的前序操作序列；

根据所述前序操作序列，确定推荐信息；以及

输出所述推荐信息。

2.根据权利要求1所述的方法，其中，所述获取用户与数字人的交互数据，包括：

获取用户输入的语音数据；以及

对所述语音数据进行语音识别，以将所述语音数据转换为所述交互数据。

3.根据权利要求1所述的方法，其中，所述交互数据包括多个文本数据；

所述根据所述交互数据，确定用户的前序操作序列，包括：

利用经训练的语言模型，对每个所述文本数据进行分类，以得到前序操作节点；以及

根据所述前序操作节点，确定所述前序操作序列。

4.根据权利要求1所述的方法，其中，所述根据所述前序操作序列，确定推荐信息，包括：

利用经训练的深度学习模型，对所述前序操作序列进行预测，以确定所述用户下一步将要执行的目标操作；以及

根据所述目标操作，生成推荐信息。

5.根据权利要求1所述的方法，还包括：

生成数字人图像；以及

通过所述数字人图像，展示所述推荐信息。

6.一种信息的推荐装置，包括：

获取模块，用于获取用户与数字人的交互数据；

第一确定模块，用于根据所述交互数据，确定用户的前序操作序列；

第二确定模块，用于根据所述前序操作序列，确定推荐信息；以及

输出模块，用于输出所述推荐信息。

7.根据权利要求6所述的装置，其中，所述获取模块，包括：

获取子模型，用于获取用户输入的语音数据；以及

识别子模块，用于对所述语音数据进行语音识别，以将所述语音数据转换为所述交互数据。

8.根据权利要求6所述的装置，还包括：

生成模块，用于生成数字人图像；以及

展示模块，用于通过所述数字人图像，展示所述推荐信息。

9.一种计算设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个计算机程序，

其中，当一个或多个计算机程序被一个或多个处理器执行时，使得一个或多个处理器实现权利要求1至5中任一项的方法。

10.一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器实现权利要求1至5中任一项的方法。