CN108228910B

CN108228910B - 一种将循环神经网络应用在关联选择问题上的方法

Info

Publication number: CN108228910B
Application number: CN201810133342.9A
Authority: CN
Inventors: 马佳; 高伟; 邓森洋
Original assignee: Akex Jiaxing Information Technology Co ltd
Current assignee: Akex Jiaxing Information Technology Co ltd
Priority date: 2018-02-09
Filing date: 2018-02-09
Publication date: 2023-05-12
Anticipated expiration: 2038-02-09
Also published as: CN108228910A

Abstract

本发明公开了一种将循环神经网络应用在关联选择问题上的方法，包括以下步骤：预处理选项及值；创建预处理后的选项及值字典；创建选项值的数值映射；确定循环神经网络输入层及输出层的个数；确定样本中的初始及结束标示；确定循环神经网络循环的次数；对相关的样本进行训练；对相关内容进行预测。本发明通过基于循环神经网络的方式来处理关联问题，可以避免预先有人工定义的方式来设定关联问题的规则，并且根据用户每次关联选择内容的不同，不断对循环神经网络中的内容进行更新，最终达到最好的效果，大幅度提高了企业的标准化。

Description

一种将循环神经网络应用在关联选择问题上的方法

技术领域

本发明涉及人工智能、机器学习领域，具体是一种将循环神经网络应用在关联选择问题上的方法。

背景技术

当前，在用户需求多变的背景下，定制化思想深入到各行各业，而如何快速，并有效的提高用户需求的录入体验是非常重要的内容。

在各种用户需求交互的场景中，为了提高用户的录入体验，经常会提供关联选择的内容。关联选择主要是通过确定了X的内容后，Y的内容依据X选定的内容而变化，因Y的内容依赖X，甚至依赖X和其他内容确定后（比如X、A、B内容确定后），Y的内容会随之变化。为了要达到关联选择的要求，传统的做法，需要预先定义关联的内容规则，比如定义X=x.value1时Y=y.value1或Y=y.value2或Y=y.value3，则用户在X中选择了x.value1时，Y就会根据规则自动的确定y.value1/y.value2/y.value3。通过传统方式，需要在使用之前，投入精力创建大量的预先定义的内容。

由于关联问题的情况，涉及到时序性的问题，其符合循环神经网络应用的特点，因此此处考虑采用循环神经网络的方式来处理关联问题。为此，本领域技术人员提出了一种将循环神经网络应用在关联选择问题上的方法，以解决上述背景技术中提出的问题。

发明内容

本发明的目的在于提供一种将循环神经网络应用在关联选择问题上的方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种将循环神经网络应用在关联选择问题上的方法，包括以下步骤：

S1，预处理选项及值；

S2，创建预处理后的选项及值字典；

S3，创建选项值的数值映射；

S4，确定循环神经网络输入层及输出层的个数；

S5，确定样本中的初始及结束标示；

S6，确定循环神经网络循环的次数；

S7，对相关的样本进行训练；

S8，对相关内容进行预测。

作为本发明进一步的方案：在步骤S1中，将选项与其值之间组合成一个整体内容。

作为本发明进一步的方案：在步骤S2中，根据预处理后的选项及值的内容，对于每一个独立的值进行抽取，并将其放入选项及值字典中。

作为本发明进一步的方案：在步骤S3中，根据选项及值的字典，创建每一个值的特征映射，并将特征映射的内容定义为一个N维向量；其中，N维向量的维度由选项字典中的大小决定。

作为本发明进一步的方案：在步骤S4中，依据创建的选项及值的数值映射，创建神经网络的输入层及输出层的神经元个数，此处采用的输入及输出的神经元个数与进行数值映射后的向量的维度相同，即输入、输出的神经元个数都是N个。

作为本发明进一步的方案：在步骤S5中，对每一组待训练的关联选择的样本都给出初始及结束标示。

作为本发明进一步的方案：在步骤S6中，确定循环次数，由所有待训练的关联选择的样本来确定，并且选取其中关联选择中选项最多的关联选择组中选项的个数来确定，即Max(N⁽¹⁾ _Options， N⁽²⁾ _Options， N⁽³⁾ _Options，…， N⁽ⁿ⁾ _Options)，其他的样本中若长度不能达到最大的值，其余的内容补零进行填充。

作为本发明进一步的方案：在步骤S7中，对获取到的样本数据进行训练，获取目标关联选项组，将所有的关联选项组以行的形式组织成样本矩阵，该样本矩阵的行数为关联选项组的个数，列为选项字典的个数，代入到已经定义好的循环神经网络中，并选取合适的激活函数和损失函数，通过计算得到相应的权值矩阵，最终得到符合预期的网络。

作为本发明进一步的方案：在步骤S8中，利用训练后的循环神经网络进行预测，并根据概率由高到低给出用户所需的选项及值。

与现有技术相比，本发明的有益效果是：该将循环神经网络应用在关联选择问题上的方法，通过基于循环神经网络的方式来处理关联问题，可以避免预先有人工定义的方式来设定关联问题的规则，并且根据用户每次关联选择内容的不同，不断对循环神经网络中的内容进行更新，最终达到最好的效果，大幅度提高了企业的标准化。

附图说明

图1为本发明的实现示意图。

图2为本发明中选项向量化示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1～2，本发明实施例中，一种将循环神经网络应用在关联选择问题上的方法，包括以下步骤：

S1，预处理选项及值；

S2，创建预处理后的选项及值字典；

S3，创建选项值的数值映射；

S4，确定循环神经网络输入层及输出层的个数；

S5，确定样本中的初始及结束标示；

S6，确定循环神经网络循环的次数；

S7，对相关的样本进行训练；

S8，对相关内容进行预测。

在步骤S1中，重定义选项与其值之间的关系。将选项与其值之间组合成一个整体内容，比如x=value1，将其重定义为x.value1的方式。

在步骤S2中，根据预处理后的选项及值的内容，对于每一个独立的值进行抽取，并将其放入选项及值字典中。

在步骤S3中，根据选项及值的字典，创建每一个子的特征映射，此处将特征映射的内容定义为一个N维向量；其中，N维向量的维度由选项字典中的大小决定。

在步骤S4中，依据创建的选项及值的数值映射，创建神经网络的输入层及输出层的神经元个数，此处采用的输入及输出的神经元个数与进行数值映射后的向量的维度相同，即输入、输出的神经元个数都是N个。

在步骤S5中，由于每一个用户的输入都是有限个要素的累积，因此在对于最后一个选项预测后，需要给出结束标示，以表示该关联问题的预测结束；并且在用户没有输入之前，也应该给出在没有任何要素输入之前，哪些选项的哪些值是待选的，因此需要给每一组待训练的关联选择的样本都给出初始及结束标示。

在步骤S6中，循环神经网络亦成为递归神经网络，实际上其是有多个神经网络组合而成，只是由于其网络结构相同，并且下个神经网络需要与前一个神经网络之间建立关联，因此将其通过递归组合在一起。对于循环神经网络来说（亦称递归神经网络），其需要循环（递归）的次数是由需要多少个神经网络组成来决定。确定循环（递归）次数，由所有待训练的关联选择的样本来确定，并且选取其中关联选择中选项最多的关联选择组中选项的个数来确定，即Max(N⁽¹⁾ _Options， N⁽²⁾ _Options， N⁽³⁾ _Options，…， N⁽ⁿ⁾ _Options)，其他的样本中如果长度不能达到最大的值，其余的内容补零进行填充。

在步骤S7中，对获取到的样本数据进行训练。获取目标关联选项组，将所有的关联选项组以行的形式组织成样本矩阵（该样本矩阵的行数为关联选项组的个数，列为选项字典的个数），代入到已经定义好的循环神经网络中，并选取合适的激活函数（如Tanh，Sigmoid，ReLu等）和损失函数（如交叉熵等），通过计算（BP神经网络等），得到相应的权值矩阵，最终得到符合预期的网络。

在步骤S8中，利用训练后的循环神经网络进行预测。循环神经网络训练结束后，用户再进行关联选项的选择后，就会依据已经训练后的循环神经网络预测下一个选项及值出现的概率，并根据概率由高到低给出用户所需的选项及值。

该将循环神经网络应用在关联选择问题上的方法，通过基于循环神经网络的方式来处理关联问题，可以避免预先有人工定义的方式来设定关联问题的规则，并且根据用户每次关联选择内容的不同，不断对循环神经网络中的内容进行更新，最终达到最好的效果，大幅度提高了企业的标准化。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种将循环神经网络应用在关联选择问题上的方法，其特征在于，包括以下步骤：

S1，预处理选项及值，将选项与其值之间组合成一个整体内容；

S2，创建预处理后的选项及值字典，根据预处理后的选项及值的内容，对于每一个独立的值进行抽取，并将其放入选项及值字典中；

S3，创建选项值的数值映射，根据选项及值的字典，创建每一个值的特征映射，并将特征映射的内容定义为一个N维向量；其中，N维向量的维度由选项字典中的大小决定；

S4，确定循环神经网络输入层及输出层的个数；

S5，确定样本中的初始及结束标示；

S6，确定循环神经网络循环的次数；

S7，对相关的样本进行训练；

S8，对相关内容进行预测；

在步骤S4中，依据创建的选项及值的数值映射，创建神经网络的输入层及输出层的神经元个数，此处采用的输入及输出的神经元个数与进行数值映射后的向量的维度相同，即输入、输出的神经元个数都是N个；

在步骤S5中，对每一组待训练的关联选择的样本都给出初始及结束标示；

在步骤S6中，确定循环次数，由所有待训练的关联选择的样本来确定，并且选取其中关联选择中选项最多的关联选择组中选项的个数来确定，即Max(N(1)Options， N(2)Options， N(3)Options，…， N(n)Options)，其他的样本中若长度不能达到最大的值，其余的内容补零进行填充；

在步骤S7中，对获取到的样本数据进行训练，获取目标关联选项组，将所有的关联选项组以行的形式组织成样本矩阵，该样本矩阵的行数为关联选项组的个数，列为选项字典的个数，代入到已经定义好的循环神经网络中，并选取合适的激活函数和损失函数，通过计算得到相应的权值矩阵，最终得到符合预期的网络；

在步骤S8中，利用训练后的循环神经网络进行预测，并根据概率由高到低给出用户所需的选项及值。