CN108228910B - 一种将循环神经网络应用在关联选择问题上的方法 - Google Patents

一种将循环神经网络应用在关联选择问题上的方法 Download PDF

Info

Publication number
CN108228910B
CN108228910B CN201810133342.9A CN201810133342A CN108228910B CN 108228910 B CN108228910 B CN 108228910B CN 201810133342 A CN201810133342 A CN 201810133342A CN 108228910 B CN108228910 B CN 108228910B
Authority
CN
China
Prior art keywords
neural network
options
option
association
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810133342.9A
Other languages
English (en)
Other versions
CN108228910A (zh
Inventor
马佳
高伟
邓森洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Akex Jiaxing Information Technology Co ltd
Original Assignee
Akex Jiaxing Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Akex Jiaxing Information Technology Co ltd filed Critical Akex Jiaxing Information Technology Co ltd
Priority to CN201810133342.9A priority Critical patent/CN108228910B/zh
Publication of CN108228910A publication Critical patent/CN108228910A/zh
Application granted granted Critical
Publication of CN108228910B publication Critical patent/CN108228910B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种将循环神经网络应用在关联选择问题上的方法,包括以下步骤:预处理选项及值;创建预处理后的选项及值字典;创建选项值的数值映射;确定循环神经网络输入层及输出层的个数;确定样本中的初始及结束标示;确定循环神经网络循环的次数;对相关的样本进行训练;对相关内容进行预测。本发明通过基于循环神经网络的方式来处理关联问题,可以避免预先有人工定义的方式来设定关联问题的规则,并且根据用户每次关联选择内容的不同,不断对循环神经网络中的内容进行更新,最终达到最好的效果,大幅度提高了企业的标准化。

Description

一种将循环神经网络应用在关联选择问题上的方法
技术领域
本发明涉及人工智能、机器学习领域,具体是一种将循环神经网络应用在关联选择问题上的方法。
背景技术
当前,在用户需求多变的背景下,定制化思想深入到各行各业,而如何快速,并有效的提高用户需求的录入体验是非常重要的内容。
在各种用户需求交互的场景中,为了提高用户的录入体验,经常会提供关联选择的内容。关联选择主要是通过确定了X的内容后,Y的内容依据X选定的内容而变化,因Y的内容依赖X,甚至依赖X和其他内容确定后(比如X、A、B内容确定后),Y的内容会随之变化。为了要达到关联选择的要求,传统的做法,需要预先定义关联的内容规则,比如定义X=x.value1时Y=y.value1或Y=y.value2或Y=y.value3,则用户在X中选择了x.value1时,Y就会根据规则自动的确定y.value1/y.value2/y.value3。通过传统方式,需要在使用之前,投入精力创建大量的预先定义的内容。
由于关联问题的情况,涉及到时序性的问题,其符合循环神经网络应用的特点,因此此处考虑采用循环神经网络的方式来处理关联问题。为此,本领域技术人员提出了一种将循环神经网络应用在关联选择问题上的方法,以解决上述背景技术中提出的问题。
发明内容
本发明的目的在于提供一种将循环神经网络应用在关联选择问题上的方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种将循环神经网络应用在关联选择问题上的方法,包括以下步骤:
S1,预处理选项及值;
S2,创建预处理后的选项及值字典;
S3,创建选项值的数值映射;
S4,确定循环神经网络输入层及输出层的个数;
S5,确定样本中的初始及结束标示;
S6,确定循环神经网络循环的次数;
S7,对相关的样本进行训练;
S8,对相关内容进行预测。
作为本发明进一步的方案:在步骤S1中,将选项与其值之间组合成一个整体内容。
作为本发明进一步的方案:在步骤S2中,根据预处理后的选项及值的内容,对于每一个独立的值进行抽取,并将其放入选项及值字典中。
作为本发明进一步的方案:在步骤S3中,根据选项及值的字典,创建每一个值的特征映射,并将特征映射的内容定义为一个N维向量;其中,N维向量的维度由选项字典中的大小决定。
作为本发明进一步的方案:在步骤S4中,依据创建的选项及值的数值映射,创建神经网络的输入层及输出层的神经元个数,此处采用的输入及输出的神经元个数与进行数值映射后的向量的维度相同,即输入、输出的神经元个数都是N个。
作为本发明进一步的方案:在步骤S5中,对每一组待训练的关联选择的样本都给出初始及结束标示。
作为本发明进一步的方案:在步骤S6中,确定循环次数,由所有待训练的关联选择的样本来确定,并且选取其中关联选择中选项最多的关联选择组中选项的个数来确定,即Max(N(1) Options, N(2) Options, N(3) Options,…, N(n) Options),其他的样本中若长度不能达到最大的值,其余的内容补零进行填充。
作为本发明进一步的方案:在步骤S7中,对获取到的样本数据进行训练,获取目标关联选项组,将所有的关联选项组以行的形式组织成样本矩阵,该样本矩阵的行数为关联选项组的个数,列为选项字典的个数,代入到已经定义好的循环神经网络中,并选取合适的激活函数和损失函数,通过计算得到相应的权值矩阵,最终得到符合预期的网络。
作为本发明进一步的方案:在步骤S8中,利用训练后的循环神经网络进行预测,并根据概率由高到低给出用户所需的选项及值。
与现有技术相比,本发明的有益效果是:该将循环神经网络应用在关联选择问题上的方法,通过基于循环神经网络的方式来处理关联问题,可以避免预先有人工定义的方式来设定关联问题的规则,并且根据用户每次关联选择内容的不同,不断对循环神经网络中的内容进行更新,最终达到最好的效果,大幅度提高了企业的标准化。
附图说明
图1为本发明的实现示意图。
图2为本发明中选项向量化示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1~2,本发明实施例中,一种将循环神经网络应用在关联选择问题上的方法,包括以下步骤:
S1,预处理选项及值;
S2,创建预处理后的选项及值字典;
S3,创建选项值的数值映射;
S4,确定循环神经网络输入层及输出层的个数;
S5,确定样本中的初始及结束标示;
S6,确定循环神经网络循环的次数;
S7,对相关的样本进行训练;
S8,对相关内容进行预测。
在步骤S1中,重定义选项与其值之间的关系。将选项与其值之间组合成一个整体内容,比如x=value1,将其重定义为x.value1的方式。
在步骤S2中,根据预处理后的选项及值的内容,对于每一个独立的值进行抽取,并将其放入选项及值字典中。
在步骤S3中,根据选项及值的字典,创建每一个子的特征映射,此处将特征映射的内容定义为一个N维向量;其中,N维向量的维度由选项字典中的大小决定。
在步骤S4中,依据创建的选项及值的数值映射,创建神经网络的输入层及输出层的神经元个数,此处采用的输入及输出的神经元个数与进行数值映射后的向量的维度相同,即输入、输出的神经元个数都是N个。
在步骤S5中,由于每一个用户的输入都是有限个要素的累积,因此在对于最后一个选项预测后,需要给出结束标示,以表示该关联问题的预测结束;并且在用户没有输入之前,也应该给出在没有任何要素输入之前,哪些选项的哪些值是待选的,因此需要给每一组待训练的关联选择的样本都给出初始及结束标示。
在步骤S6中,循环神经网络亦成为递归神经网络,实际上其是有多个神经网络组合而成,只是由于其网络结构相同,并且下个神经网络需要与前一个神经网络之间建立关联,因此将其通过递归组合在一起。对于循环神经网络来说(亦称递归神经网络),其需要循环(递归)的次数是由需要多少个神经网络组成来决定。确定循环(递归)次数,由所有待训练的关联选择的样本来确定,并且选取其中关联选择中选项最多的关联选择组中选项的个数来确定,即Max(N(1) Options, N(2) Options, N(3) Options,…, N(n) Options),其他的样本中如果长度不能达到最大的值,其余的内容补零进行填充。
在步骤S7中,对获取到的样本数据进行训练。获取目标关联选项组,将所有的关联选项组以行的形式组织成样本矩阵(该样本矩阵的行数为关联选项组的个数,列为选项字典的个数),代入到已经定义好的循环神经网络中,并选取合适的激活函数(如Tanh,Sigmoid,ReLu等)和损失函数(如交叉熵等),通过计算(BP神经网络等),得到相应的权值矩阵,最终得到符合预期的网络。
在步骤S8中,利用训练后的循环神经网络进行预测。循环神经网络训练结束后,用户再进行关联选项的选择后,就会依据已经训练后的循环神经网络预测下一个选项及值出现的概率,并根据概率由高到低给出用户所需的选项及值。
该将循环神经网络应用在关联选择问题上的方法,通过基于循环神经网络的方式来处理关联问题,可以避免预先有人工定义的方式来设定关联问题的规则,并且根据用户每次关联选择内容的不同,不断对循环神经网络中的内容进行更新,最终达到最好的效果,大幅度提高了企业的标准化。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (1)

1.一种将循环神经网络应用在关联选择问题上的方法,其特征在于,包括以下步骤:
S1,预处理选项及值,将选项与其值之间组合成一个整体内容;
S2,创建预处理后的选项及值字典,根据预处理后的选项及值的内容,对于每一个独立的值进行抽取,并将其放入选项及值字典中;
S3,创建选项值的数值映射,根据选项及值的字典,创建每一个值的特征映射,并将特征映射的内容定义为一个N维向量;其中,N维向量的维度由选项字典中的大小决定;
S4,确定循环神经网络输入层及输出层的个数;
S5,确定样本中的初始及结束标示;
S6,确定循环神经网络循环的次数;
S7,对相关的样本进行训练;
S8,对相关内容进行预测;
在步骤S4中,依据创建的选项及值的数值映射,创建神经网络的输入层及输出层的神经元个数,此处采用的输入及输出的神经元个数与进行数值映射后的向量的维度相同,即输入、输出的神经元个数都是N个;
在步骤S5中,对每一组待训练的关联选择的样本都给出初始及结束标示;
在步骤S6中,确定循环次数,由所有待训练的关联选择的样本来确定,并且选取其中关联选择中选项最多的关联选择组中选项的个数来确定,即Max(N(1)Options, N(2)Options, N(3)Options,…, N(n)Options),其他的样本中若长度不能达到最大的值,其余的内容补零进行填充;
在步骤S7中,对获取到的样本数据进行训练,获取目标关联选项组,将所有的关联选项组以行的形式组织成样本矩阵,该样本矩阵的行数为关联选项组的个数,列为选项字典的个数,代入到已经定义好的循环神经网络中,并选取合适的激活函数和损失函数,通过计算得到相应的权值矩阵,最终得到符合预期的网络;
在步骤S8中,利用训练后的循环神经网络进行预测,并根据概率由高到低给出用户所需的选项及值。
CN201810133342.9A 2018-02-09 2018-02-09 一种将循环神经网络应用在关联选择问题上的方法 Active CN108228910B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810133342.9A CN108228910B (zh) 2018-02-09 2018-02-09 一种将循环神经网络应用在关联选择问题上的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810133342.9A CN108228910B (zh) 2018-02-09 2018-02-09 一种将循环神经网络应用在关联选择问题上的方法

Publications (2)

Publication Number Publication Date
CN108228910A CN108228910A (zh) 2018-06-29
CN108228910B true CN108228910B (zh) 2023-05-12

Family

ID=62661342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810133342.9A Active CN108228910B (zh) 2018-02-09 2018-02-09 一种将循环神经网络应用在关联选择问题上的方法

Country Status (1)

Country Link
CN (1) CN108228910B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239828A (zh) * 2016-03-28 2017-10-10 日本电气株式会社 在神经网络中进行特征选择及构建神经网络的方法和设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006099429A2 (en) * 2005-03-14 2006-09-21 Thaler Stephen L Neural network development and data analysis tool
JP6548358B2 (ja) * 2014-04-04 2019-07-24 タッチタイプ リミテッド マルチ入力ターゲットに関連付けられた1つ又はそれ以上の入力を入力するためのシステム及び方法
CN105528374A (zh) * 2014-10-21 2016-04-27 苏宁云商集团股份有限公司 一种电子商务中的商品推荐方法及其***
CN104572982B (zh) * 2014-12-31 2017-10-31 东软集团股份有限公司 基于问题引导的个性化推荐方法及***
KR20180001889A (ko) * 2016-06-28 2018-01-05 삼성전자주식회사 언어 처리 방법 및 장치
CN106778014B (zh) * 2016-12-29 2020-06-16 浙江大学 一种基于循环神经网络的患病风险预测建模方法
CN107451199B (zh) * 2017-07-05 2020-06-26 阿里巴巴集团控股有限公司 问题推荐方法及装置、设备
CN107608956B (zh) * 2017-09-05 2021-02-19 广东石油化工学院 一种基于cnn-grnn的读者情绪分布预测算法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239828A (zh) * 2016-03-28 2017-10-10 日本电气株式会社 在神经网络中进行特征选择及构建神经网络的方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于知识的模糊神经网络的旋转机械故障诊断;李如强;陈进;伍星;;应用数学和力学(01);全文 *

Also Published As

Publication number Publication date
CN108228910A (zh) 2018-06-29

Similar Documents

Publication Publication Date Title
CN110969250B (zh) 一种神经网络训练方法及装置
KR20210032140A (ko) 뉴럴 네트워크에 대한 프루닝을 수행하는 방법 및 장치
CN112037179B (zh) 一种脑疾病诊断模型的生成方法、***及设备
CN109934330A (zh) 基于多样化种群的果蝇优化算法来构建预测模型的方法
US20180157976A1 (en) Device and method for determining convolutional neural network model
CN110222329A (zh) 一种基于深度学习的中文分词方法和装置
CN109446414A (zh) 一种基于神经网络分类的软件信息站点快速标签推荐方法
CN109271513B (zh) 一种文本分类方法、计算机可读储存介质及***
CN112508190A (zh) 结构化稀疏参数的处理方法、装置、设备及存储介质
CN113128478A (zh) 模型训练方法、行人分析方法、装置、设备及存储介质
CN111210017B (zh) 确定布局顺序及数据处理的方法、装置、设备及存储介质
CN108230121B (zh) 一种基于循环神经网络的产品设计方法
CN112287965A (zh) 图像质量检测模型训练方法、装置和计算机设备
CN111260056B (zh) 一种网络模型蒸馏方法及装置
CN114137967B (zh) 基于多网络联合学习的驾驶行为决策方法
CN108363685A (zh) 基于递归变分自编码模型的自媒体数据文本表示方法
CN109783769B (zh) 一种基于用户项目评分的矩阵分解方法和装置
CN114490618A (zh) 基于蚁狮算法的数据填补方法、装置、设备及存储介质
CN110489131B (zh) 一种灰度用户选取方法及装置
CN104090932B (zh) 一种内容推荐方法及装置
CN111078891B (zh) 一种基于粒子群算法的医学特征识别方法及装置
CN108228910B (zh) 一种将循环神经网络应用在关联选择问题上的方法
CN110826695B (zh) 数据处理方法、装置和计算机可读存储介质
CN111783688A (zh) 一种基于卷积神经网络的遥感图像场景分类方法
CN110866403B (zh) 基于卷积循环实体网络的端对端对话状态跟踪方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant