CN115392461A - 植物布局模型的建立方法、获取方法、***及存储介质 - Google Patents

植物布局模型的建立方法、获取方法、***及存储介质 Download PDF

Info

Publication number
CN115392461A
CN115392461A CN202210954659.5A CN202210954659A CN115392461A CN 115392461 A CN115392461 A CN 115392461A CN 202210954659 A CN202210954659 A CN 202210954659A CN 115392461 A CN115392461 A CN 115392461A
Authority
CN
China
Prior art keywords
sequence
model
plant layout
plant
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210954659.5A
Other languages
English (en)
Inventor
钟海鸿
赖扬东
刘建杰
张京玲
侯飞龙
王天雷
谭蔚婷
吴宛蔓
陈景志
吴建生
林汝生
林颖怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuyi University
Original Assignee
Wuyi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuyi University filed Critical Wuyi University
Priority to CN202210954659.5A priority Critical patent/CN115392461A/zh
Publication of CN115392461A publication Critical patent/CN115392461A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种植物布局模型的建立方法、获取方法、***及存储介质,涉及植物布局自然语言处理领域,方法包括:获取种植植物的环境需求数据和带有专业植物种植知识的数据源;通过BiLSTM‑CRF模型和注意力机制对数据源进行实体标注处理,得到规范化的第一被标记序列;对第一被标记序列进行实体消歧,得到第二被标记序列;对第二被标记序列进行知识推理,得到知识图谱;根据环境需求数据和知识图谱,得到植物布局算法模型。通过这种设置得到的植物布局算法模型,提高了实体前后文的关联性,进而提高了植物布局图像的构建效率及准确率。

Description

植物布局模型的建立方法、获取方法、***及存储介质
技术领域
本发明涉及植物布局自然语言处理领域,尤其涉及一种植物布局模型的建立方法、获取方法、***及存储介质。
背景技术
阳台农业是近年来发展起来的一种新型农业种植形式,发展前景广阔。作为城市中随处可见的小块土地资源,阳台可用于种植植物,还可以起到减少空气污染的作用。随着现代智能控制技术的广泛应用,更是让阳台农业的自动化管理成为现实。
相关技术中提供了一种植物布局***,用户可通过人机交互界面,根据自身的需求输入所要种植植物的相关数据即可得到植物布局图像。但是,这种植物布局***中的实体之间的联系性差,使得实体前后文关联弱,降低了植物布局***所形成的植物布局图的准确性。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种植物布局模型的建立方法、获取方法、***及存储介质,提高了实体前后文的关联性,进而提高了植物布局图像的构建效率及准确率。
第一方面,本发明实施例提供了一种植物布局模型的建立方法,包括:
获取种植植物的环境需求数据和带有专业植物种植知识的数据源;
通过BiLSTM-CRF模型和注意力机制对所述数据源进行实体标注处理,得到规范化的第一被标记序列;
对所述第一被标记序列进行实体消歧,得到第二被标记序列;
对所述第二被标记序列进行知识推理,得到知识图谱;
根据所述环境需求数据和所述知识图谱,得到植物布局算法模型。
根据本发明实施例中提供的一个或多个技术方案,至少具有如下有益效果:获取种植植物的环境需求数据和带有专业植物种植知识的数据源,根据BiLSTM-CRF模型和注意力机制对数据源进行实体抽取和实体标注处理以得到规范化的第一被标记序列,再对标记序列进行实体消歧,得到具有新的实体关系的第二被标记序列;对第二被标记序列进行知识推理,得到知识图谱;将根据所述环境需求数据和所述知识图谱,得到植物布局算法模型。通过这种设置,将BiLSTM-CRF模型和注意力机制相结合再对带有专业植物种植知识的数据源进行实体标注处理后得到的植物布局算法模型,提高了实体前后文的关联性,进而提高了植物布局图像的构建效率及准确率。
根据本发明第一方面的一些实施例,所述BiLSTM-CRF模型包括BiLSTM模型和条件随机场模型,所述通过BiLSTM-CRF模型和注意力机制对所述数据源进行实体标注处理,得到规范化的第一被标记序列,包括:
根据所述BiLSTM模型和注意力机制,得到联合特征向量序列;
将所述联合特征向量序列作为所述条件随机场模型的输入,以使所述条件随机场模型对所述数据源进行实体标注处理,得到规范化的第一被标记序列。
根据本发明第一方面的一些实施例,所述根据所述BiLSTM模型和注意力机制,得到联合特征向量序列,包括:
根据所述BiLSTM模型,得到所述数据源对应的全局特征向量;
将所述全局特征向量作为注意力机制的输入,得到局部特征向量;
将所述全局特征向量与所述局部特征向量相结合,得到联合特征向量序列。
根据本发明第一方面的一些实施例,所述对所述第一被标记序列进行实体消歧,得到第二被标记序列,包括:
从所述第一被标记序列确定至少一个歧义实体集;
通过聚合层次聚类算法对所述歧义实体集进行聚类处理;
根据所述聚类处理的结果和所述第一被标记序列,得到第二被标记序列。
根据本发明第一方面的一些实施例,所述对所述第二被标记序列进行知识推理,得到知识图谱,包括:
通过神经张量网络模型对所述第二被标记序列进行知识推理,得到知识图谱。
根据本发明第一方面的一些实施例,所述环境需求数据包括光照度数据、温度数据及湿度数据。
第二方面,本发明实施例还提供了一种植物布局的获取方法,包括:
获取光照分布图像、与用户的植物种植需求相对应的植物数据集;
根据所述光照分布图像,将所述植物数据集输入到所述植物布局算法模型中,得到植物布局图像。
根据本发明第二方面的一些实施例,获取多传感器收集的光照数据、与用户种植植物相对应的环境分布结构;
根据所述环境分布结构和所述光照数据,得到所述光照分布图像。
根据本发明第三方面实施例的植物布局***,其包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现:
如上述第一方面所述的植物布局模型的建立方法;
或者,
如上述第二方面所述的植物布局的获取方法。
根据本发明第四方面实施例的计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于:
执行上述第一方面所述的植物布局模型的建立方法;
或者,
执行上述第二方面所述的植物布局的获取方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,并不构成对发明技术方案的限制。
图1是本发明一个实施例提供的植物布局模型的建立方法的流程示意图;
图2是本发明另一实施例提供的植物布局模型的建立方法的流程示意图;
图3是本发明实施例提供的BILSTM-CRF模型的结构示意图;
图4是本发明实施例提供的获取第一被标记序列的流程示意图;
图5是本发明实施例提供的LSTM模型的结构示意图;
图6是本发明实施例提供的Attention-BiLSTM模型的结构示意图;
图7是本发明实施例提供的获取联合特征向量序列的流程示意图;
图8是本发明实施例提供的获取第二被标记序列的流程示意图;
图9是本发明实施例提供的获取知识图谱的流程示意图;
图10是本发明实施例提供的获取植物布局图像的流程示意图;
图11是本发明实施例提供的获取光照分布图像的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和现实知识及他们之间的相互联系,利用知识图谱可以有效的推测出用户输入值所需的结果。
阳台农业是近年来发展起来的一种新型农业种植形式,发展前景广阔。作为城市中随处可见的小块土地资源,阳台可用于种植植物,还可以起到减少空气污染的作用。随着现代智能控制技术的广泛应用,更是让阳台农业的自动化管理成为现实。
相关技术中提供了一种植物布局***,用户可通过人机交互界面,根据自身的需求输入所要种植植物的相关数据即可得到植物布局图像。但是,这种植物布局***中的实体之间的联系性差,使得实体前后文关联弱,降低了植物布局***所形成的植物布局图的准确性。
基于上述情况,本发明实施例提供了一种植物布局模型的建立方法、获取方法、***及存储介质,提高了实体前后文的关联性,进而提高了植物布局图像的构建效率及准确率。
下面结合附图,对本发明实施例作进一步阐述。
本发明第一方面实施例具体提供一种植物布局模型的建立方法,如图1所示。植物布局模型的建立方法包括但不限于以下步骤:
步骤S100,获取种植植物的环境需求数据和带有专业植物种植知识的数据源;
需要说明的是,带有专业植物种植知识为实体专业知识,种植植物的环境需求数据为影响植物生长的各因素的多源异构数据。
步骤S200,通过BiLSTM-CRF模型和注意力机制对数据源进行实体标注处理,得到规范化的第一被标记序列;
需要说明的是,BiLSTM是Bi-directional Long Short-Term Memory的缩写,译为双向长短期记忆网络;CRF是Conditional Random Field的缩写,译为条件随机场;LSTM是Long Short Term Memory的缩写,译为长短期记忆网络;注意力机制也叫Attention机制。
需要说明的是,进行实体标注处理,需要对数据源进行实体抽取和实体关系抽取,通过实体抽取和实体关系抽取对专业植物种植知识文本打标签。实体抽取过程需要先对文本进行按照字词的方式分词,由Word2Vec训练得到词向量,通过BiLSTM层输出具有更深层语义的向量,最终由CRF层对输出向量进行分类标注。
具体地,参照图3,BiLSTM-CRF模型具有文字嵌入层即Word embeddings层、BILSTM层和CRF层,其中,文字嵌入层为:使用谷歌开源工具Word2vec模型对输入文本进行训练,将文本中的每一个字映射到低维稠密的字向量中,作为BiLSTM层的输入。BILSTM层为:在LSTM的基础上采用两个相反方向的并行层:前向层和后向层,分别从序列的前端和后端开始运行,以经过Word Embeddings层的文本序列x1,x2,x3…,xn作为BiLSTM层的输入,将LSTM输出的正向序列
Figure BDA0003790801700000051
和反向序列
Figure BDA0003790801700000052
进行拼接,对上下文进行标记,得到全局特征,作为BILSTM网络的输出。示例性的,输出的拼接序列为:
Figure BDA0003790801700000053
其中,ht表示下标为t的序列值,;表示拼接符号。CRF层为:对于双向LSTM输出的拼接序列中每个单词进行标签预测,为BiLSTM模型提供标签约束关系,减少BiLSTM模型标签标记错误实体的情况。给定文本S的表达式:
S=(x1,x2,x3…,xn),
其中,x1,x2,x3…,xn表示经过Word Embeddings层的文本序列,S表示文本,CRF层预测标签序列的表达式为:
y=(y1,y2,y3…yn),
其中,y及y1,y2,y3…yn表示预测标签序列,定义CRF层将文本S分类到标签y的值的计算公式如下:
Figure BDA0003790801700000061
其中,T表示转移得分矩阵,Ti,j表示从标签i到标签j的转移得分,y0与yn+1是新增的句子起始标签和终止标签,T的维度为(k+2)*(k+2);E是BiLSTM层的输出得分矩阵,其维度为n*k,其中k表示不同标签的数量,Ei,j表示句子中第i个词的第j个标签的得分。在预测句子的所有可能的标签序列,采用柔性最大值(softmax)得到序列y的概率。序列y的概率的计算公式如下:
Figure BDA0003790801700000062
在训练过程中,得到最大化正确标签序列的对数概率公式如下:
Figure BDA0003790801700000063
其中,YS表示句子S所有可能的标签序列。从对数概率公式可以看出,该模型生成概率最大的标签序列。解码时,获取最高得分的标签序列作为最终预测的输出序列,最终预测的输出序列的计算公式如下:
Figure BDA0003790801700000064
其中,
Figure BDA0003790801700000065
argmax()表示选取最大值的函数。
需要说明的是,BiLSTM-CRF模型和注意力机制相结合以对数据源进行实体关系抽取,提高了实体前后文的关联性和BiLSTM-CRF模型的效果,进而提高了植物布局图像的构建效率及准确率。
步骤S300,对第一被标记序列进行实体消歧,得到第二被标记序列;
需要说明的是,通过BiLSTM-CRF模型和注意力机制得到第一被标记序列也即被标记实体后,第一被标记序列中的实体之间的关系往往存在歧义,其中,歧义指一个实体指称项往往会对应多个真实实体,因此需要对这些实体指称项进行实体消歧,得到一种具有新的实体关系即第一实体关系的第二被标记序列。
步骤S400,对第二被标记序列进行知识推理,得到知识图谱;
需要说明的是,在知识图谱的构建过程中对第二被标记序列进行知识推理,可以完善知识图谱,增加之前实体可能存在的但没有训练出来的语义关系,且结合已有知识图谱推测新的知识扩充知识图谱,可以有效对知识进行深度推理和知识整合,加速知识图谱的构建过程,提高数据准确性。
步骤S500,根据环境需求数据和知识图谱,得到植物布局算法模型。
需要说明的是,在知识图谱中融入种植植物的环境需求数据,可以增强数据的组织和关联性,方便存储管理海量数据,并据此形成植物布局算法模型。
本发明实施例包括:获取种植植物的环境需求数据和带有专业植物种植知识的数据源,根据BiLSTM-CRF模型和注意力机制对数据源进行实体抽取和实体标注处理以得到规范化的第一被标记序列,再对标记序列进行实体消歧,得到具有新的实体关系的第二被标记序列;对第二被标记序列进行知识推理,得到知识图谱;将根据所述环境需求数据和所述知识图谱,得到植物布局算法模型。通过这种设置,将BiLSTM-CRF模型和注意力机制相结合再对带有专业植物种植知识的数据源进行实体和实体关系抽取后得到的植物布局算法模型,提高了实体前后文的关联性,进而提高了植物布局图像的构建效率及准确率。
参照图4至图6,可以理解的是,BiLSTM-CRF模型包括BiLSTM模型和条件随机场模型,步骤S200,包括但不限于以下步骤:
步骤S210,根据BiLSTM模型和注意力机制,得到联合特征向量序列;
步骤S220,将联合特征向量序列作为条件随机场模型的输入,以使条件随机场模型对数据源进行实体标注处理,得到规范化的第一被标记序列。
需要说明的是,LSTM单元主要分为输入门、遗忘门和输出门三层,输入门控制着输入新信息按比例保存到细胞状态中,遗忘门控制着细胞状态所保留的历史信息,输出门决定最终的输出信息,实现流程如图5所示。其中,输入门用于对输入信息xt和输出信号ht-1中的信息进行选择性的保存,计算公式为:it=σ(Wi·[ht-1,xt]+bi),
Figure BDA0003790801700000081
遗忘门用于决定细胞状态Ct-1中需要遗忘的信息,计算公式为:ft=σ(Wf·[ht-1,xt]+bf),结合t-1时刻遗忘门的输出信息和t时刻输入门的输入信息作为新细胞状态,计算公式为:
Figure BDA0003790801700000082
输出门用于将t-1时刻传递过来的经过遗忘门和输入门后的细胞状态Ct-1,与t-1时刻的输出信号ht-1和t时刻的输入信号xt整合到一起作为当前时刻的输出信号,计算公式为:ot=σ(Wo·[ht-1,xt]+bo),ht=ot*tanh(Ct)。针对上述计算公式,其中,it、ft、ot分别表示t时刻的输入门、遗忘门和输出门,σ表示Sigmoid激活函数,W和b表示相对应的权重矩阵和偏置向量,ht表示t时刻的隐藏状态,Ct表示t时刻的细胞状态,Ct-1表示t-1时刻的细胞状态,ht-1表示t-1时刻隐藏状态,
Figure BDA0003790801700000083
表示输入门经过一个tanh层后得到的候选状态。BiLSTM模型是由前向LSTM与后向LSTM组合而成。
参照图6至图7,可以理解的是,步骤S210,包括但不限于以下步骤:
步骤S211,根据BiLSTM模型,得到数据源对应的全局特征向量;
步骤S212,将全局特征向量作为注意力机制的输入,得到局部特征向量;
步骤S213,将全局特征向量与局部特征向量相结合,得到联合特征向量序列。
具体地,将BiLSTM-CRF模型中BiLSTM层的输出向量也即全局特征向量作为注意力机制层的输入,在注意力机制层会计算每一个时序的权重向量,将BiLSTM层的输出序列与该权重向量相乘,以使每一次迭代后的词汇级特征合并为句子级特征,得到局部特征向量,并将局部特征向量和BiLTSM层输出的全局特征进行结合生成联合特征向量序列,将联合特征向量序列作为CRF层的输入以使CRF层对数据源进行实体标注处理,得到规范化的第一被标记序列。
需要说明的是,参照图6,定义x1,x2,x3…,xT为BiLSTM层输入的字向量和字符表示联合向量序列,T表示序列长度;atj表示二者的注意力权重组成向量,注意力权重组成向量的计算公式如下:
Figure BDA0003790801700000084
其中,etj表示注意力相关系数,注意力相关系数的计算公式如下:
Figure BDA0003790801700000091
其中,va表示全局向量的权值,hj表示BiLSTM网络中的输出向量,ua表示前一时刻向量的权重,ct-1表示注意力机制的前一时刻的向量,wa表示注意力机制前一时刻的权重。由注意力权重组成向量与BiLSTM模型的输出进行加权求和作为注意力机制的输出,加权求和的计算公式如下:
Figure BDA0003790801700000092
其中,ct表示注意力机制的输出,atj表示二者的注意力权重组成向量,hj表示BiLSTM网络中的输出向量,T表示序列长度。由注意力机制得到局部特征向量,与由BiLSTM得到全局特征向量结合形成联合特征向量序列并作为CRF层的输入。
参照图8,可以理解的是,步骤S300,包括但不限于以下步骤:
步骤S310,从第一被标记序列确定至少一个歧义实体集;
步骤S320,通过聚合层次聚类算法对歧义实体集进行聚类处理;
步骤S330,根据聚类处理的结果和第一被标记序列,得到第二被标记序列。
需要说明的是,聚合层次聚类算法可以对第一被标记序列中的实体指称项进行消歧,将指向同一个目标实体的指称项聚类到同一类别下,之后将其映射到一个已知的无歧义的结构化知识图谱中,具体为:首先,将第一被标记序列中的被标记的每一个实体当作一个单独的类,每次迭代找出距离聚合中心最近的两个类进行合并得到一个新类,使用聚合层次聚类算法根据特征的重要性对特征排序,选出聚类质量最好的的特征子集,每个特征使用熵计算公式,计算公式如下:
Figure BDA0003790801700000093
其中,Sij表示两点i和j之间的相似度,是基于特征被删除后这两点之间的距离disti,j计算的,计算公式如下:
Figure BDA0003790801700000094
Figure BDA0003790801700000095
其中,dist表示去除特征t后所有点的平均距离,在计算所有特征熵后,通过计算聚类质量确定最佳特征子集,基于多重分析中的散列矩阵,采用散射准则衡量聚类质量。类内散射和类间散射的计算公式如下:
Figure BDA0003790801700000101
Figure BDA0003790801700000102
其中,PW表示类内散射,pB表示类间散射,m表示总平均向量,mj表示聚类j的平均向量。最后,轮询重复上述步骤,层层递归凝聚,直到只有一个包含所有实体的簇类为止,也即形成具有新的实体关系的第二被标记序列为止。
参照图9,可以理解的是,步骤S400,包括但不限于以下步骤:
步骤S410,通过神经张量网络模型对第二被标记序列进行知识推理,得到知识图谱。
需要说明的是,由于原有知识图谱并不完整,很多事实并未存储在知识图谱中,在知识图谱的构建过程中通过神经张量网络模型对第二被标记序列进行知识推理,能够发现第二被标记序列中的不同实体之间隐含的关系,可以完善知识图谱,增加之前实体可能存在的但没有训练出来的语义关系。神经张量网络模型也叫NTN模型,NTN是Neural TensorNetwork的缩写。
需要说明的是,步骤S400中的通过神经张量网络模型对第二被标记序列进行知识推理包括:通过神经张量网络模型将第二被标记序列中的每一实体表示为向量以获取实体的事实和不同实体之间的特定关系概率;通过神经张量网络的参数定义每一实体关系,将实体关系表示为三阶张量并对两个实体进行关联。
具体地,使用神经张量网络模型,将实体表示为向量来获取实体消息,用参数表示关系,将关系表示为三阶张量,跨多个维度关联两个实体,用于在现有知识库的基础上,推理出新的、尽可能接近事实的知识来扩充知识库,得到知识图谱。通过神经张量网络模型进行知识推理的计算公式如下:
Figure BDA0003790801700000103
其中,f=tanh表示一个标准非线性函数,
Figure BDA0003790801700000104
表示一个张量,
Figure BDA0003790801700000105
表示双线性张量积,其结果为h∈Rk,每个hi代表一个张量切片
Figure BDA0003790801700000106
关系R的其他参数参照标准神经网络:VR∈Rk×2d、U∈Rk、bR∈Rk。函数g(e1,R,e2)得分越高,说明实体e1和e2之间存在关系R的可能性越高。
可以理解的是,环境需求数据包括光照度数据、温度数据及湿度数据。
需要说明的是,需要说明的是,在知识图谱中融入种植植物的环境需求数据也即光照度数据、温度数据及湿度数据等,可以增强数据的组织和关联性,方便存储管理海量数据,并据此形成植物布局算法模型,提高了植物布局图像的构建准确率。
需要说明的是,参照图2,光照度数据为多方位的光照度数据,该光照度数据经过光照分布渲染后,再结合温度数据和湿度数据输入到知识图谱中,从而得到基于知识图谱的植物布局算法模型。
第二方面,本发明实施例还提供了一种植物布局的获取方法,参照图10,方法包括但不限于以下步骤:
步骤S600,获取光照分布图像、与用户的植物种植需求相对应的植物数据集;
步骤S700,根据光照分布图像,将植物数据集输入到植物布局算法模型中,得到植物布局图像。
需要说明的是,植物数据集可以包括植物名称、数量及种类等,也可以包括植物的特性。
具体地,参照图2,依次经过基于BiLSTM-CRF模型和注意力机制的实体标注、基于聚合层次聚类算法的实体消歧和基于神经张量网络模型的知识推理,并将种植植物的环境需求数据输入到知识图谱中,得到基于知识图谱的植物布局算法模型。用户将植物种植需求相对应的植物数据集和环境分布结构输入至人机交互界面,根据环境分布结构和多传感器收集的光照数据,得到光照分布图像,再根据光照分布图像,将植物种植需求输入到植物布局算法模型中,得到各植物种植的最佳植物布局图像。
需要说明的是,本实施例中以专业的植物种植知识作为数据源输入,由BiLSTM-CRF模型结合注意力机制输出规范化的被标记实体也即第一被标记序列,使用聚合层次聚类算法对被标记的实体按类别进行分类,将属于同一类别的实体聚集在一簇以形成具有第一实体关系的第二被标记序列,通过神经张量网络模型对已存在的知识库进行知识推理,获得新的植物种植知识并扩充原有知识图谱形成新的知识图谱,最后用云端对知识图谱进行存储,将所述种植植物的环境需求数据输入至新的知识图谱中,得到植物布局算法模型。
参照图11,可以理解的是,步骤S600中的获取光照分布图像,包括但不限于以下步骤:
步骤S610,获取多传感器收集的光照数据、与用户种植植物相对应的环境分布结构;
步骤S620,根据环境分布结构和光照数据,得到光照分布图像。
在一些实施例中,用户要在阳台种植植物,则需要输入植物数据集和阳台的环境分布结构,根据阳台的环境分布结构和多传感器收集到的光照数据得到光照分布图像,植物布局算法模型根据种植植物的环境需求数据、植物的特性权重及光照分布图像进行相应的排列计算,从而得到各植物最适合种植的位置的布局。在另一些实施例中,也可以在其他环境中进行植物种植,将该环境中的植物数据集和阳台的环境分布结构均通过人机交互界面进行输入,并获取到植物布局图像,本发明实施例在此不作限定。
另外,本发明第三方面实施例还提供了一种植物布局***,该植物布局***包括:存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序。
处理器和存储器可以通过总线或者其他方式连接。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现上述第一方面实施例的植物布局模型的建立方法所需的非暂态软件程序以及指令存储在存储器中,当被处理器执行时,执行上述实施例中的植物布局模型的建立方法,例如,执行以上描述的图1中的方法步骤S100至S500、图4中的方法步骤S210至步骤S220、图7中的方法步骤S211至步骤S213、图8中的方法步骤S310至330、图9中的方法步骤S410。
实现上述第二方面实施例的植物布局的获取方法所需的非暂态软件程序以及指令存储在存储器中,当被处理器执行时,执行上述实施例中的植物布局的获取方法,例如,执行以上描述的图10中的方法步骤S600至步骤S700、图11中的方法步骤S610至步骤S620。
以上所描述的设备实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以落入一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
此外,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个处理器或控制器执行,例如,被上述设备实施例中的一个处理器执行,可使得上述处理器执行上述实施例中的植物布局模型的建立方法或植物布局的获取方法,例如,执行以上描述的图1中的方法步骤S100至S500、图4中的方法步骤S210至步骤S220、图7中的方法步骤S211至步骤S213、图8中的方法步骤S310至330、图9中的方法步骤S410、图10中的方法步骤S600至步骤S700、图11中的方法步骤S610至步骤S620。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、***可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。

Claims (10)

1.一种植物布局模型的建立方法,其特征在于,包括:
获取种植植物的环境需求数据和带有专业植物种植知识的数据源;
通过BiLSTM-CRF模型和注意力机制对所述数据源进行实体标注处理,得到规范化的第一被标记序列;
对所述第一被标记序列进行实体消歧,得到第二被标记序列;
对所述第二被标记序列进行知识推理,得到知识图谱;
根据所述环境需求数据和所述知识图谱,得到植物布局算法模型。
2.根据权利要求1所述的植物布局模型的建立方法,其特征在于,所述BiLSTM-CRF模型包括BiLSTM模型和条件随机场模型,所述通过BiLSTM-CRF模型和注意力机制对所述数据源进行实体标注处理,得到规范化的第一被标记序列,包括:
根据所述BiLSTM模型和注意力机制,得到联合特征向量序列;
将所述联合特征向量序列作为所述条件随机场模型的输入,以使所述条件随机场模型对所述数据源进行实体标注处理,得到规范化的第一被标记序列。
3.根据权利要求2所述的植物布局模型的建立方法,其特征在于,所述根据所述BiLSTM模型和注意力机制,得到联合特征向量序列,包括:
根据所述BiLSTM模型,得到所述数据源对应的全局特征向量;
将所述全局特征向量作为注意力机制的输入,得到局部特征向量;
将所述全局特征向量与所述局部特征向量相结合,得到联合特征向量序列。
4.根据权利要求1所述的植物布局模型的建立方法,其特征在于,所述对所述第一被标记序列进行实体消歧,得到第二被标记序列,包括:
从所述第一被标记序列确定至少一个歧义实体集;
通过聚合层次聚类算法对所述歧义实体集进行聚类处理;
根据所述聚类处理的结果和所述第一被标记序列,得到第二被标记序列。
5.根据权利要求1所述的植物布局模型的建立方法,其特征在于,所述对所述第二被标记序列进行知识推理,得到知识图谱,包括:
通过神经张量网络模型对所述第二被标记序列进行知识推理,得到知识图谱。
6.根据权利要求1所述的植物布局模型的建立方法,其特征在于,所述环境需求数据包括光照度数据、温度数据及湿度数据。
7.一种植物布局的获取方法,其特征在于,包括:
获取光照分布图像、与用户的植物种植需求相对应的植物数据集;
根据所述光照分布图像,将所述植物数据集输入到所述植物布局算法模型中,得到植物布局图像。
8.根据权利要求1所述的植物布局模型的建立方法,其特征在于,所述获取光照分布图像,包括:
获取多传感器收集的光照数据、与用户种植植物相对应的环境分布结构;
根据所述环境分布结构和所述光照数据,得到所述光照分布图像。
9.一种植物布局***,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现:
如权利要求1至6中任一项所述的植物布局模型的建立方法;
或者,
如权利要求7至8中任一项所述的植物布局的获取方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于:
执行如权利要求1至6中任一项所述的植物布局模型的建立方法;
或者,
执行如权利要求7至8中任一项所述的植物布局的获取方法。
CN202210954659.5A 2022-08-10 2022-08-10 植物布局模型的建立方法、获取方法、***及存储介质 Pending CN115392461A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210954659.5A CN115392461A (zh) 2022-08-10 2022-08-10 植物布局模型的建立方法、获取方法、***及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210954659.5A CN115392461A (zh) 2022-08-10 2022-08-10 植物布局模型的建立方法、获取方法、***及存储介质

Publications (1)

Publication Number Publication Date
CN115392461A true CN115392461A (zh) 2022-11-25

Family

ID=84117836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210954659.5A Pending CN115392461A (zh) 2022-08-10 2022-08-10 植物布局模型的建立方法、获取方法、***及存储介质

Country Status (1)

Country Link
CN (1) CN115392461A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116756232A (zh) * 2023-08-17 2023-09-15 杭州比智科技有限公司 一种智能生成动态网络图的数据可视化方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116756232A (zh) * 2023-08-17 2023-09-15 杭州比智科技有限公司 一种智能生成动态网络图的数据可视化方法及***
CN116756232B (zh) * 2023-08-17 2023-11-24 杭州比智科技有限公司 一种智能生成动态网络图的数据可视化方法及***

Similar Documents

Publication Publication Date Title
CN109284406B (zh) 基于差异循环神经网络的意图识别方法
US10949718B2 (en) Multi-modal visual question answering system
CN111444344B (zh) 实体分类方法、装置、计算机设备和存储介质
CN114298158A (zh) 一种基于图文线性组合的多模态预训练方法
CN112819023B (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN112905801B (zh) 基于事件图谱的行程预测方法、***、设备及存储介质
CN112308115B (zh) 一种多标签图像深度学习分类方法及设备
Zhang et al. Scheduled sampling for one-shot learning via matching network
CN108846097B (zh) 用户的兴趣标签表示方法、文章推荐方法、及装置、设备
US20230134531A1 (en) Method and system for rapid retrieval of target images based on artificial intelligence
CN111274790A (zh) 基于句法依存图的篇章级事件嵌入方法及装置
CN112463976A (zh) 一种以群智感知任务为中心的知识图谱构建方法
KR20230171966A (ko) 이미지 프로세싱 방법 및 장치 및 컴퓨터 판독 가능 저장 매체
CN112508177A (zh) 一种网络结构搜索方法、装置、电子设备及存储介质
CN115564027A (zh) 多模态学习行为分析方法、***及存储介质
CN115438160A (zh) 一种基于深度学习的问答方法、装置及电子设备
CN115392461A (zh) 植物布局模型的建立方法、获取方法、***及存储介质
CN113408663B (zh) 融合模型构建方法、融合模型使用方法、装置和电子设备
CN113254602B (zh) 面向科技政策领域的知识图谱构建方法及***
Purwandari et al. Twitter-based classification for integrated source data of weather observations
CN112489689B (zh) 基于多尺度差异对抗的跨数据库语音情感识别方法及装置
CN115797795B (zh) 基于强化学习的遥感影像问答式检索***及方法
Zhang et al. Wild plant data collection system based on distributed location
CN111782898B (zh) 数据源搜索方法、装置和电子设备
CN114898426A (zh) 一种同义标签聚合方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination