CN116049267A - 一种多维智能识别的化学物品搜索显示方法 - Google Patents

一种多维智能识别的化学物品搜索显示方法 Download PDF

Info

Publication number
CN116049267A
CN116049267A CN202211681957.8A CN202211681957A CN116049267A CN 116049267 A CN116049267 A CN 116049267A CN 202211681957 A CN202211681957 A CN 202211681957A CN 116049267 A CN116049267 A CN 116049267A
Authority
CN
China
Prior art keywords
chemical
user
knowledge base
interest
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211681957.8A
Other languages
English (en)
Other versions
CN116049267B (zh
Inventor
***
王宏
杨靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Langhui Huike Technology Co ltd
Original Assignee
Shanghai Langhui Huike Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Langhui Huike Technology Co ltd filed Critical Shanghai Langhui Huike Technology Co ltd
Priority to CN202211681957.8A priority Critical patent/CN116049267B/zh
Publication of CN116049267A publication Critical patent/CN116049267A/zh
Application granted granted Critical
Publication of CN116049267B publication Critical patent/CN116049267B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及化学品搜索的技术领域,揭露了一种多维智能识别的化学物品搜索显示方法,所述方法包括:基于向量化表示的化学品特征描述信息构建轻量化化学品知识库;利用Nesterov动量加速方法对用户搜索兴趣识别模型进行优化求解;获取用户搜索的化学品特征描述数据并进行向量化表示,将向量化表示结果输入到最优用户搜索兴趣识别模型中得到的用户搜索以及感兴趣的化学品名称向量,并从轻量级化学品知识库中搜索该化学品的相关信息反馈给用户。本发明基于所构建的轻量化化学品知识库对用户搜索内容进行精确查找,并利用用户搜索兴趣识别模型对用户历史搜索信息进行预测,实现用户感兴趣的化学品名称以及相关信息的预测查找。

Description

一种多维智能识别的化学物品搜索显示方法
技术领域
本发明涉及化学品搜索的技术领域,尤其涉及一种多维智能识别的化学物品搜索显示方法。
背景技术
化学品具有专业程度高,名称复杂并且存在极大相似性的特点,对普通民众而言无法直接确定化学品名称并进行搜索,只能针对化学品的部分特性、甚至只有部分用途进行描述,导致无法直接返回给用户准确的化学品信息。针对该问题,本发明提出一种多维智能识别的化学物品搜索显示方法,对不同的化学物品利进行轻量化建模,用户通过输入或者采集待搜索物品描述信息并发送到后台,后台根据收集的信息和构建好的化学物品轻量化模型库进行决策判断,精确返回客户查询的物品信息。
发明内容
有鉴于此,本发明提供一种多维智能识别的化学物品搜索显示方法,目的在于:1)将不同化学品文本数据转换为实体形式,将化学品名称作为实体,构建化学品名称与相关特征描述信息的图结构,形成轻量化化学品知识库,并对轻量化化学品知识库中的化学品特征描述信息进行向量化表示,在向量表示过程中,引入不同实体类型的注意力机制对化学品名称的词向量编码序列进行加权表示,实现化学品名称编码结果的实体增强,有助于基于用户输入的化学品特征描述数据实现更为快速的搜索化学品名称向量查询;2)利用Nesterov动量加速方法对所构建得到的用户搜索兴趣识别模型进行参数求解,得到时序兴趣权重矩阵,在基于Nesterov动量加速方法的基础上,以动态概率影响学习步长,从而使得学习步长整体上随着算法迭代进行而慢慢降低,同时也能使步长在小范围内激烈变化,以增大跳出局部最优获得更优解的能力,加快模型训练,并利用求解得到的时序兴趣权重矩阵对用户历史搜索信息进行预测,得到用户感兴趣的化学品名称以及相关信息,实现精确化学品查找以及兴趣化学品预测查找。
实现上述目的,本发明提供的一种多维智能识别的化学物品搜索显示方法,包括以下步骤:
S1:采集化学品文本数据,并对采集的化学品文本数据进行命名实体识别,得到化学品特征描述信息,并基于化学品特征描述信息构建轻量化化学品知识库;
S2:对轻量化化学品知识库中的化学品特征描述信息进行向量化表示;
S3:构建用户搜索兴趣识别模型,所构建模型以用户输入的化学品描述特征信息向量表示结果为输入,以预测化学品名称向量为输出;
S4:利用Nesterov动量加速方法对构建得到的用户搜索兴趣识别模型进行优化求解,得到最优用户搜索兴趣识别模型;
S5:获取用户搜索的化学品特征描述数据并进行向量化表示,将向量化表示结果输入到最优用户搜索兴趣识别模型中得到的用户搜索的化学品名称向量,并从轻量级化学品知识库中搜索该化学品的相关信息反馈给用户。
作为本发明的进一步改进方法:
可选地,所述S1步骤中采集化学品文本数据,并对采集的化学品文本数据进行命名实体识别,得到化学品特征描述信息,包括:
采集化学品文本数据,其中所采集化学品文本数据的形式为:{化学品名称:化学品描述语句},其中化学品描述语句为描述化学品类别、化学品基本构成、成分/组成信息、危险性概述、急救措施以及消防措施的语句;
分别构建不同类型化学品描述语句的实体划分词典,将实体划分词典中的实体标记词对化学品描述语句中的词语进行匹配,得到匹配成功词语后的衔接词句,利用词语累积概率对衔接词句进行分词,得到实体在对应实体类型的描述,其中衔接词句的分词流程为:
S11:按顺序将衔接词句切分为若干候选词,其中候选词的长度范围为大于等于1,若候选词的长度大于1,需要该候选词在化学品文本数据出现的频数大于1;
S12:计算衔接词句中每个候选词在所采集化学品文本数据中出现的频率,并将每个候选词的累积频率设置为0;
S13:计算衔接词句中每个候选词的累积频率:
p(n)=p(n-1)p(n)
其中:
p(n-1)表示衔接词句中第n-1个候选词的累积频率,p(n)表示衔接词句中第n个候选词在所采集化学品文本数据中出现的频率;
S14:从最后一个候选词开始向前遍历,遍历最后一个候选词的前驱词,并比较候选词的每个前驱词的累积概率,选取累积概率最大的前驱词作为该候选词的最佳前驱词;
S15:将最佳前驱词作为最后一个候选词,返回步骤S14,直到遍历完衔接词句,将所有最佳前驱词作为分词结果;
将分词结果作为对应实体的实体类型描述,得到化学品文本数据的命名实体识别结果,将命名实体识别结果作为化学品特征描述信息,其中实体为化学品名称,对应实体的实体类型包括化学品类别、化学品基本构成、成分/组成信息、危险性概述、急救措施以及消防措施,实体类型下的实体类型描述为分词结果;
在本发明实施例中,其中化学品类别的实体划分词典中包括“类别”“类别为”等,化学品基本构成的实体划分词典中包括“分子式”“分子”等,成分/组成信息的实体划分词典中包括“成分”“组成信息”等,危险性概述的实体划分词典中包括“危险性类别”“侵入途径”“健康危害”“环境危害”等,急救措施的实体划分词典中包括“皮肤接触”“吸入”“食入”等,消防措施的实体划分词典中包括“灭火”“有害燃烧产物”等。
可选地,所述S1步骤中基于化学品特征描述信息构建轻量化化学品知识库,包括:
不同化学品的化学品特征描述信息集合为:
{(Am,Sm,j,Cm,j)|m∈[1,M],j∈[1,6]}
其中:
Am表示第m种化学品的化学品名称,Sm,j表示第m种化学品的第j种实体类型,j∈[1,6],依次为化学品类别、化学品基本构成、成分/组成信息、危险性概述、急救措施以及消防措施;
Cm,j表示第m种化学品的第j种实体类型对应的实体类型描述;
基于不同化学品的化学品特征描述信息构建轻量化化学品知识库,其中轻量化化学品知识库的结构为G=((A,C),S),G表示轻量化化学品知识库的图网络结构,(A,C)表示图网络结构中的点,A表示化学品名称,C表示化学品的实体类型描述,S表示图网络结构中不同类型的点之间的连线,对应化学特征描述信息中的实体类型,化学品名称与对应化学品的实体类型描述通过实体类型连接,构成一组化学特征描述信息
Figure BDA0004016796170000021
将所有化学特征描述信息嵌入到图网络结构中,得到轻量化化学品知识库。
可选地,所述S2步骤中对所构建轻量化化学品知识库中的化学品特征描述信息进行向量化表示,包括:
对所构建轻量化化学品知识库中的化学品特征描述信息进行向量化表示,其中向量化表示流程为:
S21:构建6个长度为6的编码序列,初始编码序列中的每个值均为0,按照实体类型顺序对轻量化化学品知识库中的实体类型进行编码,其中第j种实体类型对应的编码结果为:将编码序列中的第j个值标记为1;
S22:利用BERT模型对轻量化化学品知识库中的点进行词向量编码,得到不同点的词向量编码序列,其中轻量化化学品知识库中的点包含化学品名称以及化学品的实体类型描述;
S23:基于实体类型编码结果对轻量化化学品知识库中化学品名称的词向量编码序列进行基于注意力机制的加权表示:
Figure BDA0004016796170000031
Figure BDA0004016796170000032
其中:
T表示转置;
W表示参数矩阵,b表示偏置向量,ReLU(·)表示激活函数,cA表示轻量化化学品知识库中化学品名称的词向量编码序列,eA表示基于实体类型编码结果的化学品名称加权表示后编码结果;
αj表示第j种实体类型编码结果的权重,codej表示第j种实体类型编码结果;
numj表示第j种实体类型在轻量化化学品知识库中的出现次数;
S24:将轻量化化学品知识库中化学品实体类型描述的词向量编码序列作为其编码结果,将化学品名称对应的基于实体类型编码结果的加权表示后编码结果作为其编码结果,得到向量化表示的轻量化化学品知识库。
可选地,所述S3步骤中构建用户搜索兴趣识别模型,包括:
构建用户搜索兴趣识别模型,所构建模型以用户输入的化学品描述特征信息向量表示结果为输入,以预测化学品名称向量为输出;其中用户输入的化学品描述特征信息向量包括实体类型编码表示向量、实体类型描述的词向量编码表示或化学品名称的加权编码表示;其中用户搜索兴趣识别模型的模型表示结果为:
Figure BDA0004016796170000033
其中:
iffirst表示用户是第一次搜索化学品;
Figure BDA0004016796170000034
表示用户输入的化学品描述特征信息向量表示结果,
Figure BDA0004016796170000035
表示用户搜索兴趣识别模型输出的化学品名称;
Q表示向量化表示的轻量化化学品知识库;
Figure BDA0004016796170000036
表示
Figure BDA0004016796170000037
与Q中相似性最高的化学品特征描述信息编码向量,
Figure BDA0004016796170000038
表示在轻量化化学品知识库中确定
Figure BDA0004016796170000039
对应连接的化学品名称向量;
Figure BDA00040167961700000310
表示用户输入的历史化学品描述特征信息向量表示;
K表示用户搜索兴趣识别模型中的时序兴趣权重矩阵,
Figure BDA00040167961700000311
表示用户历史搜索信息在轻量化化学品知识库中的加权表示结果所构成的历史向量;
Figure BDA00040167961700000312
表示根据加权表示结果确定用户最感兴趣的k条Q中的化学品特征描述信息编码向量,并在轻量化化学品知识库中确定k条化学品特征描述信息编码向量所最多连接的化学品名称向量,将所确定的化学品名称向量作为预测得到的用户感兴趣的化学品名称向量。
可选地,所述S4步骤中利用Nesterov动量加速方法对构建得到的用户搜索兴趣识别模型进行优化求解,包括:
利用Nesterov动量加速方法对构建得到的用户搜索兴趣识别模型进行优化求解,其中模型的优化求解流程为:
S41:获取H组训练数据作为训练数据集,其中每组训练数据表示用户历史搜索信息以及对应的用户感兴趣化学品名称向量;
S42:构建求解损失函数:
Figure BDA0004016796170000041
其中:
K表示用户搜索兴趣识别模型中的时序兴趣权重矩阵,为待优化求解参数;
yh表示第h组训练数据的真实用户感兴趣化学品名称向量;
Figure BDA0004016796170000042
表示用户搜索兴趣识别模型输出的用户感兴趣化学品名称向量;
S43:设置优化求解算法的当前迭代次数为s,s的初始值为1,最大值为Max;并随机初始化时序兴趣权重矩阵K0
S44:令u0=K0,计算梯度
Figure BDA0004016796170000043
S45:基于Nesterov动量进行进行时序兴趣权重矩阵迭代:
Figure BDA0004016796170000044
Figure BDA0004016796170000045
其中:
α表示动量参数,将其设置为0.6;
λmin表示设置的最小迭代步长,λs表示第s步迭代的步长,b表示步长参数;
randoms(0,1)表示第s步迭代生成的0-1之间的随机数;
S46:令s=s+1,返回步骤S45,直到s=Max,并输出KMax作为优化求解得到的时序兴趣权重矩阵;
基于优化求解得到的时序兴趣权重矩阵构建得到最优用户搜索兴趣识别模型。
可选地,所述S5步骤中获取用户搜索的化学品特征描述数据并进行向量化表示,包括:
用户输入化学品特征描述数据进行化学品搜索,其中用户输入的化学品特征描述数据为待搜索化学品的部分特征描述数据,获取用户搜索的化学品特征描述数据并进行向量化表示,其中向量化表示流程为:
利用基于实体划分词典的词语累积概率计算方法对用户搜索的化学品特征描述数据进行分词处理;
利用基于编码序列的匹配方法对分离的实体类型进行编码表示;
利用BERT模型对分离的实体类型描述进行词向量编码表示;
依次利用BERT模型以及基于实体类型编码结果的加权表示方法对分离的化学品名称进行编码表示。
可选地,所述S5步骤中将向量化表示结果输入到最优用户搜索兴趣识别模型中得到的用户搜索的化学品名称向量,并从轻量级化学品知识库中搜索该化学品的相关信息反馈给用户,包括:
将向量化表示结果输入到最优用户搜索兴趣识别模型中,若用户为第一次搜索化学品,则利用最优用户搜索兴趣识别模型计算向量化表示结果与轻量化化学品知识库中化学品特征描述信息编码向量的相似性,选取相似性最高的化学品特征描述信息,并在轻量化化学品知识库中确定所选取化学品特征描述信息对应连接的化学品名称向量,并从轻量级化学品知识库中搜索该化学品的实体类型描述反馈给用户;
若用户曾多次搜索化学品,则在反馈所搜索化学品信息的基础上,基于用户历史搜索结果反馈预测的用户感兴趣的化学品名称及对应的实体类型描述。
为了解决上述问题,本发明提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;
通信接口,实现电子设备通信;及
处理器,执行所述存储器中存储的指令以实现上述所述的多维智能识别的化学物品搜索显示方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的多维智能识别的化学物品搜索显示方法。
相对于现有技术,本发明提出一种多维智能识别的化学物品搜索显示方法,该技术具有以下优势:
首先,本方案提出一种轻量化化学品知识库中化学品特征描述信息的向量化表示方案,对所构建轻量化化学品知识库中的化学品特征描述信息进行向量化表示,其中向量化表示流程为:构建6个长度为6的编码序列,初始编码序列中的每个值均为0,按照实体类型顺序对轻量化化学品知识库中的实体类型进行编码,其中第j种实体类型对应的编码结果为:将编码序列中的第j个值标记为1;利用BERT模型对轻量化化学品知识库中的点进行词向量编码,得到不同点的词向量编码序列,其中轻量化化学品知识库中的点包含化学品名称以及化学品的实体类型描述;基于实体类型编码结果对轻量化化学品知识库中化学品名称的词向量编码序列进行基于注意力机制的加权表示:
Figure BDA0004016796170000051
Figure BDA0004016796170000052
其中:T表示转置;W表示参数矩阵,b表示偏置向量,ReLU(·)表示激活函数,cA表示轻量化化学品知识库中化学品名称的词向量编码序列,eA表示基于实体类型编码结果的化学品名称加权表示后编码结果;αj表示第j种实体类型编码结果的权重,codej表示第j种实体类型编码结果;numj表示第j种实体类型在轻量化化学品知识库中的出现次数;将轻量化化学品知识库中化学品实体类型描述的词向量编码序列作为其编码结果,将化学品名称对应的基于实体类型编码结果的加权表示后编码结果作为其编码结果,得到向量化表示的轻量化化学品知识库。本方案将不同化学品文本数据转换为实体形式,将化学品名称作为实体,构建化学品名称与相关特征描述信息的图结构,形成轻量化化学品知识库,并对轻量化化学品知识库中的化学品特征描述信息进行向量化表示,进一步缩小轻量化化学品知识库的存储维度,在向量表示过程中,引入不同实体类型的注意力机制对化学品名称的词向量编码序列进行加权表示,实现化学品名称编码结果的实体增强,有助于基于用户输入的化学品特征描述数据实现更为快速的搜索化学品名称向量查询。
同时,本方案提出一种模型快速求解方案,利用Nesterov动量加速方法对构建得到的用户搜索兴趣识别模型进行优化求解,其中模型的优化求解流程为:获取H组训练数据作为训练数据集,其中每组训练数据表示用户历史搜索信息以及对应的用户感兴趣化学品名称向量;构建求解损失函数:
Figure BDA0004016796170000053
其中:K表示用户搜索兴趣识别模型中的时序兴趣权重矩阵,为待优化求解参数;yh表示第h组训练数据的真实用户感兴趣化学品名称向量;
Figure BDA0004016796170000061
表示用户搜索兴趣识别模型输出的用户感兴趣化学品名称向量;设置优化求解算法的当前迭代次数为s,s的初始值为1,最大值为Max;并随机初始化时序兴趣权重矩阵K0;令u0=K0,计算梯度
Figure BDA0004016796170000062
基于Nesterov动量进行进行时序兴趣权重矩阵迭代:
Figure BDA0004016796170000063
us=Ks+α(Ks-Ks-1)
Figure BDA0004016796170000064
其中:α表示动量参数,将其设置为0.6;λmin表示设置的最小迭代步长,λs表示第s步迭代的步长,b表示步长参数;randoms(0,1)表示第s步迭代生成的0-1之间的随机数;令s=s+1,重新进行时序兴趣权重矩阵迭代,直到s=Max,并输出KMax作为优化求解得到的时序兴趣权重矩阵;基于优化求解得到的时序兴趣权重矩阵构建得到最优用户搜索兴趣识别模型。本方案利用Nesterov动量加速方法对所构建得到的用户搜索兴趣识别模型进行参数求解,得到时序兴趣权重矩阵,在基于Nesterov动量加速方法的基础上,以动态概率影响学习步长,从而使得学习步长整体上随着算法迭代进行而慢慢降低,同时也能使步长在小范围内激烈变化,以增大跳出局部最优获得更优解的能力,加快模型训练,并利用求解得到的时序兴趣权重矩阵对用户历史搜索信息进行预测,得到用户感兴趣的化学品名称以及相关信息,实现精确化学品查找以及兴趣化学品预测查找。
附图说明
图1为本发明一实施例提供的一种多维智能识别的化学物品搜索显示方法的流程示意图;
图2为本发明一实施例提供的实现多维智能识别的化学物品搜索显示方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种多维智能识别的化学物品搜索显示方法。所述多维智能识别的化学物品搜索显示方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述多维智能识别的化学物品搜索显示方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
实施例1:
S1:采集化学品文本数据,并对采集的化学品文本数据进行命名实体识别,得到化学品特征描述信息,并基于化学品特征描述信息构建轻量化化学品知识库。
所述S1步骤中采集化学品文本数据,并对采集的化学品文本数据进行命名实体识别,得到化学品特征描述信息,包括:
采集化学品文本数据,其中所采集化学品文本数据的形式为:{化学品名称:化学品描述语句},其中化学品描述语句为描述化学品类别、化学品基本构成、成分/组成信息、危险性概述、急救措施以及消防措施的语句;
分别构建不同类型化学品描述语句的实体划分词典,将实体划分词典中的实体标记词对化学品描述语句中的词语进行匹配,得到匹配成功词语后的衔接词句,利用词语累积概率对衔接词句进行分词,得到实体在对应实体类型的描述,其中衔接词句的分词流程为:
S11:按顺序将衔接词句切分为若干候选词,其中候选词的长度范围为大于等于1,若候选词的长度大于1,需要该候选词在化学品文本数据出现的频数大于1;
S12:计算衔接词句中每个候选词在所采集化学品文本数据中出现的频率,并将每个候选词的累积频率设置为0;
S13:计算衔接词句中每个候选词的累积频率:
p(n)=p(n-1)p(n)
其中:
p(n-1)表示衔接词句中第n-1个候选词的累积频率,p(n)表示衔接词句中第n个候选词在所采集化学品文本数据中出现的频率;
S14:从最后一个候选词开始向前遍历,遍历最后一个候选词的前驱词,并比较候选词的每个前驱词的累积概率,选取累积概率最大的前驱词作为该候选词的最佳前驱词;
S15:将最佳前驱词作为最后一个候选词,返回步骤S14,直到遍历完衔接词句,将所有最佳前驱词作为分词结果;
将分词结果作为对应实体的实体类型描述,得到化学品文本数据的命名实体识别结果,将命名实体识别结果作为化学品特征描述信息,其中实体为化学品名称,对应实体的实体类型包括化学品类别、化学品基本构成、成分/组成信息、危险性概述、急救措施以及消防措施,实体类型下的实体类型描述为分词结果。
所述S1步骤中基于化学品特征描述信息构建轻量化化学品知识库,包括:
不同化学品的化学品特征描述信息集合为:
{(Am,Sm,j,Cm,j)|m∈[1,M],j∈[1,6]}
其中:
Am表示第m种化学品的化学品名称,Sm,j表示第m种化学品的第j种实体类型,j∈[1,6],依次为化学品类别、化学品基本构成、成分/组成信息、危险性概述、急救措施以及消防措施;
Cm,j表示第m种化学品的第j种实体类型对应的实体类型描述;
基于不同化学品的化学品特征描述信息构建轻量化化学品知识库,其中轻量化化学品知识库的结构为G=((A,C),S),G表示轻量化化学品知识库的图网络结构,(A,C)表示图网络结构中的点,A表示化学品名称,C表示化学品的实体类型描述,S表示图网络结构中不同类型的点之间的连线,对应化学特征描述信息中的实体类型,化学品名称与对应化学品的实体类型描述通过实体类型连接,构成一组化学特征描述信息
Figure BDA0004016796170000071
将所有化学特征描述信息嵌入到图网络结构中,得到轻量化化学品知识库。
S2:对轻量化化学品知识库中的化学品特征描述信息进行向量化表示。
所述S2步骤中对所构建轻量化化学品知识库中的化学品特征描述信息进行向量化表示,包括:
对所构建轻量化化学品知识库中的化学品特征描述信息进行向量化表示,其中向量化表示流程为:
S21:构建6个长度为6的编码序列,初始编码序列中的每个值均为0,按照实体类型顺序对轻量化化学品知识库中的实体类型进行编码,其中第j种实体类型对应的编码结果为:将编码序列中的第j个值标记为1;
S22:利用BERT模型对轻量化化学品知识库中的点进行词向量编码,得到不同点的词向量编码序列,其中轻量化化学品知识库中的点包含化学品名称以及化学品的实体类型描述;
S23:基于实体类型编码结果对轻量化化学品知识库中化学品名称的词向量编码序列进行基于注意力机制的加权表示:
Figure BDA0004016796170000081
Figure BDA0004016796170000082
其中:
T表示转置;
W表示参数矩阵,b表示偏置向量,ReLU(·)表示激活函数,cA表示轻量化化学品知识库中化学品名称的词向量编码序列,eA表示基于实体类型编码结果的化学品名称加权表示后编码结果;
αj表示第j种实体类型编码结果的权重,codej表示第j种实体类型编码结果;
numj表示第j种实体类型在轻量化化学品知识库中的出现次数;
S24:将轻量化化学品知识库中化学品实体类型描述的词向量编码序列作为其编码结果,将化学品名称对应的基于实体类型编码结果的加权表示后编码结果作为其编码结果,得到向量化表示的轻量化化学品知识库。
S3:构建用户搜索兴趣识别模型,所构建模型以用户输入的化学品描述特征信息向量表示结果为输入,以预测化学品名称向量为输出。
所述S3步骤中构建用户搜索兴趣识别模型,包括:
构建用户搜索兴趣识别模型,所构建模型以用户输入的化学品描述特征信息向量表示结果为输入,以预测化学品名称向量为输出;其中用户输入的化学品描述特征信息向量包括实体类型编码表示向量、实体类型描述的词向量编码表示或化学品名称的加权编码表示;其中用户搜索兴趣识别模型的模型表示结果为:
Figure BDA0004016796170000083
其中:
iffirst表示用户是第一次搜索化学品;
Figure BDA0004016796170000084
表示用户输入的化学品描述特征信息向量表示结果,
Figure BDA0004016796170000085
表示用户搜索兴趣识别模型输出的化学品名称;
Q表示向量化表示的轻量化化学品知识库;
Figure BDA0004016796170000086
表示
Figure BDA0004016796170000087
与Q中相似性最高的化学品特征描述信息编码向量,
Figure BDA0004016796170000088
表示在轻量化化学品知识库中确定
Figure BDA0004016796170000089
对应连接的化学品名称向量;
Figure BDA00040167961700000810
表示用户输入的历史化学品描述特征信息向量表示;
K表示用户搜索兴趣识别模型中的时序兴趣权重矩阵,
Figure BDA00040167961700000811
表示用户历史搜索信息在轻量化化学品知识库中的加权表示结果所构成的历史向量;
Figure BDA00040167961700000812
表示根据加权表示结果确定用户最感兴趣的k条Q中的化学品特征描述信息编码向量,并在轻量化化学品知识库中确定k条化学品特征描述信息编码向量所最多连接的化学品名称向量,将所确定的化学品名称向量作为预测得到的用户感兴趣的化学品名称向量。
S4:利用Nesterov动量加速方法对构建得到的用户搜索兴趣识别模型进行优化求解,得到最优用户搜索兴趣识别模型。
所述S4步骤中利用Nesterov动量加速方法对构建得到的用户搜索兴趣识别模型进行优化求解,包括:
利用Nesterov动量加速方法对构建得到的用户搜索兴趣识别模型进行优化求解,其中模型的优化求解流程为:
S41:获取H组训练数据作为训练数据集,其中每组训练数据表示用户历史搜索信息以及对应的用户感兴趣化学品名称向量;
S42:构建求解损失函数:
其中:
Figure BDA0004016796170000091
K表示用户搜索兴趣识别模型中的时序兴趣权重矩阵,为待优化求解参数;
yh表示第h组训练数据的真实用户感兴趣化学品名称向量;
Figure BDA0004016796170000092
表示用户搜索兴趣识别模型输出的用户感兴趣化学品名称向量;
S43:设置优化求解算法的当前迭代次数为s,s的初始值为1,最大值为Max;并随机初始化时序兴趣权重矩阵K0
S44:令u0=K0,计算梯度
Figure BDA0004016796170000093
S45:基于Nesterov动量进行进行时序兴趣权重矩阵迭代:
Figure BDA0004016796170000094
us=Ks+α(Ks-Ki-1)
Figure BDA0004016796170000095
其中:
α表示动量参数,将其设置为0.6;
λmin表示设置的最小迭代步长,λs表示第s步迭代的步长,b表示步长参数;
randoms(0,1)表示第s步迭代生成的0-1之间的随机数;
S46:令s=s+1,返回步骤S45,直到s=Max,并输出KMax作为优化求解得到的时序兴趣权重矩阵;
基于优化求解得到的时序兴趣权重矩阵构建得到最优用户搜索兴趣识别模型。
S5:获取用户搜索的化学品特征描述数据并进行向量化表示,将向量化表示结果输入到最优用户搜索兴趣识别模型中得到的用户搜索的化学品名称向量,并从轻量级化学品知识库中搜索该化学品的相关信息反馈给用户。
所述S5步骤中获取用户搜索的化学品特征描述数据并进行向量化表示,包括:
用户输入化学品特征描述数据进行化学品搜索,其中用户输入的化学品特征描述数据为待搜索化学品的部分特征描述数据,获取用户搜索的化学品特征描述数据并进行向量化表示,其中向量化表示流程为:
利用基于实体划分词典的词语累积概率计算方法对用户搜索的化学品特征描述数据进行分词处理;
利用基于编码序列的匹配方法对分离的实体类型进行编码表示;
利用BERT模型对分离的实体类型描述进行词向量编码表示;
依次利用BERT模型以及基于实体类型编码结果的加权表示方法对分离的化学品名称进行编码表示。
所述S5步骤中将向量化表示结果输入到最优用户搜索兴趣识别模型中得到的用户搜索的化学品名称向量,并从轻量级化学品知识库中搜索该化学品的相关信息反馈给用户,包括:
将向量化表示结果输入到最优用户搜索兴趣识别模型中,若用户为第一次搜索化学品,则利用最优用户搜索兴趣识别模型计算向量化表示结果与轻量化化学品知识库中化学品特征描述信息编码向量的相似性,选取相似性最高的化学品特征描述信息,并在轻量化化学品知识库中确定所选取化学品特征描述信息对应连接的化学品名称向量,并从轻量级化学品知识库中搜索该化学品的实体类型描述反馈给用户;
若用户曾多次搜索化学品,则在反馈所搜索化学品信息的基础上,基于用户历史搜索结果反馈预测的用户感兴趣的化学品名称及对应的实体类型描述。
实施例2:
如图2所示,是本发明一实施例提供的实现多维智能识别的化学物品搜索显示方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11、通信接口13和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(用于实现化学物品搜索的程序12等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述通信接口13可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接,并实现电子设备内部组件之间的连接通信。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图2仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图2示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
采集化学品文本数据,并对采集的化学品文本数据进行命名实体识别,得到化学品特征描述信息,并基于化学品特征描述信息构建轻量化化学品知识库;
对轻量化化学品知识库中的化学品特征描述信息进行向量化表示;
构建用户搜索兴趣识别模型,所构建模型以用户输入的化学品描述特征信息向量表示结果为输入,以预测化学品名称向量为输出;
利用Nesterov动量加速方法对构建得到的用户搜索兴趣识别模型进行优化求解,得到最优用户搜索兴趣识别模型;
获取用户搜索的化学品特征描述数据并进行向量化表示,将向量化表示结果输入到最优用户搜索兴趣识别模型中得到的用户搜索的化学品名称向量,并从轻量级化学品知识库中搜索该化学品的相关信息反馈给用户。
具体地,所述处理器10对上述指令的具体实现方法可参考图1至图2对应实施例中相关步骤的描述,在此不赘述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种多维智能识别的化学物品搜索显示方法,其特征在于,所述方法包括:
S1:采集化学品文本数据,并对采集的化学品文本数据进行命名实体识别,得到化学品特征描述信息,并基于化学品特征描述信息构建轻量化化学品知识库;
S2:对轻量化化学品知识库中的化学品特征描述信息进行向量化表示;
S3:构建用户搜索兴趣识别模型,所构建模型以用户输入的化学品描述特征信息向量表示结果为输入,以预测化学品名称向量为输出;
S4:利用Nesterov动量加速方法对构建得到的用户搜索兴趣识别模型进行优化求解,得到最优用户搜索兴趣识别模型;
S5:获取用户搜索的化学品特征描述数据并进行向量化表示,将向量化表示结果输入到最优用户搜索兴趣识别模型中得到的用户搜索的化学品名称向量,并从轻量级化学品知识库中搜索该化学品的相关信息反馈给用户。
2.如权利要求1所述的一种多维智能识别的化学物品搜索显示方法,其特征在于,所述S1步骤中采集化学品文本数据,并对采集的化学品文本数据进行命名实体识别,得到化学品特征描述信息,包括:
采集化学品文本数据,其中所采集化学品文本数据的形式为:{化学品名称:化学品描述语句},其中化学品描述语句为描述化学品类别、化学品基本构成、成分/组成信息、危险性概述、急救措施以及消防措施的语句;
分别构建不同类型化学品描述语句的实体划分词典,将实体划分词典中的实体标记词对化学品描述语句中的词语进行匹配,得到匹配成功词语后的衔接词句,利用词语累积概率对衔接词句进行分词,得到实体在对应实体类型的描述,其中衔接词句的分词流程为:
S11:按顺序将衔接词句切分为若干候选词,其中候选词的长度范围为大于等于1,若候选词的长度大于1,需要该候选词在化学品文本数据出现的频数大于1;
S12:计算衔接词句中每个候选词在所采集化学品文本数据中出现的频率,并将每个候选词的累积频率设置为0;
S13:计算衔接词句中每个候选词的累积频率:
p(n)=p(n-1)p(n)
其中:
p(n-1)表示衔接词句中第n-1个候选词的累积频率,p(n)表示衔接词句中第n个候选词在所采集化学品文本数据中出现的频率;
S14:从最后一个候选词开始向前遍历,遍历最后一个候选词的前驱词,并比较候选词的每个前驱词的累积概率,选取累积概率最大的前驱词作为该候选词的最佳前驱词;
S15:将最佳前驱词作为最后一个候选词,返回步骤S14,直到遍历完衔接词句,将所有最佳前驱词作为分词结果;
将分词结果作为对应实体的实体类型描述,得到化学品文本数据的命名实体识别结果,将命名实体识别结果作为化学品特征描述信息,其中实体为化学品名称,对应实体的实体类型包括化学品类别、化学品基本构成、成分/组成信息、危险性概述、急救措施以及消防措施,实体类型下的实体类型描述为分词结果。
3.如权利要求2所述的一种多维智能识别的化学物品搜索显示方法,其特征在于,所述S1步骤中基于化学品特征描述信息构建轻量化化学品知识库,包括:
不同化学品的化学品特征描述信息集合为:
{(Am,Sm,j,Cm,j)|m∈[1,M],j∈[1,6]}
其中:
Am表示第m种化学品的化学品名称,Sm,j表示第m种化学品的第j种实体类型,j∈[1,6],依次为化学品类别、化学品基本构成、成分/组成信息、危险性概述、急救措施以及消防措施;
Cm,j表示第m种化学品的第j种实体类型对应的实体类型描述;
基于不同化学品的化学品特征描述信息构建轻量化化学品知识库,其中轻量化化学品知识库的结构为G=((A,C),S),G表示轻量化化学品知识库的图网络结构,(A,C)表示图网络结构中的点,A表示化学品名称,C表示化学品的实体类型描述,S表示图网络结构中不同类型的点之间的连线,对应化学特征描述信息中的实体类型,化学品名称与对应化学品的实体类型描述通过实体类型连接,构成一组化学特征描述信息
Figure FDA0004016796160000021
将所有化学特征描述信息嵌入到图网络结构中,得到轻量化化学品知识库。
4.如权利要求3所述的一种多维智能识别的化学物品搜索显示方法,其特征在于,所述S2步骤中对所构建轻量化化学品知识库中的化学品特征描述信息进行向量化表示,包括:
对所构建轻量化化学品知识库中的化学品特征描述信息进行向量化表示,其中向量化表示流程为:
S21:构建6个长度为6的编码序列,初始编码序列中的每个值均为0,按照实体类型顺序对轻量化化学品知识库中的实体类型进行编码,其中第j种实体类型对应的编码结果为:将编码序列中的第j个值标记为1;
S22:利用BERT模型对轻量化化学品知识库中的点进行词向量编码,得到不同点的词向量编码序列,其中轻量化化学品知识库中的点包含化学品名称以及化学品的实体类型描述;
S23:基于实体类型编码结果对轻量化化学品知识库中化学品名称的词向量编码序列进行基于注意力机制的加权表示:
Figure FDA0004016796160000022
Figure FDA0004016796160000023
其中:
T表示转置;
W表示参数矩阵,b表示偏置向量,ReLU(·)表示激活函数,cA表示轻量化化学品知识库中化学品名称的词向量编码序列,eA表示基于实体类型编码结果的化学品名称加权表示后编码结果;
αj表示第j种实体类型编码结果的权重,codej表示第j种实体类型编码结果;
numj表示第j种实体类型在轻量化化学品知识库中的出现次数;
S24:将轻量化化学品知识库中化学品实体类型描述的词向量编码序列作为其编码结果,将化学品名称对应的基于实体类型编码结果的加权表示后编码结果作为其编码结果,得到向量化表示的轻量化化学品知识库。
5.如权利要求1所述的一种多维智能识别的化学物品搜索显示方法,其特征在于,所述S3步骤中构建用户搜索兴趣识别模型,包括:
构建用户搜索兴趣识别模型,所构建模型以用户输入的化学品描述特征信息向量表示结果为输入,以预测化学品名称向量为输出;其中用户输入的化学品描述特征信息向量包括实体类型编码表示向量、实体类型描述的词向量编码表示或化学品名称的加权编码表示;其中用户搜索兴趣识别模型的模型表示结果为:
Figure FDA0004016796160000024
其中:
iffirst表示用户是第一次搜索化学品;
Figure FDA0004016796160000031
表示用户输入的化学品描述特征信息向量表示结果,
Figure FDA0004016796160000032
表示用户搜索兴趣识别模型输出的化学品名称;
Q表示向量化表示的轻量化化学品知识库;
Figure FDA0004016796160000033
表示
Figure FDA0004016796160000034
与Q中相似性最高的化学品特征描述信息编码向量,
Figure FDA0004016796160000035
表示在轻量化化学品知识库中确定
Figure FDA0004016796160000036
对应连接的化学品名称向量;
Figure FDA0004016796160000037
表示用户输入的历史化学品描述特征信息向量表示;
K表示用户搜索兴趣识别模型中的时序兴趣权重矩阵,
Figure FDA0004016796160000038
表示用户历史搜索信息在轻量化化学品知识库中的加权表示结果所构成的历史向量;
Figure FDA0004016796160000039
表示根据加权表示结果确定用户最感兴趣的k条Q中的化学品特征描述信息编码向量,并在轻量化化学品知识库中确定k条化学品特征描述信息编码向量所最多连接的化学品名称向量,将所确定的化学品名称向量作为预测得到的用户感兴趣的化学品名称向量。
6.如权利要求5所述的一种多维智能识别的化学物品搜索显示方法,其特征在于,所述S4步骤中利用Nesterov动量加速方法对构建得到的用户搜索兴趣识别模型进行优化求解,包括:
利用Nesterov动量加速方法对构建得到的用户搜索兴趣识别模型进行优化求解,其中模型的优化求解流程为:
S41:获取H组训练数据作为训练数据集,其中每组训练数据表示用户历史搜索信息以及对应的用户感兴趣化学品名称向量;
S42:构建求解损失函数:
Figure FDA00040167961600000310
其中:
K表示用户搜索兴趣识别模型中的时序兴趣权重矩阵,为待优化求解参数;
yh表示第h组训练数据的真实用户感兴趣化学品名称向量;
Figure FDA00040167961600000311
表示用户搜索兴趣识别模型输出的用户感兴趣化学品名称向量;
S43:设置优化求解算法的当前迭代次数为s,s的初始值为1,最大值为Max;并随机初始化时序兴趣权重矩阵K0
S44:令u0=K0,计算梯度
Figure FDA00040167961600000314
S45:基于Nesterov动量进行进行时序兴趣权重矩阵迭代:
Figure FDA00040167961600000312
us=Ks+α(Ks-Ks-1)
Figure FDA00040167961600000313
其中:
α表示动量参数,将其设置为0.6;
λmin表示设置的最小迭代步长,λs表示第s步迭代的步长,b表示步长参数;
randoms(0,1)表示第s步迭代生成的0-1之间的随机数;
S46:令s=s+1,返回步骤S45,直到s=Max,并输出KMax作为优化求解得到的时序兴趣权重矩阵;
基于优化求解得到的时序兴趣权重矩阵构建得到最优用户搜索兴趣识别模型。
7.如权利要求6所述的一种多维智能识别的化学物品搜索显示方法,其特征在于,所述S5步骤中获取用户搜索的化学品特征描述数据并进行向量化表示,包括:
用户输入化学品特征描述数据进行化学品搜索,其中用户输入的化学品特征描述数据为待搜索化学品的部分特征描述数据,获取用户搜索的化学品特征描述数据并进行向量化表示,其中向量化表示流程为:
利用基于实体划分词典的词语累积概率计算方法对用户搜索的化学品特征描述数据进行分词处理;
利用基于编码序列的匹配方法对分离的实体类型进行编码表示;
利用BERT模型对分离的实体类型描述进行词向量编码表示;
依次利用BERT模型以及基于实体类型编码结果的加权表示方法对分离的化学品名称进行编码表示。
8.如权利要求7所述的一种多维智能识别的化学物品搜索显示方法,其特征在于,所述S5步骤中将向量化表示结果输入到最优用户搜索兴趣识别模型中得到的用户搜索的化学品名称向量,并从轻量级化学品知识库中搜索该化学品的相关信息反馈给用户,包括:
将向量化表示结果输入到最优用户搜索兴趣识别模型中,若用户为第一次搜索化学品,则利用最优用户搜索兴趣识别模型计算向量化表示结果与轻量化化学品知识库中化学品特征描述信息编码向量的相似性,选取相似性最高的化学品特征描述信息,并在轻量化化学品知识库中确定所选取化学品特征描述信息对应连接的化学品名称向量,并从轻量级化学品知识库中搜索该化学品的实体类型描述反馈给用户;
若用户曾多次搜索化学品,则在反馈所搜索化学品信息的基础上,基于用户历史搜索结果反馈预测的用户感兴趣的化学品名称及对应的实体类型描述。
CN202211681957.8A 2022-12-26 2022-12-26 一种多维智能识别的化学物品搜索显示方法 Active CN116049267B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211681957.8A CN116049267B (zh) 2022-12-26 2022-12-26 一种多维智能识别的化学物品搜索显示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211681957.8A CN116049267B (zh) 2022-12-26 2022-12-26 一种多维智能识别的化学物品搜索显示方法

Publications (2)

Publication Number Publication Date
CN116049267A true CN116049267A (zh) 2023-05-02
CN116049267B CN116049267B (zh) 2023-07-18

Family

ID=86128687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211681957.8A Active CN116049267B (zh) 2022-12-26 2022-12-26 一种多维智能识别的化学物品搜索显示方法

Country Status (1)

Country Link
CN (1) CN116049267B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014021764A (ja) * 2012-07-19 2014-02-03 Ricoh Co Ltd 検索装置、検索プログラム及び検索システム
CN108985457A (zh) * 2018-08-22 2018-12-11 北京大学 一种受优化算法启发的深度神经网络结构设计方法
CN110889509A (zh) * 2019-11-11 2020-03-17 安徽超清科技股份有限公司 一种基于梯度动量加速的联合学习方法及装置
CN111090766A (zh) * 2019-12-24 2020-05-01 盐城禅图智能科技有限公司 一种基于内容标识的图片搜索方法、装置及设备
CN112036178A (zh) * 2020-08-25 2020-12-04 国家电网有限公司 一种配网实体相关的语义搜索方法
CN112069408A (zh) * 2020-06-15 2020-12-11 北京理工大学 一种融合关系抽取的推荐***及方法
CN113435604A (zh) * 2021-06-16 2021-09-24 清华大学 一种联邦学习优化方法及装置
CN113919366A (zh) * 2021-09-06 2022-01-11 国网河北省电力有限公司电力科学研究院 一种面向电力变压器知识问答的语义匹配方法和装置
CN114329225A (zh) * 2022-01-24 2022-04-12 平安国际智慧城市科技股份有限公司 基于搜索语句的搜索方法、装置、设备及存储介质
CN114548422A (zh) * 2022-01-17 2022-05-27 西北工业大学 一种用于监督学习问题模型的非精确as-admm算法
CN115391375A (zh) * 2022-08-26 2022-11-25 中远海运科技股份有限公司 一种基于语义识别的语音搜索船舶动态的方法及***
CN115438048A (zh) * 2022-09-29 2022-12-06 招商局金融科技有限公司 表搜索方法、装置、设备及存储介质
CN115438166A (zh) * 2022-09-29 2022-12-06 招商局金融科技有限公司 基于关键词和语义的搜索方法、装置、设备及存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014021764A (ja) * 2012-07-19 2014-02-03 Ricoh Co Ltd 検索装置、検索プログラム及び検索システム
CN108985457A (zh) * 2018-08-22 2018-12-11 北京大学 一种受优化算法启发的深度神经网络结构设计方法
CN110889509A (zh) * 2019-11-11 2020-03-17 安徽超清科技股份有限公司 一种基于梯度动量加速的联合学习方法及装置
CN111090766A (zh) * 2019-12-24 2020-05-01 盐城禅图智能科技有限公司 一种基于内容标识的图片搜索方法、装置及设备
CN112069408A (zh) * 2020-06-15 2020-12-11 北京理工大学 一种融合关系抽取的推荐***及方法
CN112036178A (zh) * 2020-08-25 2020-12-04 国家电网有限公司 一种配网实体相关的语义搜索方法
CN113435604A (zh) * 2021-06-16 2021-09-24 清华大学 一种联邦学习优化方法及装置
CN113919366A (zh) * 2021-09-06 2022-01-11 国网河北省电力有限公司电力科学研究院 一种面向电力变压器知识问答的语义匹配方法和装置
CN114548422A (zh) * 2022-01-17 2022-05-27 西北工业大学 一种用于监督学习问题模型的非精确as-admm算法
CN114329225A (zh) * 2022-01-24 2022-04-12 平安国际智慧城市科技股份有限公司 基于搜索语句的搜索方法、装置、设备及存储介质
CN115391375A (zh) * 2022-08-26 2022-11-25 中远海运科技股份有限公司 一种基于语义识别的语音搜索船舶动态的方法及***
CN115438048A (zh) * 2022-09-29 2022-12-06 招商局金融科技有限公司 表搜索方法、装置、设备及存储介质
CN115438166A (zh) * 2022-09-29 2022-12-06 招商局金融科技有限公司 基于关键词和语义的搜索方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN116049267B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN111241304B (zh) 基于深度学习的答案生成方法、电子装置及可读存储介质
CN110795527B (zh) 候选实体排序方法、训练方法及相关装置
CN111159485B (zh) 尾实体链接方法、装置、服务器及存储介质
WO2020253042A1 (zh) 情感智能判断方法、装置及计算机可读存储介质
CN111753550A (zh) 一种自然语言的语义解析方法
CN108038208B (zh) 上下文信息识别模型的训练方法、装置和存储介质
CN110427480B (zh) 个性化文本智能推荐方法、装置及计算机可读存储介质
CN116401464B (zh) 一种职业用户画像的构建方法、装置、设备及存储介质
CN113127626B (zh) 基于知识图谱的推荐方法、装置、设备及可读存储介质
CN111858834B (zh) 基于ai的案件争议焦点确定方法、装置、设备及介质
WO2021223882A1 (en) Prediction explanation in machine learning classifiers
CN112000778A (zh) 一种基于语义识别的自然语言处理方法、装置和***
CN111221942A (zh) 智能化文本对话生成方法、装置及计算机可读存储介质
CN116049267B (zh) 一种多维智能识别的化学物品搜索显示方法
CN112560427B (zh) 问题扩展方法、装置、电子设备及介质
CN115827990B (zh) 搜索方法及装置
CN110413749B (zh) 确定标准问题的方法及装置
CN112632264A (zh) 智能问答方法、装置、电子设备及存储介质
CN115563515A (zh) 文本相似性检测方法、装置、设备及存储介质
Maarif et al. Complexity algorithm analysis for edit distance
CN115906863A (zh) 基于对比学习的情感分析方法、装置、设备以及存储介质
CN108073704B (zh) 一种liwc词表扩展方法
JP2021163477A (ja) 画像処理方法及び装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム
CN117271755B (zh) 基于人工智能的客诉闭环规则引擎管理控制方法
CN117390173B (zh) 一种语义相似度匹配的海量简历筛选方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant