CN116631612A - 一种基于多图融合的图卷积草药推荐方法及计算机 - Google Patents
一种基于多图融合的图卷积草药推荐方法及计算机 Download PDFInfo
- Publication number
- CN116631612A CN116631612A CN202310682914.XA CN202310682914A CN116631612A CN 116631612 A CN116631612 A CN 116631612A CN 202310682914 A CN202310682914 A CN 202310682914A CN 116631612 A CN116631612 A CN 116631612A
- Authority
- CN
- China
- Prior art keywords
- symptom
- herbal
- occurrence
- graph
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 241000411851 herbal medicine Species 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000004927 fusion Effects 0.000 title claims abstract description 27
- 208000024891 symptom Diseases 0.000 claims abstract description 457
- 230000007246 mechanism Effects 0.000 claims abstract description 14
- 239000003814 drug Substances 0.000 claims description 71
- 239000013598 vector Substances 0.000 claims description 26
- 235000008216 herbs Nutrition 0.000 claims description 22
- 230000009466 transformation Effects 0.000 claims description 22
- 238000010586 diagram Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 20
- 230000014509 gene expression Effects 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000005096 rolling process Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000003993 interaction Effects 0.000 claims description 8
- 210000005036 nerve Anatomy 0.000 claims description 7
- 208000011580 syndromic disease Diseases 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims 2
- 238000007499 fusion processing Methods 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241000721047 Danaus plexippus Species 0.000 description 1
- 206010012735 Diarrhoea Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 206010067171 Regurgitation Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 230000008846 dynamic interplay Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/90—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Epidemiology (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Evolutionary Computation (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Computational Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pathology (AREA)
- Alternative & Traditional Medicine (AREA)
- Medicinal Chemistry (AREA)
- Algebra (AREA)
- Pharmacology & Pharmacy (AREA)
- Chemical & Material Sciences (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及一种基于多图融合的图卷积草药推荐方法及计算机,本发明具有以下有益效果:本申请提出一种基于多图融合的图卷积草药推荐方法,通过构建共现图,能够快速、高效地对症状数据以及草药数据之间地关系进行整合,并且在图嵌入的融合过程中,在草药侧融合进入知识图嵌入,能够使模型进一步感知草药之间的相互联系,进一步提高模型推荐的准确性。通过利用多头注意力机制,能够提高模型的泛化能力。
Description
技术领域
本发明涉及深度学习技术领域,更具体地说,它涉及一种基于多图融合的图卷积草药推荐方法及计算机。
背景技术
随着人口的大量增长,医疗资源紧张成为了不可忽视的问题。但借助人工智能技术为医生给病人的诊断和制定治疗方案提供辅助决策,可以提升就医效率,缓解就医困难的问题。
中医作为一门古老的,被接受程度高的,治疗成本相对低的医学,在中国的医疗体系中占据了很重要的地位。并且中医在长期的发展过程中,集先辈的经验和智慧于一身,为维护中国人民的健康发挥了重要作用。因此,中医诊疗所需要的知识是浩瀚而复杂的。它需要了解基本原理和理论,以及中医从业者的实践经验。因此,在中医中使用人工智能有助于捕捉和整合经验和理论知识,从而有可能提高中医治疗的有效性和效率。
在中医中,疾病的诊断和治疗主要基于:望、闻、问、切,即“四诊”。知道了病人的症状后,就会推导出几种证候,这是开方的前提。中医治疗的基本步骤之一是开出多种草药及其组合的处方,以达到预期的治疗效果。开方时要考虑患者的症状以及草药的性味、归经等,以及基于相生相克的原则。因此,方剂中的每一种草药都有不同的作用,例如“君”(起主要作用)、“臣”(辅助主要作用)、“佐”(用于消除或减缓其他草药的药力)和“使”(将方剂中的草药引向疾病),反映了不同草药之间复杂而动态的相互作用。
在传统的推荐任务中,已经提出了大量针对不同对象的推荐***,如视频推荐和书籍推荐。这些推荐任务的全部或部分数据集由用户和项目之间的交互信息组成。他们输出单个用户对某个项目感兴趣的概率,然而,用于草药推荐任务的数据集中的每个处方数据都涉及一组草药和一组症状,这需要草药推荐者根据其性质考虑症状和草药相互作用之间的隐含关系。到目前为止,解决草药推荐问题的方法主要有主题模型和图神经网络。
其中,基于主题模型的方法假设每个中医处方都可以由潜在主题的混合表示,这些主题对应于中医的不同证候和治疗方法。通过分析大量中医处方,这些方法可以了解症状在证候上的分布以及草药在治疗上的分布,然后使用它们来推断最适合一组给定症状的草药。但主题模型局限性在于,这种词袋模型很难描述症状与草药之间错综复杂的关系。
在过去的几十年里,推荐***中占主导地位的建模范式已经从邻域方法转变为基于表示学习方法。基于表示学习的方法旨在将项目和用户表示为共享空间中的向量。在这个领域,深度学习模型已经成为主流方法论。从图的角度考虑推荐***中的数据的深度学习算法之一称为图神经网络。推荐***中的大部分数据基本上都是图的形式,比如用户和物品之间的交互,可以用二分图来表示,交互用链接来表示。当包含结构化外部信息(尤其是知识图谱)时,图学习方法的优势变得尤为明显。因此,图神经网络得到了广泛的应用,因为它们可以有效地捕获用户和项目之间的复杂关系和交互。在草药推荐任务中,数据集由一组症状和一组草药组成,而不是单个用户于与一组物品的交互信息,将这种数据建模成图结构具有一定的困难性,以及难以将辅助信息与数据表示在同一图中。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种基于多图融合的图卷积草药推荐方法及计算机,以克服现有的技术中存在的数据集难以构建成为图结构、难以将辅助信息以及数据表示在同一张图中的缺点。
本发明的上述技术目的是通过以下技术方案得以实现的:一种基于多图融合的图卷积草药推荐方法,包括:
S1、收集中医处方数据,根据所述中医处方数据,构建症状表示侧的症状-症状共现图以及第一症状-草药共现图;根据所述中医处方数据,构建草药表示侧的草药-草药共现图、第二症状-草药共现图以及知识图;
S2、利用图卷积算法,对所述症状-症状共现图进行卷积,得到若干症状-症状共现图嵌入;对所述第一症状-草药共现图进行卷积,得到若干第一症状-草药共现图嵌入;对所述草药-草药共现图进行卷积,得到若干草药-草药共现图嵌入;对所述第二症状-草药共现图进行卷积,得到若干第二症状-草药共现图嵌入,对所述知识图进行卷积,得到若干知识图嵌入;
S3、利用注意力机制,将所有的症状-症状共现图嵌入以及所有的第一症状-草药共现图嵌入进行融合,得到症状侧图表示;利用注意力机制,将所有的草药-草药共现图嵌入、所有的第二症状-草药共现图嵌入以及所有的知识图嵌入进行融合,对应得到草药侧图表示;
S4、获取症状集,将所述症状集转化为多热码症状集,并将所述多热码症状集与所述症状侧图表示进行矩阵乘法,得到症状集表示;将所述症状集表示输入多层感知机,模拟症候推断,得到症候的表示;
S5、将所述症候的表示与草药侧图表示做交互,获得各个草药对应的推荐概率。
可选的,所述将所述症候的表示与草药侧图表示做交互,获得各个草药对应的推荐概率,包括:利用概率向量表示草药的推荐概率:
其中,是模型输出的M维度概率向量;θ是函数f(·)的可训练的参数,S为多热码症状集,用于指示症状是否存在;H={h1,h2,…,hM}表示中医处方数据中的所有草药的集合;在所述M维度概率向量中,向量的第i维的值表示草药hi能够治疗给定症状集的概率。
可选的,所述根据所述中医处方数据,构建症状表示侧的第一症状-草药共现图;根据所述中医处方数据,构建草药表示侧的第二症状-草药共现图;包括:
获取中医处方数据中的所有处方;
根据处方中出现的所有草药,构建草药集合H={h1,h2,…,hj};
根据处方中出现的所有症状,构建症状集合S={s1,s2,…,si};
根据每一个处方中草药与症状的共现情况,构建症状-草药共现边集S-H={(s1,h1),…,(s1,hj),…,(si,h1),…,(si,hj)};所述症状-草药共现边集中的元素的数学表示形式均为:
根据症状-草药共现边集,分别构建第一症状-草药共现图和第二症状-草药共现图。
可选的,所述根据所述中医处方数据,构建症状表示侧的症状-症状共现图,包括:
获取中医处方数据中的所有处方;
根据处方中出现的所有症状,构建症状集合S={s1,s2,…,si};
根据每一个处方中症状与症状的共现情况,建立若干症状对(si,sj),记录每一个症状对(si,sj)对应的出现次数T1;
将所述出现次数T1与预设的阈值TS相比对,获取所有出现次数大于阈值的症状对;
利用出现次数T1大于阈值TS的症状对构建症状-症状共现边集;
S-S={(s1,s1),…,(s1,si),…,(si,s1),…,(si,si)}
利用所述症状-症状共现边集,构建症状-症状共现图。
可选的,所述根据所述中医处方数据,构建症状表示侧的草药-草药共现图,包括:
获取中医处方数据中的所有处方;
根据处方中出现的所有草药,构建草药集合H={h1,h2,…,hj};
根据每一个处方中草药与草药的共现情况,建立若干草药对(hi,hj),记录每一个草药对(hi,hj)对应的出现次数T2;
将所述出现次数T2与预设的阈值TH相比对,获取所有出现次数大于阈值的草药对;
利用出现次数T2大于阈值TH的草药对构建草药-草药共现边集;
H-H={(h1,h1),…,(h1,hi),…,(hi,h1),…,(hi,hi)}
利用所述草药-草药共现边集,构建草药-草药共现图。
可选的,所述步骤S2,包括:
所述对所述第一症状-草药共现图进行卷积,得到若干第一症状-草药共现图嵌入,所对应的数学表达式为:
其中,表示在第一症状-草药共现图上的与某一个症状节点s相邻的草药节点的集合,/>表示在第一症状-草药共现图上与某一个症状节点s相邻的草药节点的节点数;/>表示第一症状-草药共现图中的草药节点h在第l-1层的嵌入;/>表示第一症状-草药共现图中的症状节点s在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述症状-症状共现图进行卷积,得到若干症状-症状共现图嵌入,所对应的数学表达式为:
其中,表示在症状-症状共现图上与某一个症状节点s相邻的症状节点的集合,/>表示在症状-症状共现图上与某一个症状节点s相邻的症状节点的节点数;/>表示症状-症状共现图中的症状节点s在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述第二症状-草药共现图进行卷积,得到若干第二症状-草药共现图嵌入,所对应的数学表达式为:
其中,表示在第二症状-草药共现图上与某一个草药节点h相邻的症状节点的集合,/>表示在第二症状-草药共现图上与某一个草药节点h相邻的症状节点的节点数;/>表示第二症状-草药共现图中的症状节点s在第l-1层的嵌入;/>表示第二症状-草药共现图中的草药节点h在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述草药-草药共现图进行卷积,得到若干草药-草药共现图嵌入,所对应的数学表达式为:
其中,表示在草药-草药共现图上与某一个草药节点h相邻的草药节点的集合,/>表示在草药-草药共现图上与某一个草药节点h相邻的草药节点的节点数;表示草药-草药共现图中的草药节点h在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述知识图进行卷积,得到若干知识图嵌入,所对应的数学表达式为:
其中,表示在知识图上与某一个草药节点h相邻的节点集合,/>表示在知识图上与某一个草药节点h相邻的节点数;/>表示知识图上的节点t在知识图中的第l-1层嵌入;/>表示知识图中的草药节点h在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数。
可选的,所述步骤S3,包括:
分别对所有的第一症状-草药共现图嵌入进行非线性变换,得到对应的第一症状-草药共现图非线性嵌入;分别对所有的症状-症状共现图嵌入进行非线性变换,得到对应的症状-症状共现图非线性嵌入;
利用多头神经注意力分别计算每一个第一症状-草药共现图非线性嵌入对应的第一权重以及每一个症状-症状共现图非线性嵌入对应的第二权重;
根据所述第一权重以及第二权重,利用softmax函数分别计算每一个第一症状-草药共现图非线性嵌入以及每一个症状-症状共现图非线性嵌入中包含的症状节点嵌入对应的第一影响分数;
根据所述第一影响分数以及对应的症状节点嵌入,加权求和得到症状侧图表示。
可选的,所述步骤S3,还包括:
分别对所有的第二症状-草药共现图嵌入进行非线性变换,得到对应的第二症状-草药共现图非线性嵌入;分别对所有的草药-草药共现图嵌入进行非线性变换,得到对应的草药-草药共现图非线性嵌入;分别对所有的知识图嵌入进行非线性变换,得到对应的知识图非线性嵌入;
利用多头神经注意力分别计算每一个第二症状-草药共现图嵌入对应的第三权重、每一个草药-草药共现图非线性嵌入对应的第四权重以及每一个知识图非线性嵌入对应的第五权重;
根据所述第三权重、第四权重以及第五权重,利用softmax函数分别计算每一个草药节点嵌入对应的第二影响分数;
根据所述第二影响分数以及对应的草药节点嵌入,加权求和得到草药侧图表示。
可选的,所述将所述症状集表示输入多层感知机,模拟症候推断,得到症候的表示,包括:
Ys=ReLU(W·avg_pool(S·eS)+b)
其中ReLU()表示激活函数,avg_pool()表示平均池化,W是用于对图嵌入做线性变换的矩阵,b是维度与avg_pool(S·eS)相同的向量,S表示症状集对应的多热向量,eS表示症状侧图表示,表示症候的表示;
所述将所述症候的表示与草药侧图表示做交互,获得各个草药对应的推荐概率,包括:计算所述症候的表示与草药侧图表示的矩阵乘法,得到概率向量:
其中,Ys表示症候的表示,eH表示草药侧图表示。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
综上所述,本发明具有以下有益效果:本申请提出一种基于多图融合的图卷积草药推荐方法,通过构建共现图,能够快速、高效地对症状数据以及草药数据之间地关系进行整合,并且在图嵌入的融合过程中,在草药侧融合进入知识图嵌入,能够使模型进一步感知草药之间的相互联系,进一步提高模型推荐的准确性。通过利用多头注意力机制,能够提高模型的泛化能力。
附图说明
图1为本发明的一种基于多图融合的图卷积草药推荐方法流程图;
图2为本发明实施例中计算机设备的内部结构图;
图3为本发明基于多图注意力融合的图卷积草药推荐算法模型图。
具体实施方式
为使本发明的目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方,或仅仅表示第一特征水平高度小于第二特征。术语“垂直的”、“水平的”、“左”、“右”、“上”、“下”以及类似的表述只是为了说明的目的,而不是指示或暗示所指装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
下面结合附图和实施例,对本发明进行详细描述。
本发明提供了一种基于多图融合的图卷积草药推荐方法,如图1所示,包括:
S1、收集中医处方数据,根据所述中医处方数据,构建症状表示侧的症状-症状共现图以及第一症状-草药共现图;根据所述中医处方数据,构建草药表示侧的草药-草药共现图、第二症状-草药共现图以及知识图;
具体来说,在本申请中,中医处方数据表示***的训练集。通常来说,每一个处方通常都用来治疗某一个病症,也就是说处方与病症为一一对应的关系。但是对于某一种病症,通常具备多种症状表示,如头晕、腹泻、反胃、发烧等,也就是说,病症与症状为一对多的对应关系。为了治疗某一种病症,处方上通常还会记录多种药物,其中某一种或者多种药物用于缓解或者某一种症状,还有一些药物用于相互配合达到中和药效或者激发药效的目的,因此在处方中,某一些药物通常都是成对出现,且一些药物与特定的症状也会成对出现。根据上述的处方特性,分别构建共现图,能够有效地反映出处方中的草药、症状之间的一些规律。共现图谱是一种数据可视化技术,常用于展示多个变量之间的关系和共同出现的模式。通过将多个变量之间的共现情况绘制成图表,可以帮助用户更直观地了解变量之间的关系和联系,并发现其中的规律和趋势。共现图谱通常采用网络图的形式展示,其中节点表示变量,边表示变量之间的共现关系。通过不同的布局和颜色等方式,可以展示不同的变量特征或者共现模式,帮助用户更好地理解和分析数据。共现图谱在多个领域中都有应用,如学术研究、社会网络分析、医学研究等。
S2、利用图卷积算法,对所述症状-症状共现图进行卷积,得到若干症状-症状共现图嵌入;对所述第一症状-草药共现图进行卷积,得到若干第一症状-草药共现图嵌入;对所述草药-草药共现图进行卷积,得到若干草药-草药共现图嵌入;对所述第二症状-草药共现图进行卷积,得到若干第二症状-草药共现图嵌入,对所述知识图进行卷积,得到若干知识图嵌入;
在本申请中,由于训练集也就是中医处方数据是一个特定的数据集,因此得到的第一症状-草药共现图以及第二症状-草药共现图的结构是相同的,可以看作是相同的共现图,但是在卷积过程中,其卷积算法是不相同的,因此卷积后得到的第一症状-草药共现图嵌入与第二症状-草药共现图嵌入的结构就出现了差异。图的嵌入代表着为图中每个节点分配一个可以代表该节点的多维向量,因此在实际卷积后,每一个共现图获得的图的嵌入与共现图中的节点数量相同。
S3、利用注意力机制,将症状-症状共现图嵌入以及第一症状-草药共现图嵌入进行融合,得到症状侧图表示;利用注意力机制,将草药-草药共现图嵌入、第二症状-草药共现图嵌入以及知识图嵌入进行融合,对应得到草药侧图表示;
在本申请中,采用注意力机制,分别将草药侧图嵌入以及症状测图嵌入进行融合,得到草药侧图表示以及症状侧图表示,其中在草药侧图表示中,不仅包含了草药-草药共现图、症状-草药共现图,还融合进来了知识图,使得模型能感知到推荐***中草药之间隐含的关系。
S4、获取症状集,将所述症状集转化为多热码症状集,并将所述多热码症状集与所述症状侧图表示进行矩阵乘法,得到症状集表示;将所述症状集表示输入多层感知机,模拟症候推断,得到症候的表示;
本模型的目的,就是首先利用中医处方数据集,学习病症与草药之间的对应关系,以及草药与草药之间的对应关系,得到训练后的模型,再给模型输入对应的症状,让模型根据症状,推断病人的病症,也就是症候。
S5、将所述症候的表示与草药侧图表示做交互,获得各个草药对应的推荐概率。
最后,利用症候与草药之间的对应关系,给出每一种草药的推荐概率,其中大于概率阈值的草药,可以组成草药的药方,给病人进行治病。
综上所述,本申请提出一种基于多图融合的图卷积草药推荐方法,通过构建共现图,能够快速、高效地对症状数据以及草药数据之间地关系进行整合,并且在图嵌入的融合过程中,在草药侧融合进入知识图嵌入,能够使模型进一步感知草药之间的相互联系,进一步提高模型推荐的准确性。
进一步的,所述将所述症候的表示与草药侧图表示做交互,获得各个草药对应的推荐概率,包括:利用概率向量表示草药的推荐概率:
其中,是模型输出的M维度概率向量;θ是函数f(·)的可训练的参数,S为多热码症状集,用于指示症状是否存在;H={h1,h2,…,hM}表示中医处方数据中的所有草药的集合;在所述M维度概率向量中,向量的第i维的值表示草药hi能够治疗给定症状集的概率。
进一步的,所述根据所述中医处方数据,构建症状表示侧的第一症状-草药共现图;根据所述中医处方数据,构建草药表示侧的第二症状-草药共现图;包括:
获取中医处方数据中的所有处方;
根据处方中出现的所有草药,构建草药集合H={h1,h2,…,hj};
根据处方中出现的所有症状,构建症状集合S={s1,s2,…,si};
根据每一个处方中草药与症状的共现情况,构建症状-草药共现边集S-H={(s1,h1),…,(s1,hj),…,(si,h1),…,(si,hj)};所述症状-草药共现边集中的元素的数学表示形式均为:
根据症状-草药共现边集,分别构建第一症状-草药共现图和第二症状-草药共现图。
在实际应用中,由于训练数据集为同一个数据集,因此构建共现图的时候,得到的第一症状-草药共现图以及第二症状-草药共现图的结构是完全相同的。草药与症状的共现情况,就是指在某一个处方中,某一种草药与某一个症状同时出现,即可把该草药与该症状认定为症状-草药对,以这种对应关系,建立症状-草药共现边集,并将共现边集转化为共现图,就是对应的症状-草药共现图。
进一步的,所述根据所述中医处方数据,构建症状表示侧的症状-症状共现图,包括:
获取中医处方数据中的所有处方;
根据处方中出现的所有症状,构建症状集合S={s1,s2,…,si};
根据每一个处方中症状与症状的共现情况,建立若干症状对(si,sj),记录每一个症状对(si,sj)对应的出现次数T1;
将所述出现次数T1与预设的阈值TS相比对,获取所有出现次数大于阈值的症状对;
利用出现次数T1大于阈值Ts的症状对构建症状-症状共现边集;
S-S={(s1,s1),…,(s1,si),…,(si,s1),…,(si,si)}
利用所述症状-症状共现边集,构建症状-症状共现图。
在实际应用中,由于某一种疾病通常会有多种症状,且症状与症状之间也会存在一定的相关性,因此建立症状-症状共现图能够更好地展现症状之间地关系。在本申请中,症状对(si,sj)所表示的就是在某一个处方中同时出现的两个不同的症状,si和sj均属于症状集合S中,在此不再赘述。由于任意两种症状是否存在关联性依然有待考证,因此可以根据处方中症状对出现的次数进行判断,当出现的次数大于阈值的情况下,可以先假定该症状对中的两种症状存在关联性,并让模型对该症状对进行感知。当确定好所有的症状对后,以症状对之间的共现关系,建立症状-症状共现图。
进一步的,所述根据所述中医处方数据,构建症状表示侧的草药-草药共现图,包括:
获取中医处方数据中的所有处方;
根据处方中出现的所有草药,构建草药集合H={h1,h2,…,hj};
根据每一个处方中草药与草药的共现情况,建立若干草药对(hi,hj),记录每一个草药对(hi,hj)对应的出现次数T2;
将所述出现次数T2与预设的阈值TH相比对,获取所有出现次数大于阈值的草药对;
利用出现次数T2大于阈值TH的草药对构建草药-草药共现边集;
H-H={(h1,h1),…,(h1,hi),…,(hi,h1),…,(hi,hi)}
利用所述草药-草药共现边集,构建草药-草药共现图。
在实际应用中,与症状对相似的,草药之间通常也存在一定的相互联系,同样草药对(hi,hj)中的两个元素hi和hj,也是代表着两种不同草药,且两种草药均属于草药集合H。
进一步的,所述步骤S2,包括:
所述对所述第一症状-草药共现图进行卷积,得到若干第一症状-草药共现图嵌入,所对应的数学表达式为:
其中,表示在第一症状-草药共现图上的与某一个症状节点s相邻的草药节点的集合,/>表示在第一症状-草药共现图上与某一个症状节点s相邻的草药节点的节点数;/>表示第一症状-草药共现图中的草药节点h在第l-1层的嵌入;/>表示第一症状-草药共现图中的症状节点s在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述症状-症状共现图进行卷积,得到若干症状-症状共现图嵌入,所对应的数学表达式为:
其中,表示在症状-症状共现图上与某一个症状节点s相邻的症状节点的集合,/>表示在症状-症状共现图上与某一个症状节点s相邻的症状节点的节点数;表示症状-症状共现图中的症状节点s在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述第二症状-草药共现图进行卷积,得到若干第二症状-草药共现图嵌入,所对应的数学表达式为:
其中,表示在第二症状-草药共现图上与某一个草药节点h相邻的症状节点的集合,/>表示在第二症状-草药共现图上与某一个草药节点h相邻的症状节点的节点数;/>表示第二症状-草药共现图中的症状节点s在第l-1层的嵌入;/>表示第二症状-草药共现图中的草药节点h在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述草药-草药共现图进行卷积,得到若干草药-草药共现图嵌入,所对应的数学表达式为:
其中,表示在草药-草药共现图上与某一个草药节点h相邻的草药节点的集合,/>表示在草药-草药共现图上与某一个草药节点h相邻的草药节点的节点数;表示草药-草药共现图中的草药节点h在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述知识图进行卷积,得到若干知识图嵌入,所对应的数学表达式为:
其中,表示在知识图上与某一个草药节点h相邻的节点集合,/>表示在知识图上与某一个草药节点h相邻的节点数;/>表示知识图上的节点t在知识图中的第l-1层嵌入;/>表示知识图中的草药节点h在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数。
具体来说,共现图上的节点就是指共现边集中的每一个单独的元素,共现图中存在连接关系的两个节点就代表连个节点之间存在共现关系;图卷积操作就是将共现图中每一个符合条件的节点作为中心节点,将与其存在共现关系的其他节点作为邻居节点,并且根据这些相邻信息,对这些节点进行加权求和,并且将得到的结果作为中心节点,替换原来的中心节点,对于一个共现图来说,每执行一次卷积操作,就可以看作图进入到下一层。因此在上面的五个表达式中,位于加号左侧的是中心节点的嵌入的权重,加号右边的是中心节点的邻居节点集合的权重,其中和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数,也就是说,这两个系数是通过损失函数的反馈,对应调整系数的取值,进而使模型更加准确的。在本申请中,变量/>的角标说明如下:y表示嵌入,右上角的角标代表嵌入的层数,右下角的角标包括两个内容,sh-s可以拆分为sh以及s,其中sh表示位于S-H共现图也就是症状-草药共现图中的某一个节点,后面的s代表的是该节点是症状节点,对应的,如果下角标是hh-h,那么就表示该嵌入位于草药-草药共现图中,且该节点表示一个草药节点。
进一步的,所述步骤S3,包括:
分别对所有的第一症状-草药共现图嵌入进行非线性变换,得到对应的第一症状-草药共现图非线性嵌入;分别对所有的症状-症状共现图嵌入进行非线性变换,得到对应的症状-症状共现图非线性嵌入;
利用多头神经注意力分别计算每一个第一症状-草药共现图非线性嵌入对应的第一权重以及每一个症状-症状共现图非线性嵌入对应的第二权重;
根据所述第一权重以及第二权重,利用softmax函数分别计算每一个第一症状-草药共现图非线性嵌入以及每一个症状-症状共现图非线性嵌入中包含的症状节点嵌入对应的第一影响分数;
根据所述第一影响分数以及对应的症状节点嵌入,加权求和得到症状侧图表示。
具体来说,非线性变换的表达式为:
e=tanh(W·y+b)
其中y表示经过先前图卷积操作后获得的图嵌入,W是用于对图嵌入做线性变换的矩阵,在此处,通过添加dropout层,这意味着作为多维向量的y,其每个维度上的标量有一定的概率p将不参与到矩阵乘法的计算中,这些被忽略的维度对结果不产生影响。b是维度与y相同的向量,tanh是激活函数,e是经过非线性变换的y。以症状侧为例,ysh-s通过该变换获得esh-s,yss-s通过该变换获得ess-s。
受注意力机制的启发,每张图对融合结果的贡献不同,本方法采用多头神经注意力来计算来自不同图的嵌入的加权和。以症状侧的图嵌入融合为例,S-H图嵌入的权重定义为:
α(esh-s,Es)=Watt esh-s
S-S图嵌入的权重定义为:
α(ess-s,Es)=Watt ess-s
症状嵌入esh-s来自变换后的非线性S-H图嵌入,症状嵌入ess-s来自换后的非线性S-S图嵌入,Es={esh-s,ess-s}是从S-H图和S-S图学习的症状嵌入的集合,Watt是可训练的参数,每一侧共享一个Watt,也就是说症状侧的两个Watt是相同的。
利用softmax用于获得最终影响分数:
softmax函数用于将多分类输出转化为概率,主要包括两个步骤,在函数的分子中,通过指数函数将实数输出映射到零到正无穷,在函数的分母中,将所有的结果相加并进行归一化。也就是说,最终影响分数其实际表示嵌入输出的概率。其中表示Es集合中的第i个元素,|Es|是用于学习症状嵌入的图的数量。
对集合Es中的元素计算加权平均,即可得到图嵌入的融合结果,也就是图的表示:
其中,es表示融合了症状侧的两个共现图中的所有图嵌入后的症状侧图表示。
进一步,还可以利用多头注意力机制,提高模型的泛化能力:
其中K是头部数量,是第k头的注意力因素。这意味着每个头的输出被平均。
进一步的,所述步骤S3,还包括:
分别对所有的第二症状-草药共现图嵌入进行非线性变换,得到对应的第二症状-草药共现图非线性嵌入;分别对所有的草药-草药共现图嵌入进行非线性变换,得到对应的草药-草药共现图非线性嵌入;分别对所有的知识图嵌入进行非线性变换,得到对应的知识图非线性嵌入;
利用多头神经注意力分别计算每一个第二症状-草药共现图嵌入对应的第三权重、每一个草药-草药共现图非线性嵌入对应的第四权重以及每一个知识图非线性嵌入对应的第五权重;
根据所述第三权重、第四权重以及第五权重,利用softmax函数分别计算每一个草药节点嵌入对应的第二影响分数;
根据所述第二影响分数以及对应的草药节点嵌入,加权求和得到草药侧图表示。
具体来说,在草药侧的融合与症状侧的融合是相同的,但是草药侧多了一个知识图,
在草药侧的S-H图嵌入的权重定义为:
α(esh-h,Eh)=Wattesh-h
H-H图嵌入的权重定义为:
α(ehh-h,Eh)=Wattehh-h
KG图嵌入的权重定义为:
α(ekg-h,Eh)=Wattekg-h
草药嵌入esh-h来自变换后的S-H图嵌入,草药嵌入ess-h来自变换后的S-S图嵌入,草药嵌入ekg-h来自变换后的KG图嵌入,Eh={esh-h,ess-h,ekg-h}是从S-H图、S-S图和KG图学习的讲过变换后的草药嵌入的集合,Watt是可训练的参数,草药侧的三个权重侧共享一个Watt,且草药侧的Watt与症状侧的Watt不一定相同。经过与症状侧相似的注意力机制计算,可获得草药的表示eh。
进一步的,所述将所述症状集表示输入多层感知机,模拟症候推断,得到症候的表示,包括:
Ys=ReLU(W·avg-pool(S·eS)+b)
其中ReLU()表示激活函数,avg_pool()表示平均池化,W是用于对图嵌入做线性变换的矩阵,b是维度与avg_pool(S·eS)相同的向量,S表示症状集对应的多热向量,eS表示症状侧图表示,表示症候的表示;
所述将所述症候的表示与草药侧图表示做交互,获得各个草药对应的推荐概率,包括:计算所述症候的表示与草药侧图表示的矩阵乘法,得到概率向量:
其中,YS表示症候的表示,eH表示草药侧图表示。
进一步的,本算法采用交叉损失熵作为损失函数:
其中H是数据集中的真实值,xi是概率向量第i维的标量,yi是真实值第i维的标量。
通过计算该损失函数,以更新模型中的可学习参数,使得模型输出结果更加准确。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图2所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机程序被处理器执行时以实现一种基于多图融合的图卷积草药推荐方法。
本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:包括:
S1、收集中医处方数据,根据所述中医处方数据,构建症状表示侧的症状-症状共现图以及第一症状-草药共现图;根据所述中医处方数据,构建草药表示侧的草药-草药共现图、第二症状-草药共现图以及知识图;
S2、利用图卷积算法,对所述症状-症状共现图进行卷积,得到若干症状-症状共现图嵌入;对所述第一症状-草药共现图进行卷积,得到若干第一症状-草药共现图嵌入;对所述草药-草药共现图进行卷积,得到若干草药-草药共现图嵌入;对所述第二症状-草药共现图进行卷积,得到若干第二症状-草药共现图嵌入,对所述知识图进行卷积,得到若干知识图嵌入;
S3、利用注意力机制,将所有的症状-症状共现图嵌入以及所有的第一症状-草药共现图嵌入进行融合,得到症状侧图表示;利用注意力机制,将所有的草药-草药共现图嵌入、所有的第二症状-草药共现图嵌入以及所有的知识图嵌入进行融合,对应得到草药侧图表示;
S4、获取症状集,将所述症状集转化为多热码症状集,并将所述多热码症状集与所述症状侧图表示进行矩阵乘法,得到症状集表示;将所述症状集表示输入多层感知机,模拟症候推断,得到症候的表示;
S5、将所述症候的表示与草药侧图表示做交互,获得各个草药对应的推荐概率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基于多图融合的图卷积草药推荐方法,其特征在于,包括:
S1、收集中医处方数据,根据所述中医处方数据,构建症状表示侧的症状-症状共现图以及第一症状-草药共现图;根据所述中医处方数据,构建草药表示侧的草药-草药共现图、第二症状-草药共现图以及知识图;
S2、利用图卷积算法,对所述症状-症状共现图进行卷积,得到若干症状-症状共现图嵌入;对所述第一症状-草药共现图进行卷积,得到若干第一症状-草药共现图嵌入;对所述草药-草药共现图进行卷积,得到若干草药-草药共现图嵌入;对所述第二症状-草药共现图进行卷积,得到若干第二症状-草药共现图嵌入,对所述知识图进行卷积,得到若干知识图嵌入;
S3、利用注意力机制,将所有的症状-症状共现图嵌入以及所有的第一症状-草药共现图嵌入进行融合,得到症状侧图表示;利用注意力机制,将所有的草药-草药共现图嵌入、所有的第二症状-草药共现图嵌入以及所有的知识图嵌入进行融合,对应得到草药侧图表示;
S4、获取症状集,将所述症状集转化为多热码症状集,并将所述多热码症状集与所述症状侧图表示进行矩阵乘法,得到症状集表示;将所述症状集表示输入多层感知机,模拟症候推断,得到症候的表示;
S5、将所述症候的表示与草药侧图表示做交互,获得各个草药对应的推荐概率。
2.根据权利要求1所述的一种基于多图融合的图卷积草药推荐方法,其特征在于,所述将所述症候的表示与草药侧图表示做交互,获得各个草药对应的推荐概率,包括:利用概率向量表示草药的推荐概率:
其中,是模型输出的M维度概率向量;θ是函数f(·)的可训练的参数,S为多热码症状集,用于指示症状是否存在;H={h1,h2,…,hM}表示中医处方数据中的所有草药的集合;在所述M维度概率向量中,向量的第i维的值表示草药hi能够治疗给定症状集的概率。
3.根据权利要求1所述的一种基于多图融合的图卷积草药推荐方法,其特征在于,
所述根据所述中医处方数据,构建症状表示侧的第一症状-草药共现图;根据所述中医处方数据,构建草药表示侧的第二症状-草药共现图;包括:
获取中医处方数据中的所有处方;
根据处方中出现的所有草药,构建草药集合H={h1,h2,…,hj};
根据处方中出现的所有症状,构建症状集合S={s1,s2,…,si};
根据每一个处方中草药与症状的共现情况,构建症状-草药共现边集S-H={(s1,h1),…,(s1,hj),…,(si,h1),…,(si,hj)};所述症状-草药共现边集中的元素的数学表示形式均为:
根据症状-草药共现边集,分别构建第一症状-草药共现图和第二症状-草药共现图。
4.根据权利要求1所述的一种基于多图融合的图卷积草药推荐方法,其特征在于,
所述根据所述中医处方数据,构建症状表示侧的症状-症状共现图,包括:
获取中医处方数据中的所有处方;
根据处方中出现的所有症状,构建症状集合S={s1,s2,…,si};
根据每一个处方中症状与症状的共现情况,建立若干症状对(si,sj),记录每一个症状对(si,sj)对应的出现次数T1;
将所述出现次数T1与预设的阈值TS相比对,获取所有出现次数大于阈值的症状对;
利用出现次数T1大于阈值TS的症状对构建症状-症状共现边集;
S-S={(s1,s1),…,(s1,si),…,(si,s1),…,(si,si)}
利用所述症状-症状共现边集,构建症状-症状共现图。
5.根据权利要求1所述的一种基于多图融合的图卷积草药推荐方法,其特征在于,
所述根据所述中医处方数据,构建症状表示侧的草药-草药共现图,包括:
获取中医处方数据中的所有处方;
根据处方中出现的所有草药,构建草药集合H={h1,h2,…,hj};
根据每一个处方中草药与草药的共现情况,建立若干草药对(hi,hj),记录每一个草药对(hi,hj)对应的出现次数T2;
将所述出现次数T2与预设的阈值TH相比对,获取所有出现次数大于阈值的草药对;
利用出现次数T2大于阈值TH的草药对构建草药-草药共现边集;
H-H={(h1,h1),…,(h1,hi),…,(hi,h1),…,(hi,hi)}
利用所述草药-草药共现边集,构建草药-草药共现图。
6.根据权利要求1所述的一种基于多图融合的图卷积草药推荐方法,其特征在于,所述步骤S2,包括:
所述对所述第一症状-草药共现图进行卷积,得到若干第一症状-草药共现图嵌入,所对应的数学表达式为:
其中,表示在第一症状-草药共现图上的与某一个症状节点s相邻的草药节点的集合,/>表示在第一症状-草药共现图上与某一个症状节点s相邻的草药节点的节点数;/>表示第一症状-草药共现图中的草药节点h在第l-1层的嵌入;/>表示第一症状-草药共现图中的症状节点s在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述症状-症状共现图进行卷积,得到若干症状-症状共现图嵌入,所对应的数学表达式为:
其中,表示在症状-症状共现图上与某一个症状节点s相邻的症状节点的集合,表示在症状-症状共现图上与某一个症状节点s相邻的症状节点的节点数;/>表示症状-症状共现图中的症状节点s在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述第二症状-草药共现图进行卷积,得到若干第二症状-草药共现图嵌入,所对应的数学表达式为:
其中,表示在第二症状-草药共现图上与某一个草药节点h相邻的症状节点的集合,/>表示在第二症状-草药共现图上与某一个草药节点h相邻的症状节点的节点数;表示第二症状-草药共现图中的症状节点s在第l-1层的嵌入;/>表示第二症状-草药共现图中的草药节点h在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述草药-草药共现图进行卷积,得到若干草药-草药共现图嵌入,所对应的数学表达式为:
其中,表示在草药-草药共现图上与某一个草药节点h相邻的草药节点的集合,表示在草药-草药共现图上与某一个草药节点h相邻的草药节点的节点数;/>表示草药-草药共现图中的草药节点h在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数;
所述对所述知识图进行卷积,得到若干知识图嵌入,所对应的数学表达式为:
其中,表示在知识图上与某一个草药节点h相邻的节点集合,/>表示在知识图上与某一个草药节点h相邻的节点数;/>表示知识图上的节点t在知识图中的第l-1层嵌入;/>表示知识图中的草药节点h在第l-1层的嵌入;/>和/>均为矩阵,均表示应用在第l层的根节点和邻居信息的可学习参数。
7.根据权利要求1所述的一种基于多图融合的图卷积草药推荐方法,其特征在于,所述步骤S3,包括:
分别对所有的第一症状-草药共现图嵌入进行非线性变换,得到对应的第一症状-草药共现图非线性嵌入;分别对所有的症状-症状共现图嵌入进行非线性变换,得到对应的症状-症状共现图非线性嵌入;
利用多头神经注意力分别计算每一个第一症状-草药共现图非线性嵌入对应的第一权重以及每一个症状-症状共现图非线性嵌入对应的第二权重;
根据所述第一权重以及第二权重,利用softmax函数分别计算每一个第一症状-草药共现图非线性嵌入以及每一个症状-症状共现图非线性嵌入中包含的症状节点嵌入对应的第一影响分数;
根据所述第一影响分数以及对应的症状节点嵌入,加权求和得到症状侧图表示。
8.根据权利要求1所述的一种基于多图融合的图卷积草药推荐方法,其特征在于,所述步骤S3,还包括:
分别对所有的第二症状-草药共现图嵌入进行非线性变换,得到对应的第二症状-草药共现图非线性嵌入;分别对所有的草药-草药共现图嵌入进行非线性变换,得到对应的草药-草药共现图非线性嵌入;分别对所有的知识图嵌入进行非线性变换,得到对应的知识图非线性嵌入;
利用多头神经注意力分别计算每一个第二症状-草药共现图嵌入对应的第三权重、每一个草药-草药共现图非线性嵌入对应的第四权重以及每一个知识图非线性嵌入对应的第五权重;
根据所述第三权重、第四权重以及第五权重,利用softmax函数分别计算每一个草药节点嵌入对应的第二影响分数;
根据所述第二影响分数以及对应的草药节点嵌入,加权求和得到草药侧图表示。
9.根据权利要求1所述的一种基于多图融合的图卷积草药推荐方法,其特征在于,所述将所述症状集表示输入多层感知机,模拟症候推断,得到症候的表示,包括:
Ys=ReLU(W.avg_pool(S.es)+b)
其中ReLU()表示激活函数,avg_pool()表示平均池化,W是用于对图嵌入做线性变换的矩阵,b是维度与avg_pool(S·eS)相同的向量,S表示症状集对应的多热向量,eS表示症状侧图表示,表示症候的表示;
所述将所述症候的表示与草药侧图表示做交互,获得各个草药对应的推荐概率,包括:计算所述症候的表示与草药侧图表示的矩阵乘法,得到概率向量:
其中,Ys表示症候的表示,eH表示草药侧图表示。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310682914.XA CN116631612B (zh) | 2023-06-09 | 2023-06-09 | 一种基于多图融合的图卷积草药推荐方法及计算机 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310682914.XA CN116631612B (zh) | 2023-06-09 | 2023-06-09 | 一种基于多图融合的图卷积草药推荐方法及计算机 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116631612A true CN116631612A (zh) | 2023-08-22 |
CN116631612B CN116631612B (zh) | 2024-03-19 |
Family
ID=87591966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310682914.XA Active CN116631612B (zh) | 2023-06-09 | 2023-06-09 | 一种基于多图融合的图卷积草药推荐方法及计算机 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116631612B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798954A (zh) * | 2020-06-11 | 2020-10-20 | 西北工业大学 | 基于时间注意力机制和图卷积网络的药物组合推荐方法 |
CN111951971A (zh) * | 2020-07-21 | 2020-11-17 | 中国传媒大学 | 一种中药和症状关系的数据挖掘方法 |
WO2021032220A2 (zh) * | 2019-08-20 | 2021-02-25 | 山东众阳健康科技集团有限公司 | 一种基于证素的中医辅助诊断*** |
CN113808693A (zh) * | 2021-09-10 | 2021-12-17 | 浙江科技学院 | 一种基于图神经网络和注意力机制的药物推荐方法 |
CN114121212A (zh) * | 2021-11-19 | 2022-03-01 | 东南大学 | 一种基于知识图谱和群表示学习的中药处方生成方法 |
CN114141361A (zh) * | 2021-12-03 | 2022-03-04 | 北京交通大学 | 基于症状术语映射与深度学习的中医处方推荐方法 |
US20220092413A1 (en) * | 2020-09-23 | 2022-03-24 | Beijing Wodong Tianjun Information Technology Co., Ltd. | Method and system for relation learning by multi-hop attention graph neural network |
CN114255851A (zh) * | 2021-12-22 | 2022-03-29 | 闽江学院 | 基于超图神经网络的中草药方剂推荐方法 |
CN114582458A (zh) * | 2022-01-24 | 2022-06-03 | 云南大学 | 一种中药配伍辅助决策方法及*** |
CN115171842A (zh) * | 2022-07-22 | 2022-10-11 | 华东师范大学 | 基于证候信息的图神经网络中药推荐方法 |
CN115292599A (zh) * | 2022-08-15 | 2022-11-04 | 山西大学 | 一种融合属性共现和交互行为特征的旅游景点推荐方法 |
CN115658912A (zh) * | 2022-09-21 | 2023-01-31 | 安徽科技学院 | 一种知识图谱的优化方法、***及储存介质 |
US20230077818A1 (en) * | 2021-09-13 | 2023-03-16 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method for establishing medicine synergism prediction model, prediction method and corresponding apparatus |
-
2023
- 2023-06-09 CN CN202310682914.XA patent/CN116631612B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021032220A2 (zh) * | 2019-08-20 | 2021-02-25 | 山东众阳健康科技集团有限公司 | 一种基于证素的中医辅助诊断*** |
CN111798954A (zh) * | 2020-06-11 | 2020-10-20 | 西北工业大学 | 基于时间注意力机制和图卷积网络的药物组合推荐方法 |
CN111951971A (zh) * | 2020-07-21 | 2020-11-17 | 中国传媒大学 | 一种中药和症状关系的数据挖掘方法 |
US20220092413A1 (en) * | 2020-09-23 | 2022-03-24 | Beijing Wodong Tianjun Information Technology Co., Ltd. | Method and system for relation learning by multi-hop attention graph neural network |
CN113808693A (zh) * | 2021-09-10 | 2021-12-17 | 浙江科技学院 | 一种基于图神经网络和注意力机制的药物推荐方法 |
US20230077818A1 (en) * | 2021-09-13 | 2023-03-16 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method for establishing medicine synergism prediction model, prediction method and corresponding apparatus |
CN114121212A (zh) * | 2021-11-19 | 2022-03-01 | 东南大学 | 一种基于知识图谱和群表示学习的中药处方生成方法 |
CN114141361A (zh) * | 2021-12-03 | 2022-03-04 | 北京交通大学 | 基于症状术语映射与深度学习的中医处方推荐方法 |
CN114255851A (zh) * | 2021-12-22 | 2022-03-29 | 闽江学院 | 基于超图神经网络的中草药方剂推荐方法 |
CN114582458A (zh) * | 2022-01-24 | 2022-06-03 | 云南大学 | 一种中药配伍辅助决策方法及*** |
CN115171842A (zh) * | 2022-07-22 | 2022-10-11 | 华东师范大学 | 基于证候信息的图神经网络中药推荐方法 |
CN115292599A (zh) * | 2022-08-15 | 2022-11-04 | 山西大学 | 一种融合属性共现和交互行为特征的旅游景点推荐方法 |
CN115658912A (zh) * | 2022-09-21 | 2023-01-31 | 安徽科技学院 | 一种知识图谱的优化方法、***及储存介质 |
Non-Patent Citations (2)
Title |
---|
JIN Y, ZHANG W, HE X, ET AL: "Syndrome-aware Herb Recommendation with Multi-graph Convolution Network", PROCEEDINGS OF THE 2020 IEEE 36TH INTERNATIONAL CONFERENCE ON DATA ENGINEERING, pages 145 - 156 * |
江钰哲,成全: "图嵌入式双层图卷积网络药物推荐模型", 计算机工程与应用, 1 March 2023 (2023-03-01), pages 1 - 11 * |
Also Published As
Publication number | Publication date |
---|---|
CN116631612B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xie et al. | Cooperative training of descriptor and generator networks | |
Tadeusiewicz et al. | Exploring neural networks with C | |
CN107016438B (zh) | 一种基于中医辨证人工神经网络算法模型的*** | |
CN107622485A (zh) | 一种融合深度张量神经网络的医学影像数据分析方法和*** | |
Moein | Medical diagnosis using artificial neural networks | |
CN111798954A (zh) | 基于时间注意力机制和图卷积网络的药物组合推荐方法 | |
Kirişci et al. | Decision making method related to Pythagorean Fuzzy Soft Sets with infectious diseases application | |
Emruli et al. | Analogical mapping and inference with binary spatter codes and sparse distributed memory | |
CN111339320B (zh) | 一种引入实体类型自动化表示的知识图谱嵌入与推理方法 | |
CN113808693A (zh) | 一种基于图神经网络和注意力机制的药物推荐方法 | |
Zhao et al. | Diagnose like a radiologist: Hybrid neuro-probabilistic reasoning for attribute-based medical image diagnosis | |
CN113673244A (zh) | 医疗文本处理方法、装置、计算机设备和存储介质 | |
Chernozhukov et al. | Applied causal inference powered by ML and AI | |
CN117034142B (zh) | 一种不平衡医疗数据缺失值填充方法及*** | |
CN116631612B (zh) | 一种基于多图融合的图卷积草药推荐方法及计算机 | |
Khaniki et al. | Enhancing Pneumonia Detection using Vision Transformer with Dynamic Mapping Re-Attention Mechanism | |
Leung et al. | Learning nonlinear multiregression networks based on evolutionary computation | |
Jang et al. | Observational learning algorithm for an ensemble of neural networks | |
CN110825903A (zh) | 一种改进哈希融合机制的视觉问答方法 | |
CN115862893A (zh) | 一种应用于药物推荐的深度学习方法、***、设备及介质 | |
CN115905953A (zh) | 状态数据处理方法、装置、计算机设备会和存储介质 | |
CN114121212B (zh) | 一种基于知识图谱和群表示学习的中药处方生成方法 | |
Hu | A web application for crowd counting by building parallel and direct connection-based CNN architectures | |
CN113822439A (zh) | 任务预测方法、装置、设备及存储介质 | |
Qi et al. | Qubit neural tree network with applications in nonlinear system modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |