CN114428836A - 信息处理方法、装置、可读存储介质及电子设备 - Google Patents
信息处理方法、装置、可读存储介质及电子设备 Download PDFInfo
- Publication number
- CN114428836A CN114428836A CN202111656674.3A CN202111656674A CN114428836A CN 114428836 A CN114428836 A CN 114428836A CN 202111656674 A CN202111656674 A CN 202111656674A CN 114428836 A CN114428836 A CN 114428836A
- Authority
- CN
- China
- Prior art keywords
- prescription
- chinese herbal
- self
- probability distribution
- herbal medicine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 25
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 241000411851 herbal medicine Species 0.000 claims abstract description 172
- 239000013598 vector Substances 0.000 claims abstract description 53
- 238000012795 verification Methods 0.000 claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 22
- 208000011580 syndromic disease Diseases 0.000 claims description 53
- 238000004590 computer program Methods 0.000 claims description 13
- 238000009472 formulation Methods 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 8
- 239000003814 drug Substances 0.000 abstract description 25
- 241000218671 Ephedra Species 0.000 description 17
- 235000006200 Glycyrrhiza glabra Nutrition 0.000 description 17
- 244000144725 Amygdalus communis Species 0.000 description 16
- 244000037364 Cinnamomum aromaticum Species 0.000 description 16
- 235000014489 Cinnamomum aromaticum Nutrition 0.000 description 16
- 235000020224 almond Nutrition 0.000 description 16
- 235000011437 Amygdalus communis Nutrition 0.000 description 14
- 230000007812 deficiency Effects 0.000 description 14
- 244000303040 Glycyrrhiza glabra Species 0.000 description 11
- LPLVUJXQOOQHMX-QWBHMCJMSA-N glycyrrhizinic acid Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@H](O[C@@H]1O[C@@H]1C([C@H]2[C@]([C@@H]3[C@@]([C@@]4(CC[C@@]5(C)CC[C@@](C)(C[C@H]5C4=CC3=O)C(O)=O)C)(C)CC2)(C)CC1)(C)C)C(O)=O)[C@@H]1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O LPLVUJXQOOQHMX-QWBHMCJMSA-N 0.000 description 11
- 235000011477 liquorice Nutrition 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 241000202807 Glycyrrhiza Species 0.000 description 6
- 235000001453 Glycyrrhiza echinata Nutrition 0.000 description 6
- 235000017382 Glycyrrhiza lepidota Nutrition 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 229940010454 licorice Drugs 0.000 description 6
- 210000004072 lung Anatomy 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 3
- 208000031975 Yang Deficiency Diseases 0.000 description 2
- 208000031971 Yin Deficiency Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 210000000952 spleen Anatomy 0.000 description 2
- 229940126680 traditional chinese medicines Drugs 0.000 description 2
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 208000037386 Typhoid Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 201000008297 typhoid fever Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/90—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Pharmacology & Pharmacy (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Pure & Applied Mathematics (AREA)
- Alternative & Traditional Medicine (AREA)
- Mathematical Optimization (AREA)
- Software Systems (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开涉及一种信息处理方法、装置、可读存储介质及电子设备。方法包括:获取自拟方剂对应的词袋向量,其中,所述自拟方剂包括多种中草药信息;根据所述词袋向量和每一所述中草药在方剂库中出现的概率,通过预先训练好的主题模型确定所述自拟方剂对应的目标主题概率分布;根据所述目标主题概率分布,生成针对所述自拟方剂的验证结果信息。这样,可以自动验证自拟方剂的用药搭配是否合理,从而辅助中医更安全的搭配中草药。另外,通过主题模型确定自拟方剂对应的目标主题概率分布,能够更加准确地对自拟方剂进行描述,从而提升针对自拟方剂的验证结果信息的准确度。
Description
技术领域
本公开涉及信息处理技术领域,具体地,涉及一种信息处理方法、装置、可读存储介质及电子设备。
背景技术
中医作为我国传统医学的瑰宝,凝结了上千年古人救死扶伤悬壶济世的宝贵经验。中医在诊疗过程中,非常核心的治疗手段就是通过多种不同的中草药配置出方剂,患者基于方剂熬制中药服用治疗疾病。方剂通常情况分类两种,一种是中医著作中记载的中医经典方剂,这类方剂通常由固定的几种中草药组成,另一种则是由中医根据患者的实际身体状态拟定的方剂,即自拟方剂。其中,每一种中草药通常会包含多种化学成分,不同中草药在搭配使用时,很有可能产生一些化学反应。尤其是在中医自拟方剂的过程中,由于诊疗水平参差不齐,很有可能因为中医自拟方剂时,没有完善的考虑中草药搭配使用过程中可能会对人体产生的一些不良反应。因此,如何通过计算机辅助中医更安全的搭配中草药成为了研究的关键。
发明内容
为了克服相关技术中存在的问题,本公开提供一种信息处理方法、装置、可读存储介质及电子设备。
为了实现上述目的,第一方面,本公开提供一种信息处理方法,包括:
获取自拟方剂对应的词袋向量,其中,所述自拟方剂包括多种中草药信息;
根据所述词袋向量和每一所述中草药在方剂库中出现的概率,通过预先训练好的主题模型确定所述自拟方剂对应的目标主题概率分布;
根据所述目标主题概率分布,生成针对所述自拟方剂的验证结果信息。
可选地,所述根据所述词袋向量和每一所述中草药在方剂库中出现的概率,通过预先训练好的主题模型确定所述自拟方剂对应的目标主题概率分布,包括:
将所述词袋向量输入到预先训练好的主题模型中,得到所述自拟方剂对应的主题-中草药概率分布;
根据所述主题-中草药概率分布和每一所述中草药在方剂库中出现的概率,确定所述自拟方剂对应的目标主题概率分布。
可选地,所述根据所述主题-中草药概率分布和每一所述中草药在方剂库中出现的概率,确定所述自拟方剂对应的目标主题概率分布,包括:
针对每一所述中草药,根据所述主题-中草药概率分布和该中草药在方剂库中出现的概率,确定该中草药属于每个主题的概率分布;
将每一所述中草药属于每个主题的概率分布的和确定为所述自拟方剂对应的目标主题概率分布。
可选地,所述根据所述主题-中草药概率分布和该中草药在方剂库中出现的概率,确定该中草药属于每个主题的概率分布,包括:
获取主题的边缘概率分布;
根据所述主题-中草药概率分布、该中草药在方剂库中出现的概率以及所述主题的边缘概率分布,基于贝叶斯定理确定该中草药属于每个主题的概率分布。
可选地,所述获取主题的边缘概率分布,包括:
获取所述方剂库中每一参考方剂对应的方剂-主题概率分布;
根据每一所述参考方剂对应的方剂-主题概率分布以及每一所述参考方剂被采用的概率,基于贝叶斯定理确定主题的边缘概率分布。
可选地,所述根据所述目标主题概率分布,生成针对所述自拟方剂的验证结果信息,包括:
获取所述方剂库中每一参考方剂对应的参考主题概率分布;
从所述方剂库中确定对应的参考主题概率分布与所述目标主题概率分布之间的相似度最高的N个参考方剂,其中,N大于1;
若所述相似度最高的N个参考方剂对应的证型中包含所述自拟方剂对应的证型,则确定所述自拟方剂验证通过;
若所述相似度最高的N个参考方剂对应的证型中不包含所述自拟方剂对应的证型,则确定所述自拟方剂验证失败。
可选地,所述获取自拟方剂对应的词袋向量,包括:
获取自拟方剂中每一中草药的重量;
根据每一所述中草药的重量,确定所述自拟方剂对应的词袋向量中每一中草药的出现次数;
针对每一所述中草药,根据该中草药的所述出现次数,生成该中草药对应的扩展序列,其中,所述扩展序列中的各元素均为该中草药,所述扩展序列的长度为该中草药的所述出现次数;
按照预设组合顺序,将每一所述中草药对应的扩展序列进行组合,得到自拟方剂对应的词袋向量。
第二方面,本公开提供一种信息处理装置,包括:
获取模块,用于获取自拟方剂对应的词袋向量,其中,所述自拟方剂包括多种中草药信息;
确定模块,用于根据所述获取模块获取到的所述词袋向量和每一所述中草药在方剂库中出现的概率,通过预先训练好的主题模型确定所述自拟方剂对应的目标主题概率分布;
生成模块,用于根据所述确定模块确定出的所述目标主题概率分布,生成针对所述自拟方剂的验证结果信息。
第三方面,本公开提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开第一方面提供的所述方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现本公开第一方面提供的所述方法的步骤。
在上述技术方案中,首先,获取自拟方剂对应的词袋向量,其中,自拟方剂包括多种中草药信息;然后,根据词袋向量和每一中草药在方剂库中出现的概率,通过预先训练好的主题模型确定自拟方剂对应的目标主题概率分布;最后,根据目标主题概率分布,生成针对自拟方剂的验证结果信息。这样,可以自动验证自拟方剂的用药搭配是否合理,从而辅助中医更安全的搭配中草药。另外,通过主题模型确定自拟方剂对应的目标主题概率分布,能够更加准确地对自拟方剂进行描述,从而提升针对自拟方剂的验证结果信息的准确度。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据一示例性实施例示出的一种信息处理方法的流程图。
图2是根据一示例性实施例示出的一种获取自拟方剂对应的词袋向量的方法的流程图。
图3是根据一示例性实施例示出的一种根据词袋向量和每一中草药在方剂库中出现的概率,通过预先训练好的主题模型确定自拟方剂对应的目标主题概率分布的方法的流程图。
图4是根据一示例性实施例示出的一种根据目标主题概率分布,生成针对自拟方剂的验证结果信息的方法的流程图。
图5是根据一示例性实施例示出的一种信息处理装置的框图。
图6是根据一示例性实施例示出的一种电子设备的框图。
图7是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
图1是根据一示例性实施例示出的一种信息处理方法的流程图。如图1所示,该方法包括以下S101~S103。
在S101中,获取自拟方剂对应的词袋向量,自拟方剂包括多种中草药信息。
在本公开中,自拟方剂是中医根据患者的实际身体状态拟定的方剂,并且,自拟方剂通常由多种中草药组成,其中,自拟方剂中的中草药成分和重量根据患者的实际身体情况确定。中草药信息可以包括中草药名称和中草药重量,自拟方剂对应的词袋向量由自拟方剂中的多种中草药名称构成,其可以根据自拟方剂中的多种中草药名称和各中草药的重量确定。
另外,可以将自拟方剂看作是文本挖掘中的“文本”,自拟方剂中的每种中草药看作是一个“词语”,中草药的重量看作是出现频率,同时,自拟方剂中所使用的中草药在中医诊疗体系中只考虑重量,不考虑先后顺序,由于词袋向量不考虑词语的先后顺序,非常匹配自拟方剂中关于中草药顺序的相关特征,所以本申请采用词袋向量对自拟方剂进行数据建模。
另外,词袋向量中各中草药名称之间可以采用逗号间隔,这样,自拟方剂在作为中文文本计算时,中文分词较为方便。
在S102中,根据词袋向量和每一中草药在方剂库中出现的概率,通过预先训练好的主题模型确定自拟方剂对应的目标主题概率分布。
在本公开中,方剂库可以是由中医经典方剂组成,其中,可以从《伤寒论》、《汤头歌诀》、《长沙方歌括》等中医类著作中搜集中医经典方剂,其中,中医经典方剂由固定的几种中草药组成,并且,认为中医经典方剂中的药品搭配是不会产生不良化学反应的组合。中草药在方剂库中出现的概率=方剂库中包含该中草药的方剂的数量/方剂库中方剂的总数量。
在S103中,根据目标主题概率分布,生成针对自拟方剂的验证结果信息。
在本公开中,验证结果信息可以包括验证通过和验证失败。
在上述技术方案中,首先,获取自拟方剂对应的词袋向量,其中,自拟方剂包括多种中草药信息;然后,根据词袋向量和每一中草药在方剂库中出现的概率,通过预先训练好的主题模型确定自拟方剂对应的目标主题概率分布;最后,根据目标主题概率分布,生成针对自拟方剂的验证结果信息。这样,可以自动验证自拟方剂的用药搭配是否合理,从而辅助中医更安全的搭配中草药。另外,通过主题模型确定自拟方剂对应的目标主题概率分布,能够更加准确地对自拟方剂进行描述,从而提升针对自拟方剂的验证结果信息的准确度。
下面针对上述S101中的获取自拟方剂对应的词袋向量的具体实施方式进行详细说明。具体来说,可以通过图2中所示的S1011~S1014来实现。
在S1011中,获取自拟方剂中每一中草药的重量。
在S1012中,根据每一中草药的重量,确定自拟方剂对应的词袋向量中每一中草药的出现次数。
在本公开中,可以先确定自拟方剂中各中草药的重量的整数比,然后,针对每一中草药,将整数比中与该中草药对应的比例值确定为自拟方剂对应的词袋向量中该中草药的出现次数。
在S1013中,针对每一中草药,根据该中草药的出现次数,生成该中草药对应的扩展序列。
在本公开中,扩展序列中的各元素均为该中草药,扩展序列的长度为该中草药的出现次数。
在S1014中,按照预设组合顺序,将每一中草药对应的扩展序列进行组合,得到自拟方剂对应的词袋向量。
在本公开中,预设组合顺序可以是自拟方剂中各中草药的先后顺序,也可以是自拟方剂中各中草药按照重量从大到小的顺序,还可以是自拟方剂中各中草药按照重量从小到大的顺序,对此,本公开不作具体限定。
示例地,自拟方剂由麻黄、桂枝、杏仁、甘草四种中草药构成,其中,麻黄的重量为9克,桂枝的重量为6克,杏仁的重量为5克,甘草的重量为2克,则该自拟方剂中各中草药的重量的整数比为9:6:5:2,即麻黄的重量:桂枝的重量:杏仁的重量:甘草的重量=9:6:5:2,则自拟方剂对应的词袋向量中麻黄的出现次数为9、桂枝的出现次数为6、杏仁的出现次数为5、甘草的出现次数为2;因此,麻黄对应的扩展序列为“麻黄,麻黄,麻黄,麻黄,麻黄,麻黄,麻黄,麻黄,麻黄”,桂枝对应的扩展序列为“桂枝,桂枝,桂枝,桂枝,桂枝,桂枝”,杏仁对应的扩展序列为“杏仁,杏仁,杏仁,杏仁,杏仁”,甘草对应的扩展序列为“甘草,甘草,甘草”;然后,按照自拟方剂中各中草药的先后顺序,将各中草药对应的扩展序列进行组合,得到的自拟方剂对应的词袋向量为{麻黄,麻黄,麻黄,麻黄,麻黄,麻黄,麻黄,麻黄,麻黄,桂枝,桂枝,桂枝,桂枝,桂枝,桂枝,杏仁,杏仁,杏仁,杏仁,杏仁,甘草,甘草,甘草}。
又示例地,自拟方剂由麻黄、桂枝、杏仁、甘草四种中草药构成,其中,麻黄的重量为1.5克,桂枝的重量为2.5克,杏仁的重量为3克,甘草的重量为2克,则该自拟方剂中各中草药的重量的整数比为3:5:6:4,即麻黄的重量:桂枝的重量:杏仁的重量:甘草的重量=3:5:6:4,则自拟方剂对应的词袋向量中麻黄的出现次数为3、桂枝的出现次数为5、杏仁的出现次数为6、甘草的出现次数为4;因此,麻黄对应的扩展序列为“麻黄,麻黄,麻黄”,桂枝对应的扩展序列为“桂枝,桂枝,桂枝,桂枝,桂枝”,杏仁对应的扩展序列为“杏仁,杏仁,杏仁,杏仁,杏仁,杏仁”,甘草对应的扩展序列为“甘草,甘草,甘草,甘草”;然后,自拟方剂中各中草药按照重量从大到小的顺序,将各中草药对应的扩展序列进行组合,得到的自拟方剂对应的词袋向量为{杏仁,杏仁,杏仁,杏仁,杏仁,杏仁,桂枝,桂枝,桂枝,桂枝,桂枝,甘草,甘草,甘草,甘草,麻黄,麻黄,麻黄}。
下面针对上述S102中的根据词袋向量和每一中草药在方剂库中出现的概率,通过预先训练好的主题模型确定自拟方剂对应的目标主题概率分布的具体实施方式进行详细说明。具体来说,可以通过图3中所示的S1021和S1022来实现。
在S1021中,将词袋向量输入到预先训练好的主题模型中,得到自拟方剂对应的主题-中草药概率分布。
在本公开中,主题模型可以例如是隐含狄利克雷分布(Latent DirichletAllocation,LDA)、概率隐含语义分析(Probability Latent Semantic Analysis,PLSA)等。其中,主题作为中间隐变量,在一定程度上表明自拟方剂中使用中草药的潜在的搭配规则;主题-中草药概率分布用于表征每个主题上中草药的概率分布。
在S1022中,根据主题-中草药概率分布和每一中草药在方剂库中出现的概率,确定自拟方剂对应的目标主题概率分布。
在本公开中,可以通过以下步骤(1)和步骤(2)来确定自拟方剂对应的目标主题概率分布:
(1)针对每一中草药,根据主题-中草药概率分布和该中草药在方剂库中出现的概率,确定该中草药属于每个主题的概率分布。
具体来说,可以先获取主题的边缘概率分布;然后,根据主题-中草药概率分布、该中草药在方剂库中出现的概率以及主题的边缘概率分布,基于贝叶斯定理确定该中草药属于每个主题的概率分布。
示例地,可以根据主题-中草药概率分布、该中草药在方剂库中出现的概率以及主题的边缘概率分布,基于贝叶斯定理,通过以下等式(1)来确定该中草药属于每个主题的概率分布:
P(主题|中草药i)=P(中草药i|主题)*P(主题)/P(中草药i)(1)
其中,中草药i为自拟方剂中的第i种中草药,P(主题|中草药i)为中草药i属于每个主题的概率分布;P(中草药i|主题)为自拟方剂对应的主题-中草药概率分布中与中草药i对应的主题-中草药概率分布,即每个主题上中草药i的概率分布;P(主题)为主题的边缘概率分布;P(中草药i)为中草药i在方剂库中出现的概率。
(2)将每一中草药属于每个主题的概率分布的和确定为自拟方剂对应的目标主题概率分布。
示例地,自拟方剂包括中草药1、中草药2、中草药3以及中草药4,则自拟方剂对应的目标主题概率分布=P(主题|中草药1)+P(主题|中草药2)+P(主题|中草药3)+P(主题|中草药4)。
下面针对上述步骤(1)中涉及的获取主题的边缘概率分布的具体实施方式进行详细说明。具体来说,可以通过以下步骤①和步骤②来实现:
①获取方剂库中每一参考方剂对应的方剂-主题概率分布。
在本公开中,方剂-主题概率分布是指参考方剂属于每个主题的概率分布。具体来说,可以针对每一参考方剂,采用与上述获取自拟方剂对应的词袋向量类似的方式获取该参考方剂对应的词袋向量,本公开不再赘述;然后,将该参考方剂对应的词袋向量输入到预先训练好的主题模型中,得到该参考方剂对应的方剂-主题概率分布。其中,主题模型的输出包括参考方剂对应的方剂-主题概率分布和该参考方剂对应的主题-中草药概率分布。
②根据每一参考方剂对应的方剂-主题概率分布以及每一参考方剂被采用的概率,基于贝叶斯定理确定主题的边缘概率分布。
示例地,可以根据每一参考方剂对应的方剂-主题概率分布以及每一参考方剂被采用的概率,基于贝叶斯定理,通过以下等式(2)来确定主题的边缘概率分布:
其中,P(主题|方剂j)为方剂库中的第j个参考方剂对应的方剂-主题概率分布,j=1,2,L,M,M为方剂库中方剂的总数量;P(方剂j)为方剂库中的第j个参考方剂被采用的概率。
方剂库中各参考方剂是独立存在的个体,各参考方剂被采用的概率符合独立同分布,因此,可以对各参考方剂被采用的概率进行相同赋值,例如,各参考方剂被采用的概率均为常数c,其中,0<c≤1。其中,为了简化计算,各参考方剂被采用的概率均赋值为1,即P(方剂j)=1,j=1,2,L,M。
另外,在第一次获取主题的边缘概率分布时,可以采用上述步骤①和步骤②来获取,之后,将获取到的主题的边缘概率分布后,可以将其存储到相应存储模块,这样,以后通过访问该存储模块即可快速获取到主题的边缘分布。
下面针对上述S103中的根据目标主题概率分布,生成针对自拟方剂的验证结果信息的具体实施方式进行详细说明。具体来说,可以通过图4中所示的S1031~S1035来实现。
在S1031中,获取方剂库中每一参考方剂对应的参考主题概率分布。
在本公开中,可以采用与上述S102中确定自拟方剂对应的目标主题概率分布类似的方式来确定方剂库中每一参考方剂对应的参考主题概率分布,本公开不再赘述。
在S1032中,从方剂库中确定对应的参考主题概率分布与目标主题概率分布之间的相似度最高的N个参考方剂。
在本公开中,N大于1。
示例地,可以通过欧式距离、余弦相似度等来衡量各参考方剂对应的参考主题概率分布与目标主题概率分布之间的相似度。
在S1033中,判断相似度最高的N个参考方剂对应的证型中是否包含自拟方剂对应的证型。
在本公开中,证型是指反映疾病在时空变化的具有病位、正因、病性与病势等病理内容的规范的“证”的表达形式,其中,证,即证候,是指疾病发展过程中某一个阶段的病理属性的概括。
若相似度最高的N个参考方剂对应的证型中包含自拟方剂对应的证型,则表明自拟方剂的用药搭配合理,此时,执行以下S1034;若相似度最高的N个参考方剂对应的证型中不包含自拟方剂对应的证型,则表明自拟方剂的用药搭配不合理,此时,则执行以下S1035。
在S1034中,确定自拟方剂验证通过。
在S1035中,确定自拟方剂验证失败。
示例地,N=3,自拟方剂L对应的证型为心血虚证,从方剂库中确定出的对应的参考主题概率分布与目标主题概率分布之间的相似度最高的3个参考方剂分别为参考方剂A、参考方剂B、参考方剂C,其中,参考方剂A对应的证型为心气虚证,参考方剂B对应的证型为心血虚证,参考方剂C对应的证型为肺气虚证。可见,相似度最高的3个参考方剂对应的证型包括心气虚证、心血虚证以及肺气虚证,其包括自拟方剂L对应的证型“心血虚证”,因此,可以确定上述自拟方剂L验证通过。
又示例地,N=4,自拟方剂K对应的证型为肺阴虚证,从方剂库中确定出的对应的参考主题概率分布与目标主题概率分布之间的相似度最高的4个参考方剂分别为参考方剂A、参考方剂B、参考方剂C以及参考方剂D,其中,参考方剂A对应的证型为心气虚证,参考方剂B对应的证型为心血虚证,参考方剂C对应的证型为肺气虚证,参考方剂D对应的证型为脾阳虚证。可见,相似度最高的4个参考方剂对应的证型包括心气虚证、心血虚证、肺气虚证以及脾阳虚证,其不包括自拟方剂K对应的证型“肺阴虚证”,因此,可以确定上述自拟方剂K验证失败。
图5是根据一示例性实施例示出的一种信息处理装置的框图。如图5所示,该装置500包括:
获取模块501,用于获取自拟方剂对应的词袋向量,其中,所述自拟方剂包括多种中草药信息;
确定模块502,用于根据所述获取模块501获取到的所述词袋向量和每一所述中草药在方剂库中出现的概率,通过预先训练好的主题模型确定所述自拟方剂对应的目标主题概率分布;
生成模块503,用于根据所述确定模块502确定出的所述目标主题概率分布,生成针对所述自拟方剂的验证结果信息。
在上述技术方案中,首先,获取自拟方剂对应的词袋向量,其中,自拟方剂包括多种中草药信息;然后,根据词袋向量和每一中草药在方剂库中出现的概率,通过预先训练好的主题模型确定自拟方剂对应的目标主题概率分布;最后,根据目标主题概率分布,生成针对自拟方剂的验证结果信息。这样,可以自动验证自拟方剂的用药搭配是否合理,从而辅助中医更安全的搭配中草药。另外,通过主题模型确定自拟方剂对应的目标主题概率分布,能够更加准确地对自拟方剂进行描述,从而提升针对自拟方剂的验证结果信息的准确度。
可选地,所述确定模块502包括:
输入子模块,用于将所述词袋向量输入到预先训练好的主题模型中,得到所述自拟方剂对应的主题-中草药概率分布;
第一确定子模块,用于根据所述主题-中草药概率分布和每一所述中草药在方剂库中出现的概率,确定所述自拟方剂对应的目标主题概率分布。
可选地,所述第一确定子模块包括:
第二确定子模块,用于针对每一所述中草药,根据所述主题-中草药概率分布和该中草药在方剂库中出现的概率,确定该中草药属于每个主题的概率分布;
第三确定子模块,用于将每一所述中草药属于每个主题的概率分布的和确定为所述自拟方剂对应的目标主题概率分布。
可选地,所述第二确定子模块包括:
第一获取子模块,用于获取主题的边缘概率分布;
第四确定子模块,用于根据所述主题-中草药概率分布、该中草药在方剂库中出现的概率以及所述主题的边缘概率分布,基于贝叶斯定理确定该中草药属于每个主题的概率分布。
可选地,所述第一获取子模块包括:
第二获取子模块,用于获取所述方剂库中每一参考方剂对应的方剂-主题概率分布;
第五确定子模块,用于根据每一所述参考方剂对应的方剂-主题概率分布以及每一所述参考方剂被采用的概率,基于贝叶斯定理确定主题的边缘概率分布。
可选地,所述生成模块503包括:
第三获取子模块,用于获取所述方剂库中每一参考方剂对应的参考主题概率分布;
第六确定子模块,用于从所述方剂库中确定对应的参考主题概率分布与所述目标主题概率分布之间的相似度最高的N个参考方剂,其中,N大于1;
第七确定子模块,用于若所述相似度最高的N个参考方剂对应的证型中包含所述自拟方剂对应的证型,则确定所述自拟方剂验证通过;
第八确定子模块,用于若所述相似度最高的N个参考方剂对应的证型中不包含所述自拟方剂对应的证型,则确定所述自拟方剂验证失败。
可选地,所述获取模块501包括:
第四获取子模块,用于获取自拟方剂中每一中草药的重量;
第九确定子模块,用于根据每一所述中草药的重量,确定所述自拟方剂对应的词袋向量中每一中草药的出现次数;
生成子模块,用于针对每一所述中草药,根据该中草药的所述出现次数,生成该中草药对应的扩展序列,其中,所述扩展序列中的各元素均为该中草药,所述扩展序列的长度为该中草药的所述出现次数;
组合子模块,用于按照预设组合顺序,将每一所述中草药对应的扩展序列进行组合,得到自拟方剂对应的词袋向量。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开提供的上述信息处理方法的步骤。
图6是根据一示例性实施例示出的一种电子设备600的框图。如图6所示,该电子设备600可以包括:处理器601,存储器602。该电子设备600还可以包括多媒体组件603,输入/输出(I/O)接口604,以及通信组件605中的一者或多者。
其中,处理器601用于控制该电子设备600的整体操作,以完成上述的信息处理方法中的全部或部分步骤。存储器602用于存储各种类型的数据以支持在该电子设备600的操作,这些数据例如可以包括用于在该电子设备600上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器602可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件603可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器602或通过通信组件605发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口604为处理器601和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件605用于该电子设备600与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G、4G、NB-IOT、eMTC、或其他5G等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件605可以包括:Wi-Fi模块,蓝牙模块,NFC模块等等。
在一示例性实施例中,电子设备600可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的信息处理方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的信息处理方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器602,上述程序指令可由电子设备600的处理器601执行以完成上述的信息处理方法。
图7是根据一示例性实施例示出的一种电子设备700的框图。例如,电子设备700可以被提供为一服务器。参照图7,电子设备700包括处理器722,其数量可以为一个或多个,以及存储器732,用于存储可由处理器722执行的计算机程序。存储器732中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理器722可以被配置为执行该计算机程序,以执行上述的信息处理方法。
另外,电子设备700还可以包括电源组件726和通信组件750,该电源组件726可以被配置为执行电子设备700的电源管理,该通信组件750可以被配置为实现电子设备700的通信,例如,有线或无线通信。此外,该电子设备700还可以包括输入/输出(I/O)接口758。电子设备700可以操作基于存储在存储器732的操作***,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM等等。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的信息处理方法的步骤。例如,该非临时性计算机可读存储介质可以为上述包括程序指令的存储器732,上述程序指令可由电子设备700的处理器722执行以完成上述的信息处理方法。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的信息处理方法的代码部分。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
Claims (10)
1.一种信息处理方法,其特征在于,包括:
获取自拟方剂对应的词袋向量,其中,所述自拟方剂包括多种中草药信息;
根据所述词袋向量和每一所述中草药在方剂库中出现的概率,通过预先训练好的主题模型确定所述自拟方剂对应的目标主题概率分布;
根据所述目标主题概率分布,生成针对所述自拟方剂的验证结果信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述词袋向量和每一所述中草药在方剂库中出现的概率,通过预先训练好的主题模型确定所述自拟方剂对应的目标主题概率分布,包括:
将所述词袋向量输入到预先训练好的主题模型中,得到所述自拟方剂对应的主题-中草药概率分布;
根据所述主题-中草药概率分布和每一所述中草药在方剂库中出现的概率,确定所述自拟方剂对应的目标主题概率分布。
3.根据权利要求2所述的方法,其特征在于,所述根据所述主题-中草药概率分布和每一所述中草药在方剂库中出现的概率,确定所述自拟方剂对应的目标主题概率分布,包括:
针对每一所述中草药,根据所述主题-中草药概率分布和该中草药在方剂库中出现的概率,确定该中草药属于每个主题的概率分布;
将每一所述中草药属于每个主题的概率分布的和确定为所述自拟方剂对应的目标主题概率分布。
4.根据权利要求3所述的方法,其特征在于,所述根据所述主题-中草药概率分布和该中草药在方剂库中出现的概率,确定该中草药属于每个主题的概率分布,包括:
获取主题的边缘概率分布;
根据所述主题-中草药概率分布、该中草药在方剂库中出现的概率以及所述主题的边缘概率分布,基于贝叶斯定理确定该中草药属于每个主题的概率分布。
5.根据权利要求4所述的方法,其特征在于,所述获取主题的边缘概率分布,包括:
获取所述方剂库中每一参考方剂对应的方剂-主题概率分布;
根据每一所述参考方剂对应的方剂-主题概率分布以及每一所述参考方剂被采用的概率,基于贝叶斯定理确定主题的边缘概率分布。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述根据所述目标主题概率分布,生成针对所述自拟方剂的验证结果信息,包括:
获取所述方剂库中每一参考方剂对应的参考主题概率分布;
从所述方剂库中确定对应的参考主题概率分布与所述目标主题概率分布之间的相似度最高的N个参考方剂,其中,N大于1;
若所述相似度最高的N个参考方剂对应的证型中包含所述自拟方剂对应的证型,则确定所述自拟方剂验证通过;
若所述相似度最高的N个参考方剂对应的证型中不包含所述自拟方剂对应的证型,则确定所述自拟方剂验证失败。
7.根据权利要求1-5中任一项所述的方法,其特征在于,所述获取自拟方剂对应的词袋向量,包括:
获取自拟方剂中每一中草药的重量;
根据每一所述中草药的重量,确定所述自拟方剂对应的词袋向量中每一中草药的出现次数;
针对每一所述中草药,根据该中草药的所述出现次数,生成该中草药对应的扩展序列,其中,所述扩展序列中的各元素均为该中草药,所述扩展序列的长度为该中草药的所述出现次数;
按照预设组合顺序,将每一所述中草药对应的扩展序列进行组合,得到自拟方剂对应的词袋向量。
8.一种信息处理装置,其特征在于,包括:
获取模块,用于获取自拟方剂对应的词袋向量,其中,所述自拟方剂包括多种中草药信息;
确定模块,用于根据所述获取模块获取到的所述词袋向量和每一所述中草药在方剂库中出现的概率,通过预先训练好的主题模型确定所述自拟方剂对应的目标主题概率分布;
生成模块,用于根据所述确定模块确定出的所述目标主题概率分布,生成针对所述自拟方剂的验证结果信息。
9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111656674.3A CN114428836A (zh) | 2021-12-30 | 2021-12-30 | 信息处理方法、装置、可读存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111656674.3A CN114428836A (zh) | 2021-12-30 | 2021-12-30 | 信息处理方法、装置、可读存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114428836A true CN114428836A (zh) | 2022-05-03 |
Family
ID=81311716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111656674.3A Pending CN114428836A (zh) | 2021-12-30 | 2021-12-30 | 信息处理方法、装置、可读存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114428836A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104391877A (zh) * | 2014-10-31 | 2015-03-04 | 小米科技有限责任公司 | 查找主题的方法、装置、终端和服务器 |
CN108710613A (zh) * | 2018-05-22 | 2018-10-26 | 平安科技(深圳)有限公司 | 文本相似度的获取方法、终端设备及介质 |
CN109448808A (zh) * | 2018-08-29 | 2019-03-08 | 北京大学 | 一种基于多视图主题建模技术的异常处方筛选方法 |
CN109635100A (zh) * | 2018-12-24 | 2019-04-16 | 上海仁静信息技术有限公司 | 一种相似题目的推荐方法、装置、电子设备及存储介质 |
CN111177334A (zh) * | 2019-11-29 | 2020-05-19 | 厦门快商通科技股份有限公司 | 医美主题切换方法、装置、设备及存储介质 |
CN113342942A (zh) * | 2021-08-02 | 2021-09-03 | 平安科技(深圳)有限公司 | 语料自动化获取方法、装置、计算机设备及存储介质 |
CN113761193A (zh) * | 2021-05-18 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 日志分类方法、装置、计算机设备和存储介质 |
-
2021
- 2021-12-30 CN CN202111656674.3A patent/CN114428836A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104391877A (zh) * | 2014-10-31 | 2015-03-04 | 小米科技有限责任公司 | 查找主题的方法、装置、终端和服务器 |
CN108710613A (zh) * | 2018-05-22 | 2018-10-26 | 平安科技(深圳)有限公司 | 文本相似度的获取方法、终端设备及介质 |
CN109448808A (zh) * | 2018-08-29 | 2019-03-08 | 北京大学 | 一种基于多视图主题建模技术的异常处方筛选方法 |
CN109635100A (zh) * | 2018-12-24 | 2019-04-16 | 上海仁静信息技术有限公司 | 一种相似题目的推荐方法、装置、电子设备及存储介质 |
CN111177334A (zh) * | 2019-11-29 | 2020-05-19 | 厦门快商通科技股份有限公司 | 医美主题切换方法、装置、设备及存储介质 |
CN113761193A (zh) * | 2021-05-18 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 日志分类方法、装置、计算机设备和存储介质 |
CN113342942A (zh) * | 2021-08-02 | 2021-09-03 | 平安科技(深圳)有限公司 | 语料自动化获取方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7089014B2 (ja) | 健康データを匿名化し、分析のために地理的領域を横断して健康データを修正及び編集するシステム及び方法 | |
CN109906449B (zh) | 一种查找方法及装置 | |
CN109273098B (zh) | 一种基于智能决策的药品疗效预测方法和装置 | |
KR20210107150A (ko) | 생리학적 데이터의 제시 | |
CN111933302B (zh) | 药物推荐方法、装置、计算机设备及存储介质 | |
CN109801690A (zh) | 区域医疗电子病历共享整合查询***及方法 | |
CN111785383B (zh) | 数据处理方法及相关设备 | |
Verbeeck et al. | Unbiasedness and efficiency of non-parametric and UMVUE estimators of the probabilistic index and related statistics | |
CN113658662A (zh) | 基于用药大数据的配药方法、装置、设备及存储介质 | |
WO2018006629A1 (zh) | 一种药方匹配方法和装置、一种用于药方匹配的装置 | |
Tychalas et al. | Planning and development of an electronic health record client based on the android platform | |
CN105701330A (zh) | 健康信息处理方法及*** | |
CN114428836A (zh) | 信息处理方法、装置、可读存储介质及电子设备 | |
CN111785343A (zh) | 随访方法、装置、电子设备及存储介质 | |
CN109473154B (zh) | 基于知识关系分析的诊后提醒方法及终端设备 | |
KR20220072050A (ko) | 인공지능 주치의 서비스 프로그램 기록매체 | |
KR20220069327A (ko) | 유전자 검사 정보를 반영한 건강 관리 서비스 제공 장치의 동작 방법 | |
Hanada | Hospital information systems: the past, present, and future | |
Nguyen et al. | A Case Study on Web-based Analytic Workflow in Big Data Platform | |
US11670412B2 (en) | Treatment adherence systems and processes | |
Al-Shaher et al. | Design and Implementation of Android Application to Thi-Qar Doctors Guide and Resident Pharmacies | |
CN116504414B (zh) | 医疗数据查询方法、装置、电子设备以及存储介质 | |
CN109308694B (zh) | 骨折分型的形成方法及装置 | |
CN113345549A (zh) | 远程医疗的药物获取方法及相关产品 | |
KR20220071339A (ko) | 개인화된 자가 컨텐츠를 이용한 건강 관리 서비스 제공 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220503 |