CN113035363A - 一种概率密度加权的遗传代谢病筛查数据混合采样方法 - Google Patents

一种概率密度加权的遗传代谢病筛查数据混合采样方法 Download PDF

Info

Publication number
CN113035363A
CN113035363A CN202110320400.0A CN202110320400A CN113035363A CN 113035363 A CN113035363 A CN 113035363A CN 202110320400 A CN202110320400 A CN 202110320400A CN 113035363 A CN113035363 A CN 113035363A
Authority
CN
China
Prior art keywords
positive
sampling
data
samples
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110320400.0A
Other languages
English (en)
Other versions
CN113035363B (zh
Inventor
尹建伟
林博
舒强
李莹
邓水光
蒋萍萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202110320400.0A priority Critical patent/CN113035363B/zh
Publication of CN113035363A publication Critical patent/CN113035363A/zh
Application granted granted Critical
Publication of CN113035363B publication Critical patent/CN113035363B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种概率密度加权的遗传代谢病筛查数据混合采样方法,该方法利用基于特征惩罚的方法估计每个特征的重要性,在采样时对特征空间的各个方向进行加权;同时,估计阳性样本的分布情况,并将概率密度分布作为样本生成的依据,使得采样生成的样本与整体阳性样本分布较为一致。本发明的方法能够根据不同疾病的特征重要性在特征空间上进行加权,且所生成的阳性样本更加符合真实的人口统计学分布情况。相比于现有采样方法,采用本发明所生成的数据进行建模,初筛阳性率能降低约0.5%左右。

Description

一种概率密度加权的遗传代谢病筛查数据混合采样方法
技术领域
本发明属于采样方法技术领域,涉及一种混合采样方法,尤其涉及一种概率密度加权的遗传代谢病筛查数据混合采样方法。
背景技术
串联质谱技术是一种高敏感性、高选择性和高通量的血液生化物质浓度检测技术,在一次实验室检验中,串联质谱法可以同时测定几十种遗传代谢病相关代谢物的血液浓度(筛查指标),对几十种遗传代谢病做出同步诊断。随着人工智能技术的发展,近年来越来越多的学术研究和商业化产品将机器学习、数据挖掘等方法应用于医疗行业,旨在打造新一代智慧医疗模式,让机器更加精准高效地辅助医生判读和诊断疾病。然而,遗传代谢病的人群发病率较低,使得各医院或筛查中心积攒的阳性样本数量十分有限,无法满足许多机器学习特别是深度学习方法对数据量的要求,导致模型无法达到实际性能,甚至预测失败。
目前针对正负样本不均衡和阳性样本过少的问题,采样方法是一个常用的解决手段。现有的采样方法大多使用欧氏距离对正负样本点进行度量,这默认了特征空间的所有方向具有相同的重要性,但在遗传代谢病筛查数据中,病种对特征的响应各不相同,简单地使用欧式距离对数据采样反而容易产生噪音数据;另外,现有的采样方法一般随机地对数据进行采样,或者特别关注正负样本边界的情况,但在遗传代谢病筛查数据中,这些假设没有考虑人群分布规律,不符合实际情况,随机采样产生的数据将导致数据集的分布出现变化,容易对模型产生负面影响。在遗传代谢病筛查这个场景中,现有采样方法存在两个问题:特征空间的所有方向重要性相同、采样的随机性影响数据分布,导致采样生成的样本不符合数据的实际分布,影响建模的效果。
发明内容
本发明的目的在于针对现有技术的不足,提供一种概率密度加权的遗传代谢病筛查数据混合采样方法,利用基于特征惩罚的方法估计每个特征的重要性,在采样时对特征空间的各个方向进行加权;同时,估计阳性样本的分布情况,并将概率密度分布作为样本生成的依据,使得采样生成的样本与整体阳性样本分布较为一致。最终使生成的采样数据更符合人口统计学的真实情况,从而提高建模的准确度。
本发明采用的技术方案如下:
一种概率密度加权的遗传代谢病筛查数据混合采样方法,包括:首先针对一种遗传代谢病,计算历史数据库中串联质谱检测数据的阳性样本数量、阴性样本数量,并分割获得训练数据集、测试集,确定混合采样的迭代次数和每次迭代的采样数量;使用串联质谱检测数据对逻辑回归算法进行训练,基于特征惩罚的方法估计每个特征的重要性;估计阳性样本的分布情况,并将概率密度分布作为样本生成的依据,根据采样概率随机生成阳性样本,获得混合采样结果。
具体的,所述混合采样方法包括如下:
首先确定全局参数
确定混合采样的迭代次数i,确定本次采样方法所针对的一种遗传代谢病D,计算历史数据库中串联质谱检测数据的阳性样本数量
Figure BDA0002992578450000021
阴性样本数量
Figure BDA0002992578450000022
并分割获得训练数据集、测试数据集;
每次迭代的采样数量
Figure BDA0002992578450000023
为:
Figure BDA0002992578450000024
对于每次迭代,重复进行以下步骤:
(1)数据特征重要性评估
对于遗传代谢病D,使用串联质谱检测数据对逻辑回归算法进行训练,并将算法的损失函数
Figure BDA0002992578450000025
定义为:
Figure BDA0002992578450000026
其中J为交叉熵函数,X为训练数据集,y为数据标签,y=1表示阳性数据,y=0表示阴性数据,W为数据特征对应的权重,λ>0为惩罚系数。
上述逻辑回归算法使用随机梯度下降法作为模型优化器,该模型迭代次数由输入数据量的大小及拟合曲线决定。
上述逻辑回归算法完成模型参数优化后,将每个特征的最优权重值W作为面向D的数据特征重要性评估。
(2)阳性样本分布估计
D的阳性样本先验分布设定为:
Xpos~Np(μ,Σ)
其中p表示样本Xpos=(X1,…,Xp)中筛查指标的数量,μ,Σ为待确定参数。
对于先验分布
Figure BDA0002992578450000031
参数估计为:
Figure BDA0002992578450000032
Figure BDA0002992578450000033
其中
Figure BDA0002992578450000034
是μ的估计值,
Figure BDA0002992578450000035
是Σ的估计值,X(m)是Xpos中第m个标记为阳性的样本。
(3)单个阳性样本生成方法
对于一个阳性样本X(m),执行以下步骤:
计算该阳性样本与剩余所有阳性样本之间的距离,距离的计算方法为:
Figure BDA0002992578450000036
其中X(n)表示除X(m)以外任意一个标记为阳性的样本,°表示哈达玛积,
Figure BDA0002992578450000037
表示2范数。
选出与X(m)距离最小的k个阳性样本(k>1),然后从k个阳性样本中随机挑选一个阳性样本
Figure BDA0002992578450000038
用于生成新的阳性样本X*,计算方法为:
Figure BDA0002992578450000039
其中标量δ的取值范围为(0,1)。
(4)阳性样本生成方法
重复执行步骤(3)
Figure BDA00029925784500000310
次,其中g为一个大于0.5的浮点数,共计得到
Figure BDA00029925784500000311
个备选阳性样本。
对于一个备选阳性样本X*,计算相应的采样概率R*
Figure BDA00029925784500000312
其中F表示标准正态分布的累积分布函数。
计算所有备选阳性样本的采样概率,并根据采样概率随机选择
Figure BDA0002992578450000041
个样本作为生成的阳性样本。
(5)混合采样
将步骤(4)生成的阳性样本和对应的标签(y=1)加入训练数据集X中;随机从阴性样本中删除
Figure BDA0002992578450000042
个样本,并更新训练数据集X。
本发明的有益效果是:
本发明设计了一种针对遗传代谢病筛查场景的数据混合采样方法,能够根据不同疾病的特征重要性在特征空间上进行加权,同时基于分布估计方法的采样所生成的阳性样本更加符合真实的人口统计学分布情况。相比于现有采样方法,采用本发明所生成的数据进行建模,初筛阳性率能降低约0.5%左右。
附图说明
图1是本发明方法的流程示意图;
具体实施方式
下面结合附图和具体实例对本发明做进一步的说明。
本发明的一种概率密度加权的遗传代谢病筛查数据混合采样方法,利用基于特征惩罚的方法估计每个特征的重要性,在采样时对特征空间的各个方向进行加权;同时,估计阳性样本的分布情况,并将概率密度分布作为样本生成的依据,如图1所示,本发明方法具体包括如下:
一、确定全局参数
确定混合采样的迭代次数i,i越大采样方法的计算速度越慢,得到采样结果的分布越符合真实情况;i越小采样方法的计算速度越快,得到采样结果包含的噪音数据越多;(本实例中i=1000)
确定本次采样方法所针对的一种遗传代谢病D,计算历史数据库中串联质谱检测数据的阳性样本数量
Figure BDA0002992578450000043
阴性样本数量
Figure BDA0002992578450000044
并分割获得训练数据集、测试数据集;
每次迭代的采样数量
Figure BDA0002992578450000045
为:
Figure BDA0002992578450000046
二、对于每次迭代,重复进行以下步骤:
(1)数据特征重要性评估
对于遗传代谢病D,使用串联质谱检测数据对逻辑回归算法进行训练,并将算法的损失函数
Figure BDA0002992578450000051
定义为:
Figure BDA0002992578450000052
其中J为交叉熵函数,X为训练数据集,y为数据标签(y=1表示阳性数据,y=0表示阴性数据),W为数据特征对应的权重,λ>0为惩罚系数。(本实例中λ=0.1)
上述逻辑回归算法使用随机梯度下降法作为模型优化器,该模型迭代次数由输入数据量的大小及拟合曲线决定。
上述逻辑回归算法完成模型参数优化后,将每个特征的最优权重值W作为面向D的数据特征重要性评估。
(2)阳性样本分布估计
D的阳性样本先验分布设定为:
Xpos~Np(μ,Σ)
其中p表示样本Xpos=(X1,…,Xp)中筛查指标的数量,μ,Σ为待确定参数。
对于先验分布
Figure BDA0002992578450000053
参数估计为:
Figure BDA0002992578450000054
Figure BDA0002992578450000055
其中
Figure BDA0002992578450000056
是μ的估计值,
Figure BDA0002992578450000057
是Σ的估计值,x(m)是xpos中第m个标记为阳性的样本。
(3)单个阳性样本生成方法
对于一个阳性样本X(m),执行以下步骤:
计算该阳性样本与剩余所有阳性样本之间的距离,距离的计算方法为:
Figure BDA0002992578450000058
其中X(n)表示除X(m)以外任意一个标记为阳性的样本,°表示哈达玛积,
Figure BDA0002992578450000059
表示2范数。
选出与X(m)距离最小的k个阳性样本(k>1),然后从k个阳性样本中随机挑选一个阳性样本
Figure BDA0002992578450000061
用于生成新的阳性样本X*,计算方法为:
Figure BDA0002992578450000062
其中标量δ的取值范围为(0,1)。(本实例中k=5)
(4)阳性样本生成方法
重复执行步骤(3)
Figure BDA0002992578450000063
次,其中g为一个大于0.5的浮点数,共计得到
Figure BDA0002992578450000064
个备选阳性样本。(本实例中g=1.5)
对于一个备选阳性样本X*,计算相应的采样概率R*
Figure BDA0002992578450000065
其中F表示标准正态分布的累积分布函数。
计算所有备选阳性样本的采样概率,并根据采样概率随机选择
Figure BDA0002992578450000066
个样本作为生成的阳性样本。
(5)混合采样
将步骤(4)生成的阳性样本和对应的标签(y=1)加入训练数据集X中;随机从阴性样本中删除
Figure BDA0002992578450000067
个样本,并更新训练数据集X。
采用本发明所生成的数据进行建模,初筛阳性率能降低约0.5%左右。

Claims (6)

1.一种概率密度加权的遗传代谢病筛查数据混合采样方法,其特征在于,包括:首先针对一种遗传代谢病,计算历史数据库中串联质谱检测数据的阳性样本数量、阴性样本数量,并分割获得训练数据集、测试集,确定混合采样的迭代次数和每次迭代的采样数量;使用串联质谱检测数据对逻辑回归算法进行训练,基于特征惩罚的方法估计每个特征的重要性;估计阳性样本的分布情况,并将概率密度分布作为样本生成的依据,根据采样概率随机生成阳性样本,获得混合采样结果。
2.根据权利要求1所述的概率密度加权的遗传代谢病筛查数据混合采样方法,其特征在于,首先确定全局参数:确定本次采样方法所针对的一种遗传代谢病D,计算历史数据库中串联质谱检测数据的阳性样本数量
Figure FDA0002992578440000011
阴性样本数量
Figure FDA0002992578440000012
并分割获得训练数据集、测试数据集;确定混合采样的迭代次数i,
每次迭代的采样数量
Figure FDA0002992578440000013
为:
Figure FDA0002992578440000014
3.根据权利要求1所述的概率密度加权的遗传代谢病筛查数据混合采样方法,其特征在于,对于每次迭代,首先进行数据特征重要性评估:
对于遗传代谢病D,使用串联质谱检测数据对逻辑回归算法进行训练,并将算法的损失函数
Figure FDA0002992578440000015
定义为:
Figure FDA0002992578440000016
其中J为交叉熵函数,X为训练数据集,y为数据标签,y=1表示阳性数据,y=0表示阴性数据,W为数据特征对应的权重,λ>0为惩罚系数,完成模型参数优化后,将每个特征的最优权重值W作为面向D的数据特征重要性评估。
4.根据权利要求3所述的概率密度加权的遗传代谢病筛查数据混合采样方法,其特征在于,每次迭代中,在数据特征重要性评估后,进行阳性样本分布估计并生成单个阳性样本:
D的阳性样本先验分布设定为:
Xpos~Np(μ,∑)
其中p表示样本Xpos=(X1,…,Xp)中筛查指标的数量,μ,∑为待确定参数;
对于先验分布
Figure FDA0002992578440000021
参数估计为:
Figure FDA0002992578440000022
Figure FDA0002992578440000023
其中
Figure FDA0002992578440000024
是μ的估计值,
Figure FDA0002992578440000025
是∑的估计值,X(m)是Xpos中第m个标记为阳性的样本;
对于一个阳性样本X(m),执行以下步骤:
计算该阳性样本与剩余所有阳性样本之间的距离,距离的计算方法为:
Figure FDA0002992578440000026
其中X(n)表示除X(m)以外任意一个标记为阳性的样本,
Figure FDA0002992578440000027
表示哈达玛积,
Figure FDA0002992578440000028
表示2范数;
选出与X(m)距离最小的k个阳性样本(k>1),然后从k个阳性样本中随机挑选一个阳性样本
Figure FDA0002992578440000029
用于生成新的阳性样本X*,计算方法为:
Figure FDA00029925784400000210
其中标量δ的取值范围为(0,1)。
5.根据权利要求4所述的概率密度加权的遗传代谢病筛查数据混合采样方法,其特征在于,基于概率密度生成阳性样本:
重复执行生成单个阳性样本的步骤
Figure FDA00029925784400000211
次,其中g为一个大于0.5的浮点数,共计得到
Figure FDA00029925784400000212
个备选阳性样本;
对于一个备选阳性样本X*,计算相应的采样概率R*
Figure FDA00029925784400000213
其中F表示标准正态分布的累积分布函数;
计算所有备选阳性样本的采样概率,并根据采样概率随机选择
Figure FDA00029925784400000214
个样本作为生成的阳性样本。
6.根据权利要求5所述的概率密度加权的遗传代谢病筛查数据混合采样方法,其特征在于,将生成的阳性样本和对应的数据标签加入训练数据集X中;随机从阴性样本中删除
Figure FDA0002992578440000031
个样本,并更新训练数据集X。
CN202110320400.0A 2021-03-25 2021-03-25 一种概率密度加权的遗传代谢病筛查数据混合采样方法 Active CN113035363B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110320400.0A CN113035363B (zh) 2021-03-25 2021-03-25 一种概率密度加权的遗传代谢病筛查数据混合采样方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110320400.0A CN113035363B (zh) 2021-03-25 2021-03-25 一种概率密度加权的遗传代谢病筛查数据混合采样方法

Publications (2)

Publication Number Publication Date
CN113035363A true CN113035363A (zh) 2021-06-25
CN113035363B CN113035363B (zh) 2024-01-02

Family

ID=76473765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110320400.0A Active CN113035363B (zh) 2021-03-25 2021-03-25 一种概率密度加权的遗传代谢病筛查数据混合采样方法

Country Status (1)

Country Link
CN (1) CN113035363B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170213000A1 (en) * 2016-01-25 2017-07-27 Shenzhen University Metabolic mass spectrometry screening method for diseases based on deep learning and the system thereof
WO2019100844A1 (zh) * 2017-11-22 2019-05-31 阿里巴巴集团控股有限公司 一种机器学习模型的训练方法、装置以及电子设备
CN110033860A (zh) * 2019-02-27 2019-07-19 杭州贝安云科技有限公司 一种基于机器学习的遗传代谢病检出率提升方法
CN111695626A (zh) * 2020-06-10 2020-09-22 湖南湖大金科科技发展有限公司 基于混合采样与特征选择的高维度不平衡数据分类方法
CN112151193A (zh) * 2020-10-22 2020-12-29 浙江大学 一种基于二次过滤的遗传代谢病特异性指标挖掘方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170213000A1 (en) * 2016-01-25 2017-07-27 Shenzhen University Metabolic mass spectrometry screening method for diseases based on deep learning and the system thereof
WO2019100844A1 (zh) * 2017-11-22 2019-05-31 阿里巴巴集团控股有限公司 一种机器学习模型的训练方法、装置以及电子设备
CN110033860A (zh) * 2019-02-27 2019-07-19 杭州贝安云科技有限公司 一种基于机器学习的遗传代谢病检出率提升方法
CN111695626A (zh) * 2020-06-10 2020-09-22 湖南湖大金科科技发展有限公司 基于混合采样与特征选择的高维度不平衡数据分类方法
CN112151193A (zh) * 2020-10-22 2020-12-29 浙江大学 一种基于二次过滤的遗传代谢病特异性指标挖掘方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李涛;郑尚;邹海涛;于化龙;: "基于概率密度估计的SMOTE改进算法研究", 南京师大学报(自然科学版), no. 01 *
闫慈;田翔华;阿拉依・阿汗;张伟文;曹明芹;: "基于重采样技术在医学不平衡数据分类中的应用研究", 中国卫生统计, no. 02 *

Also Published As

Publication number Publication date
CN113035363B (zh) 2024-01-02

Similar Documents

Publication Publication Date Title
CN108596327B (zh) 一种基于深度学习的地震速度谱人工智能拾取方法
CN106022954B (zh) 基于灰色关联度的多重bp神经网络负荷预测方法
CN108399434B (zh) 基于特征提取的高维时间序列数据的分析预测方法
CN112001422B (zh) 一种基于深度贝叶斯学习的图像标记估计方法
CN109840595B (zh) 一种基于群体学习行为特征的知识追踪方法
CN113065702B (zh) 基于st-seep分段法和时空arma模型的滑坡位移多线性预测方法
CN111881954A (zh) 基于渐进式簇净化网络的转导推理小样本分类方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及***
CN114266289A (zh) 一种复杂装备健康状态评估方法
CN115982141A (zh) 一种针对时序数据预测的特征优化方法
CN116959585B (zh) 基于深度学习的全基因组预测方法
CN116304546A (zh) 基于声音信号的供热***热力站故障诊断方法及***
CN111783242A (zh) 一种基于rvm-kf的滚动轴承剩余寿命预测方法及装置
CN111401444A (zh) 红酒原产地的预测方法、装置、计算机设备及存储介质
CN109460474B (zh) 用户偏好趋势挖掘方法
CN111144462A (zh) 一种雷达信号的未知个体识别方法及装置
CN117636183A (zh) 一种基于自监督预训练的小样本遥感图像分类方法
CN117408167A (zh) 基于深度神经网络的泥石流灾害易发性预测方法
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理***
CN112926251A (zh) 一种基于机器学习的滑坡位移高精度预测方法
CN112651168B (zh) 基于改进神经网络算法的建设用地面积预测方法
CN113035363A (zh) 一种概率密度加权的遗传代谢病筛查数据混合采样方法
CN115083511A (zh) 基于图表示学习与注意力的***基因调控特征提取方法
Zhang et al. Multivariate discrete grey model base on dummy drivers
CN114626594A (zh) 一种基于聚类分析和深度学习的中长期电量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant