CN107578822B - 一种针对医疗多模态大数据的预处理及特征提取方法 - Google Patents

一种针对医疗多模态大数据的预处理及特征提取方法 Download PDF

Info

Publication number
CN107578822B
CN107578822B CN201710612240.0A CN201710612240A CN107578822B CN 107578822 B CN107578822 B CN 107578822B CN 201710612240 A CN201710612240 A CN 201710612240A CN 107578822 B CN107578822 B CN 107578822B
Authority
CN
China
Prior art keywords
data
big data
window
model
modal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710612240.0A
Other languages
English (en)
Other versions
CN107578822A (zh
Inventor
鲁仁全
张金涛
吴元清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201710612240.0A priority Critical patent/CN107578822B/zh
Publication of CN107578822A publication Critical patent/CN107578822A/zh
Application granted granted Critical
Publication of CN107578822B publication Critical patent/CN107578822B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明提出一种针对医疗机构分析多模态大数据的分析方法。主要是针对医院数据库中患者的多模态大数据的分析。可以综合考虑多个模态信息数据,有效地避免传统数据分析过程中,传输网络受限情况的发生,并保证实时反馈用户信息。所建立的多维偏最小二乘模型,并结合卷积神经网络方法,能够减少信息损失,得到稳定的预测模型,为医院提供更加详尽且准确的分析报告。

Description

一种针对医疗多模态大数据的预处理及特征提取方法
技术领域
本发明涉及医疗大数据领域,具体而言,涉及医院多模态大数据的预处理及特征提取。
背景技术
随着社会的发展,医疗技术也相应地不断得到提高。国内医院几乎都建立了属于自己的数据仓库,并不断地积累各种疾病信息的数据和历史记录大自身的数据库中,其内容都达到了相当大的规模。这对每一个医院机构来说,是一笔重要的信息资源。为行业人员提供疾病信息的帮助,观察疾病历年来的演变规律及发展趋势,都起到了举足轻重的重要性。然而现如今各个医疗机构都面临着这样的困境,就是如何去分析疾病多模态的大数据,提高疾病信息的利用率,并且准确地找出需要的信息,做出高明的决策。
发明内容
为了解决医疗多模态大数据的预处理及特征提取的难题,本发明提出了一种针对医院分析多模态大数据的方法,并提出设计多密度量化器,采用遗传算法和 BP遗传算法等技术进行预测分析。
一种针对医疗多模态大数据的预处理及特征提取方法,如图1所示,包括如下步骤:
步骤1.利用S-G平滑法对医院的多模态数据进行预处理。在待处理点前后选取一段数据。连续奇数个点组成单个窗口并将其排序,取中间值作为平滑值。
步骤2.获取处理后的数据,利用多模态数据的特征的信息量化的方法,采集该医疗机构的多模态大数据,结合网络传输的负载能力,设计多密度量化器
步骤3.基于相关系数分析的局部回归方法,利用多维偏最小二乘算法构建数据模型,采用GA-BP建模的方法,并结合卷积神经网络的方法,提取患者历史数据数据中有价值的信息
步骤4推导出疾病数据的新型信息提取算法,得到患者疾病的动态演化规律,对疾病做出性能评估指标,以及为患者提出滚动优化的方案。
附图说明
图1.一种针对医疗多模态大数据的预处理及特征提取方法的示意图。
具体实施方式
所述的S-G平滑法,其特征在于首先选择好合适的窗口,然后根据多项式拟合法,对每一个窗口内的数据进行平滑处理,将计算得到的平滑值代替对应的窗口数据,然后时间增加的方向依次移动一个数据点,形成新的窗口,直到遍历所有的数据点为止;
其具体的方法是在三维荧光光谱中选取一个矩阵平滑窗口,使得窗口包含 (2p+1)×(2q+1)个数据点,其窗口的数据点可以表示为:
(a-p,b-q,x(a-p,b-q,))…(a-p,b0,x(a-p,b0,)),…,(a-p,bq,x(a-p,bq,)) .....
(a0,b-q,x(a0,b-q,))…(a0,b0,x(a0,b0,)),…,(a0,bq,x(a0,bq,)) .....
(ap,b-q,x(ap,b-q,))…(ap,b0,x(ap,b0,)),…,(ap,bq,x(ap,bq,))
其中am(m=-p,…,p)为第m个发射光谱波长,bn(n=-q,…,q)为第n 个激发光谱波长,x(am,bn)(m=-p,…,p,n=-q,…,q)为数据点 (am,bn)的荧光强度。
其中窗口内各点的平滑值计算公式为:
Figure DEST_PATH_GDA0001464523390000021
所述的多密度量化器,其特征在于能够根据传输网络的情况,动态调节量化器的设定值。由于实际传输网络的情况是动态的,多密度量化器保证最大效率量化数据,达到对多模态大数据的高效传输。通过将量化处理后的数据写成输出值加上一个高斯噪声的形式,即:
Figure DEST_PATH_GDA0001464523390000022
然后求出相应时刻的负载度,并根据历史大数据统计数据变化的窗口值,结合数据仓库所需要的精度和负载设计多密度量化器。
所述的多维偏最小二乘算法构建数据模型,其特征在于多维偏最小二乘是一种多维数据模型,在进行回归模型建立过程中,可以得到与各维直接相关的载荷向量,并对模型的各维做独立解释,得到回归模型,可表示为:
Figure DEST_PATH_GDA0001464523390000031
其中,X为多模态大数据处理后生成的矩阵,F是组分数,T是得分矩阵,大小为I行F列,WJ和WK分别是J方向和K方向的权重矩阵,大小分别为J 行F列和K行F列。
当进行预测的操作时,将多模态数据矩阵Xw(I×J×K),进行计算可以得到预测结果:将Xw降维到二维矩阵Xw(I×JK),求解出预测变量Ynew的值
所述GA-BP建模的方法,其特征在于采用遗传算法和BP算法(GA-BP)轮流对得到的回归模型进行训练,依据疾病的相关指标,选取其中有价值的数据包,代入遗传算法模型进项建模,直到看到网络收敛。
其中BP网络学习流程为选择3层BP网络的拓扑结构,其输入层神经元选取量化后的多模态数据,然后网络化输入归一化样本数据,参照预测样本的仿真效果,当预测值均方根误差达到一定指标就提前停止训练,直接输出训练好的 BP网络模型。
所述卷积神经网络方法,其特征在于采用了前后传输的输出值,反向传播权重和偏置,内部的神经网络中相邻之间额神经单元采用部分连接,使上层的部分神经元,通过神经网络内部的神经元进行感知,有助于从医疗多模态大数据中抽取深层次的知识,从而建立针对多模态大数据的深度认识。
首先第一步建立卷积神经网络,其作用就是能够发现数据的局部特征,然后利用卷积神经网络中的map,共用一个卷积神经网络核。其中每一个map都是由多个神经单元组成。
接着通过实现特征数据与输出层的全连接,利用后传播神经网络的方式调整权重和偏置。可以通过梯度下降法来求解神经网络。因为在实际应用中,梯度下降法往往能够得到令人满意的结果。
卷积神经网络核其实就是权重的含义,在实际计算过程中不用单独计算,而是固定大小的权重矩阵去图像上匹配。权重共享策略减少了需要训练的参数,使得训练出来的模型的泛华能力更强。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (4)

1.一种针对医疗多模态大数据的预处理及特征提取方法,其特征在于,包括如下步骤:
步骤1.利用S-G平滑法对医院的多模态数据进行预处理,在待处理点前后选取一段数据,连续奇数个点组成单个窗口并将其排序,取中间值作为平滑值;
步骤2.获取处理后的数据,利用多模态数据的特征的信息量化的方法,采集该医院的多模态大数据,结合网络传输的负载能力,设计多密度量化器;
步骤3.基于相关系数分析的局部回归方法,利用多维偏最小二乘算法构建数据模型,采用GA-BP建模的方法,并结合卷积神经网络的方法,提取患者历史数据中有价值的信息;
步骤4. 推导出疾病数据的新型信息提取算法,得到患者疾病的动态演化规律,对疾病做出性能评估指标,以及为患者提出滚动优化的方案;
所述的多密度量化器,能够根据传输网络的情况,动态调节量化器的设定值;由于实际传输网络的情况是动态的,多密度量化器保证最大效率量化数据,达到对多模态大数据的高效传输;通过将量化处理后的数据写成输出值加上一个高斯噪声的形式,即:
Figure FDA0002581516470000011
然后求出相应时刻的负载度,并根据历史大数据统计数据变化的窗口值,结合数据仓库所需要的精度和负载设计多密度量化器;
所述的多维偏最小二乘算法构建数据模型,多维偏最小二乘是一种多维数据模型,在进行回归模型建立过程中,得到与各维直接相关的载荷向量,并对模型的各维做独立解释,得到回归模型,可表示为:
X=T(WK⊙WJ)T+E
其中,X为多模态大数据处理后生成的矩阵,F是组分数,T是得分矩阵,大小为I行F列,WJ和WK分别是J方向和K方向的权重矩阵,大小分别为J行F列和K行F列。
2.根据权利要求1所述的针对医疗多模态大数据的预处理及特征提取方法,其特征在于:所述的S-G平滑法,首先选择好合适的窗口,然后根据多项式拟合法,对每一个窗口内的数据进行平滑处理,将计算得到的平滑值代替对应的窗口数据,然后时间增加的方向依次移动一个数据点,形成新的窗口,直到遍历所有的数据点为止。
3.根据权利要求1所述的针对医疗多模态大数据的预处理及特征提取方法,其特征在于:所述GA-BP建模的方法,采用遗传算法和BP算***流对得到的回归模型进行训练,依据疾病相关指标要求,选取其中有价值的数据包,代入遗传算法模型进项建模,直到网络收敛。
4.根据权利要求1所述的针对医疗多模态大数据的预处理及特征提取方法,其特征在于:所述卷积神经网络的 方法,采用了前后传输的输出值,反向传播权重和偏置,内部的神经网络中相邻之间神经单元采用部分连接,使上层的部分神经元,通过神经网络内部的神经元进行感知。
CN201710612240.0A 2017-07-25 2017-07-25 一种针对医疗多模态大数据的预处理及特征提取方法 Active CN107578822B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710612240.0A CN107578822B (zh) 2017-07-25 2017-07-25 一种针对医疗多模态大数据的预处理及特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710612240.0A CN107578822B (zh) 2017-07-25 2017-07-25 一种针对医疗多模态大数据的预处理及特征提取方法

Publications (2)

Publication Number Publication Date
CN107578822A CN107578822A (zh) 2018-01-12
CN107578822B true CN107578822B (zh) 2020-12-15

Family

ID=61034174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710612240.0A Active CN107578822B (zh) 2017-07-25 2017-07-25 一种针对医疗多模态大数据的预处理及特征提取方法

Country Status (1)

Country Link
CN (1) CN107578822B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241041B (zh) * 2018-06-26 2021-05-11 广东工业大学 一种注塑成型装备大数据的预处理方法及装置
CN109448855A (zh) * 2018-09-17 2019-03-08 大连大学 一种基于cnn和模型融合的糖尿病血糖预测方法
CN112001228A (zh) * 2020-07-08 2020-11-27 上海品览数据科技有限公司 一种基于深度学习的视频监控仓库出入库计数***及方法
CN112712895B (zh) * 2021-02-04 2024-01-26 广州中医药大学第一附属医院 针对2型糖尿病并发症的多模态大数据的数据分析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130117257A1 (en) * 2011-11-03 2013-05-09 Microsoft Corporation Query result estimation
CN105393252A (zh) * 2013-04-18 2016-03-09 数字标记公司 生理数据采集和分析
CN106339591A (zh) * 2016-08-25 2017-01-18 汤平 一种基于深度卷积神经网络的预防乳腺癌自助健康云服务***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130117257A1 (en) * 2011-11-03 2013-05-09 Microsoft Corporation Query result estimation
CN105393252A (zh) * 2013-04-18 2016-03-09 数字标记公司 生理数据采集和分析
CN106339591A (zh) * 2016-08-25 2017-01-18 汤平 一种基于深度卷积神经网络的预防乳腺癌自助健康云服务***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Multi-Channel Multi-Mode Physiological Signals Acquisition and Analysis Platform;Sheng-Cheng Lee等;《 2013 IEEE International Symposium on Circuits and Systems (ISCAS)》;20130523;第397-400页 *
MH-ARM: a Multi-mode and High-value Association Rule Mining Technique for Healthcare Data Analysis;Libao Yang等;《2016 International Conference on Computational Science and Computational Intelligence》;20160320;第122-127页 *

Also Published As

Publication number Publication date
CN107578822A (zh) 2018-01-12

Similar Documents

Publication Publication Date Title
CN107578822B (zh) 一种针对医疗多模态大数据的预处理及特征提取方法
CN110379506B (zh) 针对心电图数据使用二值化神经网络的心律不齐检测方法
CN111192270A (zh) 一种基于点全局上下文关系推理的点云语义分割方法
EP4290412A3 (en) Computer-implemented method, computer program product and system for data analysis
CN106778014A (zh) 一种基于循环神经网络的患病风险预测方法
Huang et al. Tomato leaf disease detection system based on FC-SNDPN
CN111681718B (zh) 一种基于深度学习多源异构网络的药物重定位方法
CN108876044B (zh) 一种基于知识增强神经网络的线上内容流行度预测方法
CN106682385B (zh) 健康信息交互***
CN111008693B (zh) 一种基于数据压缩的网络模型构建方法、***和介质
CN107067182A (zh) 面向多维意象的产品设计方案评估方法
CN113012811B (zh) 一种结合深度卷积网络和图神经网络的中医证候诊断和健康评价方法
Chen et al. Binarized neural architecture search for efficient object recognition
Biswas et al. Hybrid expert system using case based reasoning and neural network for classification
CN106485069A (zh) 康复信息推送的方法及***
CN115796358A (zh) 一种碳排放预测的方法及终端
Peng et al. An industrial-grade solution for agricultural image classification tasks
Saini et al. AI based automatic detection of citrus fruit and leaves diseases using deep neural network model
CN107145934A (zh) 一种基于增强局部搜索能力的人工蜂群优化方法
CN117727464A (zh) 基于医疗多视图疾病预测模型的训练方法及设备
Sree et al. Optimized conversion of categorical and numerical features in machine learning models
CN116821452A (zh) 一种图节点分类模型训练方法、图节点分类方法
CN117112922A (zh) 基于显式特征和隐式特征交互的深度协同过滤推荐方法
CN111680846A (zh) 一种基于l1和l2范数的简化宽度学习***
CN110348131A (zh) 一种rbf板形识别模型的fpga实现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant