CN108986872B - 用于大数据电子病历约简的多粒度属性权重Spark方法 - Google Patents

用于大数据电子病历约简的多粒度属性权重Spark方法 Download PDF

Info

Publication number
CN108986872B
CN108986872B CN201810642497.5A CN201810642497A CN108986872B CN 108986872 B CN108986872 B CN 108986872B CN 201810642497 A CN201810642497 A CN 201810642497A CN 108986872 B CN108986872 B CN 108986872B
Authority
CN
China
Prior art keywords
medical record
electronic medical
attribute
big data
tensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810642497.5A
Other languages
English (en)
Other versions
CN108986872A (zh
Inventor
丁卫平
陆琰
管致锦
程学云
王杰华
董建成
李跃华
张晓峰
胡彬
陈森博
沈学华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University Technology Transfer Center Co ltd
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN201810642497.5A priority Critical patent/CN108986872B/zh
Publication of CN108986872A publication Critical patent/CN108986872A/zh
Application granted granted Critical
Publication of CN108986872B publication Critical patent/CN108986872B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用于大数据电子病历约简的多粒度属性权重Spark方法。该方法首先在Hadoop分布式文件***中将大数据电子病历集划分成不同的条件属性作业和决策属性作业;然后设计基于改进MapReduce作业协同结构的Spark模型,将电子病历条件属性作业并行化处理;其次在Hadoop分布式文件***中构建多粒度属性权重Spark方法用于电子病历属性快速约简,从而求得大数据电子病历属性约简最优特征集;最后将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件***中,为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。

Description

用于大数据电子病历约简的多粒度属性权重Spark方法
技术领域
本发明涉及医学信息智能处理领域,具体涉及一种用于大数据电子病历约简的多粒度属性权重Spark方法。
背景技术
随着云计算和大数据时代的来临,电子病历数据库中医疗数据规模不断增长,大规模电子病历处理机制在整个医疗大数据产生和使用过程中异常复杂,挖掘出其中重要的医学诊断规则和知识是形成临床决策支持***的关键。由于电子病历***中存储的医疗数据具有容量大、来源分散、格式多样、存取速度快以及应用价值高等特征,给其特征选择、知识发现及临床决策支持服务等带来了较大困难。结合大数据电子病历***自身特点,采用一些高效的方法进行复杂医疗病历属性约简处理与分析,充分挖掘出疾病或体征之间的关联性,对开展大数据临床决策支持分析以及提供个性化与知识化的医疗健康大数据服务等具有重要意义,是设计面向未来医疗健康服务大数据工程和临床智能决策分析服务***的关键。
大数据电子病历约简是当前医疗大数据背景下临床决策支持***研究中一个具有挑战性的课题。为提高大规模电子病历数据处理效率,可利用云计算Spark技术将海量电子病历数据分布存储到不同的数据中心节点上,构建若干个大规模电子病历医疗数据中心,实现大规模海量电子病历数据的分布存储、组织和管理,以支持大规模电子病历的并行智能处理。
发明内容
本发明的目的是为了克服以上的不足,设计了一种用于大数据电子病历约简的多粒度属性权重Spark方法,该方法能适应大数据电子病历的属性约简,大大提高了病历属性约简的效率,对云计算环境下大数据电子病历约简及其相关疾病智能辅助诊断具有重要意义与价值。
本发明的目的通过以下技术方案来实现:一种用于大数据电子病历约简的多粒度属性权重Spark方法,步骤如下:
A.在Hadoop分布式文件***中将大数据电子病历集划分成n个作业,表示为J1,J2,…,Jn,它包含i-1个电子病历条件属性作业J1,J2,…,Ji-1和n-i+1个电子病历决策属性作业Ji,Ji+1,…,Jn
B.设计基于改进MapReduce任务协同结构的Spark模型,用于每个客户端用户从Hadoop分布式文件***云服务器中提取电子病历诊断数据集;
C.在Spark模型上执行MapReduce操作,使电子病历条件属性作业J1,J2,…,Ji-1并行化处理,其中J1产生的条件属性作业序列为J2,…,Ji-1,J2产生的条件属性作业序列为J3,…,Ji,以此类推,Ji-1产生的条件属性作业序列为Ji,…,Jn-1
D.将每个电子病历作业的条件属性和决策属性进行合并,构建属性对序列,分别表示为J1i,J2(i+1),…,J(i-2)(n-1),J(i-1)n,进一步提取电子病历作业中模糊的条件属性和不完备的决策属性;
E.在Hadoop分布式文件***中构建多粒度属性权重Spark方法,将关联张量Ta转换为属性权重张量Ttr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Tw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡;
F.每个客户端用户执行Map作业任务,一致操作对<Keyi,Valuei>被存储在集成向量中,在所有Map作业任务执行完后,主结点采用一致操作对<Keyi,Valuei>执行Reduce任务,求得大数据电子病历属性约简最优特征集;
G.比较求出的属性约简精度RC与预先设定精度值λ关系,若满足RC≥λ,则输出大数据电子病历最优属性集,否则,继续执行上述C,D,E和F步骤,直至属性约简精度满足RC≥λ;
H.将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件***中,为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。
优选的是,步骤E中在Hadoop分布式文件***中构建多粒度属性权重Spark方法,将关联张量Ta转换为属性权重张量Ttr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Tw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡,具体步骤如下:
a.构建大数据电子病历***为DIIS={U,AT,V,f},U为电子病历对象集合,AT为电子病历属性集,V为相关病历属性的值域,f是一个信息函数,用于指定U中每一个病历对象x的值域,A1,A2,...,Am∈AT为m个属性子集序列,w1,w2,…,wm分别对应m个电子病历属性子集序列下的权重值,其中m为非负整数;
b.设共享型协同最近邻域向量为k阶张量
Figure GDA0002947222380000031
其主要用来对应于不同电子病历属性的k阶特征空间
Figure GDA0002947222380000032
通过计算每个电子病历属性所在特征空间中非零元素,获取关联张量Ta如下:
Figure GDA0002947222380000033
将关联张量Ta中非负整数值的元素
Figure GDA0002947222380000034
表示为从第i1个电子病历属性到第ik个属性出现的次数;
c.定义每个电子病历特征空间中病历属性的重要度,利用高阶幂函数方法计算等级向量w1,w2,...,wk,其中wl,l=1,2,...,k,计算公式如下:
wl=αTtr×1wl…×l-1wl×l+1wl…×kwl+(1-α)μ,
其中Ttr为电子病历属性权重张量,wl为特征向量对应于k阶电子病历属性权重张量Ttr的主导特征值,μ为一个随机向量,α为一个关联概率,其范围为0<α<1;
d.将关联张量Ta转换为电子病历属性权重张量Ttr,生成用于电子病历约简的多粒度属性权重k阶张量,在不同粒度i1,...,il,...,ik下属性权重张量计算方法如下:
Figure GDA0002947222380000041
其中z是Ta所有阶的最大维数;
e.在关联概率0<α<1范围内,定义阈值ε的范围为ε∈[0.5,1],初始向量w0满足的条件为
Figure GDA0002947222380000042
f.设随机向量
Figure GDA0002947222380000043
和j=0,执行如下循环操作:
(i)j=j+1;
(ii)wj=αTtr×1wj-1…×l-1wj-1×l+1wj-1…×kwj-1+(1-α)μ;
(iii)直到满足条件||wj-wj-1||>ε;
g.将wj的一阶向量表示为If1,其排序向量为wj′,设wj=wj′,则构建大数据电子病历属性权重排序向量如下:
Figure GDA0002947222380000044
h.计算电子病历属性权重张量
Figure GDA0002947222380000045
的乘积方程,其计算方法如下:
Tw=w1×w2×…wk
该权重张量Tw能够平衡不同电子病历属性在同一特征规则提取中的相对贡献度,从而取得大数据电子病历属性约简集的局部解和全局优势解的有效平衡。
本发明与现有技术相比具有以下优点:1、该方法能准确划分大数据电子病历中相互依赖和关联的属性集,有效处理电子病历数据元素间多维度复杂的内联关系,取得大数据电子病历属性约简集的局部解和全局最优解的有效平衡,保证最终求得的电子病历约简集为所求目标的最优约简特征集,大大降低了执行时间,提升了病历属性提取的精度,从而能更有效地应用于面向云计算的大数据电子病历约简应用服务,找出最具成本效益的相关疾病临床治疗模式;2、该方法在云计算环境下采用Spark模型对病人自身病历数据进行安全收集、维护和管理,帮助用户对医院和患者的大量电子病历数据进行实时与非实时属性约简与分析,能有效处理大数据电子病历约简时所呈现出的复杂***特性,通过构建临床大数据电子病历约简平台,为开展大数据电子病历知识分析以及临床决策支持等智能服务奠定了较好的基础。
附图说明
图1是本发明总体结构图;
图2是基于Spark模型的电子病历条件属性作业MapReduce操作过程图;
图3是基于多粒度属性权重的大数据电子病历约简执行过程图;
具体实施方式
为了加深对本发明的理解,下面将结合实施例和附图对本发明作进一步详述,该实施例仅用于解释本发明,并不构成对本发明保护范围的限定。
如图1、2、3所示,本发明提供了一种用于大数据电子病历约简的多粒度属性权重Spark方法,步骤如下:
A.在Hadoop分布式文件***中将大数据电子病历集划分成n个作业,表示为J1,J2,…,Jn,它包含i-1个电子病历条件属性作业J1,J2,…,Ji-1和n-i+1个电子病历决策属性作业Ji,Ji+1,…,Jn
B.设计基于改进MapReduce任务协同结构的Spark模型,用于每个客户端用户从Hadoop分布式文件***云服务器中提取电子病历诊断数据集;
C.在Spark模型上执行MapReduce操作,使电子病历条件属性作业J1,J2,…,Ji-1并行化处理,其中J1产生的条件属性作业序列为J2,…,Ji-1,J2产生的条件属性作业序列为J3,…,Ji,以此类推,Ji-1产生的条件属性作业序列为Ji,…,Jn-1
D.将每个电子病历作业的条件属性和决策属性进行合并,构建属性对序列,分别表示为J1i,J2(i+1),…,J(i-2)(n-1),J(i-1)n,进一步提取电子病历作业中模糊的条件属性和不完备的决策属性;
E.在Hadoop分布式文件***中构建多粒度属性权重Spark方法,将关联张量Ta转换为属性权重张量Ttr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Tw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡;
F.每个客户端用户执行Map作业任务,一致操作对<Keyi,Valuei>被存储在集成向量中,在所有Map作业任务执行完后,主结点采用一致操作对<Keyi,Valuei>执行Reduce任务,求得大数据电子病历属性约简最优特征集;
G.比较求出的属性约简精度RC与预先设定精度值λ关系,若满足RC≥λ,则输出大数据电子病历最优属性集,否则,继续执行上述C,D,E和F步骤,直至属性约简精度满足RC≥λ;
H.将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件***中,为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。
步骤E中在Hadoop分布式文件***中构建多粒度属性权重Spark方法,将关联张量Ta转换为属性权重张量Ttr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Tw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡,具体步骤如下:
a.构建大数据电子病历***为DIIS={U,AT,V,f},U为电子病历对象集合,AT为电子病历属性集,V为相关病历属性的值域,f是一个信息函数,用于指定U中每一个病历对象x的值域,A1,A2,...,Am∈AT为m个属性子集序列,w1,w2,…,wm分别对应m个电子病历属性子集序列下的权重值,其中m为非负整数;
b.设共享型协同最近邻域向量为k阶张量
Figure GDA0002947222380000061
其主要用来对应于不同电子病历属性的k阶特征空间
Figure GDA0002947222380000062
通过计算每个电子病历属性所在特征空间中非零元素,获取关联张量Ta如下:
Figure GDA0002947222380000071
将关联张量Ta中非负整数值的元素
Figure GDA0002947222380000072
表示为从第i1个电子病历属性到第ik个属性出现的次数;
c.定义每个电子病历特征空间中病历属性的重要度,利用高阶幂函数方法计算等级向量w1,w2,...,wk,其中wl,l=1,2,...,k,计算公式如下:
wl=αTtr×1wl…×l-1wl×l+1wl…×kwl+(1-α)μ,
其中Ttr为电子病历属性权重张量,wl为特征向量对应于k阶电子病历属性权重张量Ttr的主导特征值,μ为一个随机向量,α为一个关联概率,其范围为0<α<1;
d.将关联张量Ta转换为电子病历属性权重张量Ttr,生成用于电子病历约简的多粒度属性权重k阶张量,在不同粒度i1,...,il,...,ik下属性权重张量计算方法如下:
Figure GDA0002947222380000073
其中z是Ta所有阶的最大维数;
e.在关联概率0<α<1范围内,定义阈值ε的范围为ε∈[0.5,1],初始向量w0满足的条件为
Figure GDA0002947222380000074
f.设随机向量
Figure GDA0002947222380000075
和j=0,执行如下循环操作:
(i)j=j+1;
(ii)wj=αTtr×1wj-1…×l-1wj-1×l+1wj-1…×kwj-1+(1-α)μ;
(iii)直到满足条件||wj-wj-1||>ε;
g.将wj的一阶向量表示为If1,其排序向量为wj′,设wj=wj′,则构建大数据电子病历属性权重排序向量如下:
Figure GDA0002947222380000081
h.计算电子病历属性权重张量
Figure GDA0002947222380000082
的乘积方程,其计算方法如下:
Tw=w1×w2×…wk
该权重张量Tw能够平衡不同电子病历属性在同一特征规则提取中的相对贡献度,从而取得大数据电子病历属性约简集的局部解和全局最优解的有效平衡。

Claims (2)

1.一种用于大数据电子病历约简的多粒度属性权重Spark方法,其特征在于:步骤如下:
A.在Hadoop分布式文件***中将大数据电子病历集划分成n个作业,表示为J1,J2,…,Jn,它包含i-1个电子病历条件属性作业J1,J2,…,Ji-1和n-i+1个电子病历决策属性作业Ji,Ji+1,…,Jn
B.设计基于改进MapReduce任务协同结构的Spark模型,用于每个客户端用户从Hadoop分布式文件***云服务器中提取电子病历诊断数据集;
C.在Spark模型上执行MapReduce操作,使电子病历条件属性作业J1,J2,…,Ji-1并行化处理,其中J1产生的条件属性作业序列为J2,…,Ji-1,J2产生的条件属性作业序列为J3,…,Ji,以此类推,Ji-1产生的条件属性作业序列为Ji,…,Jn-1
D.将每个电子病历作业的条件属性和决策属性进行合并,构建属性对序列,分别表示为J1i,J2(i+1),…,J(i-2)(n-1),J(i-1)n,进一步提取电子病历作业中模糊的条件属性和不完备的决策属性;
E.在Hadoop分布式文件***中构建多粒度属性权重Spark方法,将关联张量Ta转换为属性权重张量Ttr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Tw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡;
F.每个客户端用户执行Map作业任务,一致操作对<Keyi,Valuei>被存储在集成向量中,在所有Map作业任务执行完后,主结点采用一致操作对<Keyi,Valuei>执行Reduce任务,求得大数据电子病历属性约简最优特征集;
G.比较求出的属性约简精度RC与预先设定精度值λ关系,若满足RC≥λ,则输出大数据电子病历最优属性集,否则,继续执行上述C,D,E和F步骤,直至属性约简精度满足RC≥λ;
H.将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件***中,为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。
2.根据权利要求1所述一种用于大数据电子病历约简的多粒度属性权重Spark方法,其特征在于:所述步骤E中在Hadoop分布式文件***中构建多粒度属性权重Spark方法,将关联张量Ta转换为属性权重张量Ttr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Tw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡,具体步骤如下:
a.构建大数据电子病历***为DIIS={U,AT,V,f},U为电子病历对象集合,AT为电子病历属性集,V为相关病历属性的值域,f是一个信息函数,用于指定U中每一个病历对象x的值域,A1,A2,...,Am∈AT为m个属性子集序列,w1,w2,…,wm分别对应m个电子病历属性子集序列下的权重值,其中m为非负整数;
b.设共享型协同最近邻域向量为k阶张量
Figure FDA0002947222370000021
其主要用来对应于不同电子病历属性的k阶特征空间
Figure FDA0002947222370000022
通过计算每个电子病历属性所在特征空间中非零元素,获取关联张量Ta如下:
Figure FDA0002947222370000023
将关联张量Ta中非负整数值的元素
Figure FDA0002947222370000024
表示为从第i1个电子病历属性到第ik个属性出现的次数;
c.定义每个电子病历特征空间中病历属性的重要度,利用高阶幂函数方法计算等级向量w1,w2,...,wk,其中wl,l=1,2,...,k,计算公式如下:
wl=αTtr×1wl…×l-1wl×l+1wl…×kwl+(1-α)μ,
其中Ttr为电子病历属性权重张量,wl为特征向量对应于k阶电子病历属性权重张量Ttr的主导特征值,μ为一个随机向量,α为一个关联概率,其范围为0<α<1;
d.将关联张量Ta转换为电子病历属性权重张量Ttr,生成用于电子病历约简的多粒度属性权重k阶张量,在不同粒度i1,...,il,...,ik下属性权重张量计算方法如下:
Figure FDA0002947222370000031
其中z是Ta所有阶的最大维数;
e.在关联概率0<α<1范围内,定义阈值ε的范围为ε∈[0.5,1],初始向量w0满足的条件为
Figure FDA0002947222370000032
f.设随机向量
Figure FDA0002947222370000033
和j=0,执行如下循环操作:
(i)j=j+1;
(ii)wj=αTtr×1wj-1…×l-1wj-1×l+1wj-1…×kwj-1+(1-α)μ;
(iii)直到满足条件||wj-wj-1||>ε;
g.将wj的一阶向量表示为
Figure FDA0002947222370000034
其排序向量为wj′,设wj=wj′,则构建大数据电子病历属性权重排序向量如下:
Figure FDA0002947222370000035
h.计算电子病历属性权重张量
Figure FDA0002947222370000036
的乘积方程,其计算方法如下:
Tw=w1×w2×...wk
该权重张量Tw能够平衡不同电子病历属性在同一特征规则提取中的相对贡献度,从而取得大数据电子病历属性约简集的局部解和全局最优解的有效平衡。
CN201810642497.5A 2018-06-21 2018-06-21 用于大数据电子病历约简的多粒度属性权重Spark方法 Active CN108986872B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810642497.5A CN108986872B (zh) 2018-06-21 2018-06-21 用于大数据电子病历约简的多粒度属性权重Spark方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810642497.5A CN108986872B (zh) 2018-06-21 2018-06-21 用于大数据电子病历约简的多粒度属性权重Spark方法

Publications (2)

Publication Number Publication Date
CN108986872A CN108986872A (zh) 2018-12-11
CN108986872B true CN108986872B (zh) 2021-05-07

Family

ID=64541613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810642497.5A Active CN108986872B (zh) 2018-06-21 2018-06-21 用于大数据电子病历约简的多粒度属性权重Spark方法

Country Status (1)

Country Link
CN (1) CN108986872B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334116B (zh) * 2019-07-11 2022-09-16 河南大学 一种基于多粒度决策***的最优客体粒度确定方法
CN110867224B (zh) * 2019-10-28 2022-02-08 南通大学 用于大规模脑病历分割的多粒度Spark超信任模糊方法
CN111354427B (zh) * 2020-02-25 2022-04-29 南通大学 用于大规模电子健康档案知识协同约简的最近邻多粒度利润方法
CN111816270B (zh) * 2020-06-18 2022-12-09 南通大学 大规模肝脏电子病历病变分类的属性并行约简Spark方法
CN113012776B (zh) * 2021-03-30 2022-11-04 南通大学 大规模不平衡糖尿病电子病历并行分类邻域证据Spark方法
CN113012775B (zh) * 2021-03-30 2021-10-08 南通大学 红斑病电子病历病变分类的增量属性约简Spark方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462853A (zh) * 2014-12-29 2015-03-25 南通大学 用于电子病历特征提取的种群精英分布云协同均衡方法
CN107256342A (zh) * 2017-06-15 2017-10-17 南通大学 用于电子病历知识约简效能评估的多种群协同熵级联方法
CN107562732A (zh) * 2017-10-26 2018-01-09 北京康夫子科技有限公司 电子病历的处理方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10585902B2 (en) * 2016-05-24 2020-03-10 International Business Machines Corporation Cognitive computer assisted attribute acquisition through iterative disclosure

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462853A (zh) * 2014-12-29 2015-03-25 南通大学 用于电子病历特征提取的种群精英分布云协同均衡方法
CN107256342A (zh) * 2017-06-15 2017-10-17 南通大学 用于电子病历知识约简效能评估的多种群协同熵级联方法
CN107562732A (zh) * 2017-10-26 2018-01-09 北京康夫子科技有限公司 电子病历的处理方法及***

Also Published As

Publication number Publication date
CN108986872A (zh) 2018-12-11

Similar Documents

Publication Publication Date Title
CN108986872B (zh) 用于大数据电子病历约简的多粒度属性权重Spark方法
Shi et al. Large-scale and scalable latent factor analysis via distributed alternative stochastic gradient descent for recommender systems
JP6559892B2 (ja) データキューブのデータの記憶及び検索
US20160292591A1 (en) Streamlined analytic model training and scoring system
JP6874219B2 (ja) 情報処理装置、演算装置、及び情報処理方法
US10268749B1 (en) Clustering sparse high dimensional data using sketches
CN106897374B (zh) 一种基于轨迹大数据最近邻查询的个性化推荐方法
Roy et al. Big Data Optimization Techniques: A Survey.
JP6434162B2 (ja) データ管理システム、データ管理方法およびプログラム
CN113254716B (zh) 视频片段检索方法、装置、电子设备和可读存储介质
WO2020202312A1 (ja) 情報処理装置、演算装置、及び情報処理方法
Liu et al. Rsc: accelerate graph neural networks training via randomized sparse computations
Yang et al. An effective detection of satellite image via K-means clustering on Hadoop system
JP5432936B2 (ja) ランキングモデル選択機能を有する文書検索装置、ランキングモデル選択機能を有する文書検索方法およびランキングモデル選択機能を有する文書検索プログラム
Lu et al. An improved k-means distributed clustering algorithm based on spark parallel computing framework
Singh et al. Distributed quadratic programming solver for kernel SVM using genetic algorithm
Yu et al. DBWGIE-MR: A density-based clustering algorithm by using the weighted grid and information entropy based on MapReduce
CN110209895B (zh) 向量检索方法、装置和设备
CN117059284A (zh) 基于协同进化离散粒子群优化的糖尿病并行属性约简方法
CN115438046B (zh) 一种基于htap数据库的分布式储存方法
Li et al. An alternating nonmonotone projected Barzilai–Borwein algorithm of nonnegative factorization of big matrices
CN113240089B (zh) 基于图检索引擎的图神经网络模型训练方法和装置
CN115472257A (zh) 一种招募用户的方法、装置、电子设备及存储介质
Jin et al. Towards MapReduce approach with dynamic fuzzy inference/interpolation for big data classification problems
CN115168326A (zh) Hadoop大数据平台分布式能源数据清洗方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230818

Address after: 226000 No. 9 Siyuan Road, Chongchuan District, Nantong City, Jiangsu Province

Patentee after: Nantong University Technology Transfer Center Co.,Ltd.

Address before: 226000 No. 8, Siyuan Road, Chongchuan District, Nantong City, Jiangsu Province

Patentee before: NANTONG University

TR01 Transfer of patent right