CN115050479B - 多中心研究的数据质量评价方法、***及设备 - Google Patents
多中心研究的数据质量评价方法、***及设备 Download PDFInfo
- Publication number
- CN115050479B CN115050479B CN202210378683.9A CN202210378683A CN115050479B CN 115050479 B CN115050479 B CN 115050479B CN 202210378683 A CN202210378683 A CN 202210378683A CN 115050479 B CN115050479 B CN 115050479B
- Authority
- CN
- China
- Prior art keywords
- data quality
- data
- standard
- center
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011160 research Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 44
- 238000011156 evaluation Methods 0.000 claims abstract description 51
- 238000001514 detection method Methods 0.000 claims abstract description 42
- 238000005457 optimization Methods 0.000 claims abstract description 31
- 238000012937 correction Methods 0.000 claims abstract description 25
- 238000007781 pre-processing Methods 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims description 16
- 238000013456 study Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000013500 data storage Methods 0.000 claims description 7
- 238000001303 quality assessment method Methods 0.000 claims description 5
- 238000003908 quality control method Methods 0.000 claims description 5
- 238000011157 data evaluation Methods 0.000 abstract 1
- 238000002599 functional magnetic resonance imaging Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 208000014644 Brain disease Diseases 0.000 description 1
- 208000035977 Rare disease Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 208000015114 central nervous system disease Diseases 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002610 neuroimaging Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000010827 pathological analysis Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Maintenance And Management Of Digital Transmission (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种多中心研究的数据质量评价方法、***及设备,包括:数据上报模块;数据预处理模块;多中心数据校正模块;数据质量符合性检测模块:比对数据质量标准符合情况并输至评价结果报告模块,生成各中心的数据质量评价报告结果;以及数据质量标准智能推荐模块,数据质量标准智能推荐模块由用户调取,以数据质量标准知识库的数据质量标准为初始值,按照约束优化方法进行参数指标项数值的最优选择,并输出推荐标准,该推荐标准返回数据质量符合性检测模块进行符合性检测,满足符合性检测的则存储入数据质量标准知识库对标准知识库进行更新。本发明解决现有多中心数据评价标准缺乏应用数据支持,与实际情况偏差较大,过多依赖专家评价等问题。
Description
技术领域
本发明属于医学大数据技术领域,具体涉及一种多中心研究的数据质量评价方法、***及设备。
背景技术
目前基于大数据的研究应用在各行各业广泛开展,健康医疗大数据被广泛应用于医疗行业的各个领域,包括药品研发、临床辅助决策、定制化医疗、居民健康档案等方面,这对于提高医院管理决策的科学性、促进医疗事业健康有序发展等具有重要的研究价值。其中多中心的医疗大数据研究意义尤为重要,例如罕见病、复杂疾病的建模需要更多的数据验证、测试与学习,然而在一家机构(中心)数据收集有限,因此基于多中心的数据来进行研究与应用成为必然需求。实现数据处理准确、智能辅助决策的前提与基础是多中心研究的数据质量符合标准要求。因此有效的数据质量评价方法是提高多中心研究结果可信度的重要数据质量控制方法,具有重要的应用价值与经济效益。
在基于多中心的大数据应用场景时,数据质量评价问题尤为突出,面对多中心应用场景的要求,实际数据往往会表现出不同的数据质量。面对多中心数据,由于数据来源不同,传统的单一数据质量标准存在不适应的问题,目前评价标准缺乏真实世界的应用数据支持,多依靠专家经验,标准与实际情况偏差较大,数据质量评价结果不可靠。多中心医疗数据质量往往还受非生物属性(不同机构、不同设备等因素)影响,需要进行数据预处理,多中心数据校正调整后再进行评价。
发明内容
本发明提供一种多中心研究的数据质量评价方法、***及设备,解决现有多中心数据质量评价中标准缺乏真实世界的应用数据支持,标准与实际情况偏差较大,以及评价过程过多依赖于专家评价等问题,实现更客观、定量、精准的数据质量评价。
为了解决上述技术问题,本发明采用的一种技术方案是:所述多中心研究的数据质量评价***,包括:
数据上报模块,数据上报模块由各中心调用,用于上报本中心纳入多中心研究的数据;
数据预处理模块,数据预处理模块对获得的数据进行格式转换以及去除噪声影响;
多中心数据校正模块,多中心数据校正模块收集经预处理后的多中心数据,进行协调校正处理,用于消除由于不同中心数据采集设备不同等非生物原因造成的数据间差异;
多中心数据存储模块,多中心数据存储模块部署于***服务器,用于将预处理和校正后的多中心数据及数据采集基本参数表存储在多中心研究数据库中;
数据质量符合性检测模块,数据质量符合性检测模块从***的数据质量标准知识库中依据研究类型选择评价标准,逐个比对数据质量标准符合情况并输出至评价结果报告模块,生成数据质量评价报告结果;
数据质量标准智能推荐模块,数据质量标准智能推荐模块由用户调取,以***存储的数据质量标准知识库的数据质量标准为初始值,按照多目标约束优化的方法进行标准指标项数值的最优选择,并输出推荐标准,该推荐标准返回数据质量符合性检测模块进行符合性检测,满足符合性检测的则存储入数据质量标准知识库对标准知识库进行更新;以及,
数据质量标准知识库,数据质量标准知识库存储数据质量标准,并接受由数据质量标准智能推荐模块生成的推荐标准。
进一步地,还包括数据质量专家评价模块,数据质量专家评价模块能够调取数据质量符合性检测模块输出的检测结果,并给出人工评价意见。
进一步地,所述数据质量专家评价模块能够调用数据质量标准智能推荐模块,接收数据质量标准智能推荐模块推荐的定量标准,并按推荐标准再次进行数据质量符合性检测,被接受的推荐标准存入数据质量标准知识库,对数据质量标准知识库进行更新。
本发明还提供一种多中心研究的数据质量评价方法,具体包括以下步骤:
(1)多中心上报医学影像数据;
(2)上报的医学影像数据进行格式转换以及去除噪声影响预处理后传送至多中心数据校正模块处理;
(3)多中心数据校正模块收集经数据格式转换及去噪声处理后的多中心数据,进行协调校正处理;校正后的数据及获取的数据采集基本参数表存储于多中心研究数据库;
(4)数据质量符合性检测模块从***的数据质量标准知识库中依据研究类型选择评价标准,比对数据质量标准符合情况,并生成数据质量评价报告结果;
(5)由用户调取数据质量标准智能推荐模块,以***存储的数据质量标准知识库的数据质量标准为初始值,根据研究需求寻求满足条件的更佳的数据质量标准为目标,基于多目标约束优化算法对存储的多中心数据基本参数信息进行迭代优化,自动生成满足数据质控指标的推荐定量标准;所述数据质量标准智能推荐模块按照多目标约束优化的方法进行标准指标项数值的最优选择,并输出推荐结果,即推荐标准,该推荐标准返回数据质量符合性检测模块进行符合性检测,满足符合性检测的则存储入数据质量标准知识库对标准知识库进行更新。
进一步地,所述数据质量标准智能推荐模块按照多目标约束优化的方法进行标准指标项的最优选择;不失一般性,设有M个数据质量评价目标函数,N个待评价的标准指标项决策变量,其优化问题描述为:
其中,
为N维标准指标项决策变量,x=(x1,x2,…,xN)是待评价的第i个指标,D是N维评价指标空间;/>为M维目标变量,S为M维解空间;F(x)定义了M个由评价指标空间向解空间映射的目标分量函数,其中fi(x)是目标函数F(x)的第i个目标分量,代表更优的数据质量评价目标;gi(x)≤0,(i=1,2,...,p)定义了p个不等式约束条件,即指标项要满足的不等式约束条件,hj(x)=0,(j=1,2,...,q)定义了q个等式约束条件;Max表示多目标问题的优化模式是寻找最大值,其对应的输出x=(x1,x2,…,xN)就是推荐的最优解。
本发明还提供一种多中心研究的数据质量评价设备,包括如上所述的评价***。
本发明的优点具体如下:
(1)本发明所述多中心研究的数据质量评价方法、***以及设备,针对现有数据质量评价中标准缺乏实际数据支持,以及评价过程过于主观等问题,根据给定的研究类型进行多中心的数据校正,根据评价标准自动给出数据质量符合性检测结果;
(2)本发明通过对多中心站点的大数据学习,智能化的生成推荐的数据质量定量评价标准,是一种基于真实世界大数据的标准定量指标生成方法,能够更客观、定量、精准;本发明解决了目前评价标准往往缺乏真实世界的应用数据支持,多依靠专家经验,标准与实际情况偏差较大,导致标准无法落地,数据质量评价结果不可靠的问题;
(3)本发明能够支持现有专家数据质量评价模式,支持将生成的数据质量符合性检测结果提交专家打分,最终生成结合专家意见及检测结果的数据质量评价报告。
附图说明
图1为本发明所述多中心研究的数据质量评价***的第一种实施例的框架图。
图2为本发明所述多中心研究的数据质量评价***的第二种实施例的框架图。
具体实施方式
为了使本发明的上述目的、特征和优点能够更加明显易懂,下面结合具体附图对本发明的具体实施方式作进一步的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施例,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
实施例一:本发明所述多中心研究的数据质量评价***,包括:
(1)数据上报模块:每个中心设置一个数据上报模块,各个中心的数据上报模块通过传输网络上报医学影像数据,上报的医学影像数据作为机器学习模型的输入;
(2)数据预处理模块:数据预处理模块对***中获得的各中心数据进行格式转换以及去除噪声影响,经数据预处理后传送至多中心数据校正模块处理;具体地:在数据预处理模块设置不同研究需求的预处理协议,用户根据数据研究类型进行配置;对于未通过数据预处理步骤的数据标记为不符合,通过数据预处理步骤的数据发送到多中心数据校正模块;
(3)多中心数据校正模块:多中心数据校正模块收集经数据格式转换及去噪声处理后的多中心数据,进行协调校正处理,主要目的是消除各中心数据生成设备等因素影响;
(4)多中心数据存储模块:多中心数据存储模块部署于***服务器,用于存储多中心经预处理、校正后的数据及数据采集基本参数表;
(5)数据质量符合性检测模块:数据质量符合性检测模块从***的数据质量标准知识库中依据研究类型选择评价标准,然后比对数据质量标准符合情况,比对结果明确各数据各定量指标是否符合数据质量标准以及与数据质量标准的偏离情况;
(6)评价结果报告模块:评价结果报告模块获得数据质量符合性检测模块的比对结果,生成各中心的数据质量评价报告结果;
(7)数据质量标准智能推荐模块:数据质量标准智能推荐模块由用户调取,以***存储的数据质量标准知识库的数据质量标准为初始值,为寻求更佳的数据质量标准为目标,基于多目标约束优化算法对存储的多中心研究数据基本参数信息进行标准项数值的迭代优化,自动生成满足数据质控指标的推荐定量标准;具体地,所述数据质量标准智能推荐模块通过对实际数据的参数指标进行统计计算,确定指标的取值范围,并在此范围内按照约束优化的方法进行参数指标项数值的最优选择,并输出结果;所述多目标优化模型为:
其中,M为数据质量评价目标函数个数,/>为N维待评价的标准项决策变量,x=(x1,x2,…,xN),xi是待评价的第i个指标,D是N维评价指标空间;/>为M维目标变量,S为M维解空间;F(x)定义了M个由评价指标空间向解空间映射的目标分量函数,其中fi(x)是目标函数F(x)的第i个目标分量;gi(x)≤0(i=1,2,...,p)定义了p个不等式约束条件,hj(x)=0,j=1,2,...,q)定义了q个等式约束条件。Max表示多目标问题的优化模式是寻找最大值,其对应的输出x=(x1,x2,…,xN)就是推荐的最优解。
所述数据质量标准智能推荐模块按照约束优化的方法进行参数指标项数值的最优选择,并输出推荐结果(即推荐标准),该推荐标准返回数据质量符合性检测模块进行符合性检测,满足符合性检测的则存储入数据质量标准知识库对标准知识库进行更新;
(8)数据质量标准知识库:数据质量标准知识库存储数据质量标准,并接受由数据质量标准智能推荐模块生成的推荐标准。
实施例二:
本发明所述多中心研究的数据质量评价方法,以多中心功能磁共振功能成像(functional magnetic resonance imaging,简称fMRI)的数据质量评价为案例,fMRI数据记录了经磁共振设备扫描过程中的血氧水平的时间序列,能够反映大脑功能随实际变化的活动情况,为研究脑疾病的机制、诊断和治疗,探究人工智能机制以及心理及认知研究提供基础数据支持。本***的数据结果可以作为多中心神经***疾病的机器学习诊断分类的输入数据,建立的疾病预测模型为提高重大疾病的早期诊断提供方法以及应用案例,具体包括以下步骤:
(1)多中心人员经授权后在***中上报收集的L个被试(健康人及患者)的数据集合B{b1,b2,...,bL},bi表示第i个被试,i=1,2,...,L。每个被试的数据包括fMRI影像数据,以及每个被试的编号、年龄、性别、病理诊断结果、问卷调查获得的行为量表等信息用于后续机器学习;这些数据成功上传后发送到数据预处理模块。
(2)数据预处理模块:fMRI数据预处理模块的处理流程(也称为协议)如下:fMRI数据一般都是以医学影像通用标准DICOM(Digital Imaging and Communications inMedicine)格式存储。在进行后续的处理之前,首先把DICOM格式数据转换到神经影像数据存储标准NIFTI(Neuroimaging Informatics Technology Initiative)格式。然后对数据进行时间整理(如去掉前5个时间点的数据以减少开机头动信号不稳定的影响以及进行时间校正),空间整理(如头动校正、空间标准化、空间平滑)用于去除由于设备或者运动等产生的图像噪声影响。其次,对影像数据的头文件读取并记录数据集合B的数据采集基本参数,也就是待评价的数据质量标准指标项。设共有N个待评价的指标,数据采集基本参数表记为C={c11,c12,...,cij,...,cLN},cij就代表数据bi的第j个指标数值,i=1,2,...,L,j=1,2,...,N。fMRI数据采集基本参数及质量评价标准项如表1所示,则待评价的指标x=(TR,TE,FOV,SN,T),N=5。经过数据预处理的影像数据集B,以及数据采集基本参数表C一起输入到多中心数据校正模块处理;对没有通过数据预处理的被试输出报错信息,包括编号及错误情况说明等,例如数据格式转换失败。
表1 fMRI数据采集基本参数及质量评价标准项示例
(3)多中心数据校正模块:由于来自于多中心数据是事后聚合的,即它们是从具有不同采集参数的不同扫描仪设备获取的,各中心(或者称为站点)间的这些变化因素可能会掩盖部分源于被试本身生物特性的组间,导致在基于机器学习的诊断分类的背景下,较大样本量所获得的优势无法实现。本模块就是通过对多中心数据进行校正,去除这些因素影响;常用校正方法包括使用ComBat(combating batch effects when combining batches,即组合批次时对抗批次效应)技术来协调多站点影像数据,该技术基于经验贝叶斯公式以消除数据分布中的站点间差异,以提高诊断分类的准确性。多中心数据校正模块输出调整后的数据记为 为bi数据校正后的结果,i=1,2,...,L;
(4)多中心数据存储模块:多中心数据存储模块部署于***服务器,将经多中心校正后的数据B*及其采集参数信息表C按研究类型分类存储在多中心研究数据库中;数据质量评价标准的初始值以及更新后的结果存放于数据质量标准知识库中;
(5)数据质量符合性检测模块:数据质量符合性检测模块从***的数据质量标准知识库中读取出数据质量评价标准的初始值,随后逐个比对各被试的各指标项是否满足质量评价标准以及与数据质量标准的偏离情况。具体说,如表1示例中待评价的标准指标项x=(TR,TE,FOV,SN,T),初始值记为x(0)=(2,30,240,3,150)。对于待评价的数据集逐个比对/>的采集参数指标项ci1,ci2,ci3,ci4,ci5;如果各评价标准条件都满足则该数据符合标准,否则返回不符合标志;
(6)评价结果报告模块:评价结果报告模块获得数据质量符合性检测模块的比对结果,生成数据质量评价报告结果;
(7)数据质量标准智能推荐模块:数据质量标准智能推荐模块由用户调取,以***存储的数据质量标准知识库的数据质量标准为初始值,为寻求满足研究条件的更佳的数据质量标准为目标,基于多目标约束优化方法根据多中心研究数据的真实情况进行评价标准的迭代寻优,生成满足数据质控需求的推荐标准;具体地,所述数据质量标准智能推荐模块通过对存储在多中心研究数据库中的实际数据集的参数信息进行统计计算(最大值,最小值),确定评价指标的取值空间D,并在此范围内按照多目标约束优化的方法进行标准指标项数值的最优选择,并输出结果;如表1示例所述,如果fMRI研究需要从中心数据集选择出不少于数量K的满足条件的样本,则此问题的多目标约束优化公式可以表示如下:
其中,x(n)代表标准指标项x的第n次迭代寻优的一个解,P为数据集中满足条件x(n)的样本数,cij代表第i个满足条件被试的第j个标准指标项值,i=1,2,...,P,j=1,2,3,4,5;/>代表x第n次迭代时的第j个标准指标项值;f1(x(n))代表层厚指标最优函数,f2(x(n))代表采集次数指标最优函数,g1(x(n))代表满足选择出不少于数量K的样本P个;g2(x(n))代表对层厚的约束不等式条件,g3(x(n))代表对采集次数的不等式约束条件;h1(x(n)),h2(x(n)),h3(x(n))分别代表了重复时间,回波时间和视野标准指标项的三个等式约束条件;所述数据质量标准智能推荐模块按照多目标约束优化的方法进行参数指标项数值的最优选择,如常用的梯度下降法不断更新x(n+1)并输出推荐结果(即推荐标准),该推荐标准返回数据质量符合性检测模块进行符合性检测,满足符合性检测的则存储入数据质量标准知识库对标准知识库进行更新。
实施例三:
如图2所示,在实施例一所述的多中心研究的数据质量评价***基础上,还可以设置数据质量专家评价模块,数据质量专家评价模块可以调取数据质量符合性检测模块输出的检测结果,并给出人工评价意见;数据质量专家评价模块支持多专家评审端口,根据评审规则汇总形成专家组的评审意见;数据质量专家评价模块也可以调动数据质量标准智能推荐模块,接收数据质量标准智能推荐模块推荐的定量标准,并按推荐标准再次进行数据质量符合性检测,被接受的推荐标准存入数据质量标准知识库,对数据质量标准知识库进行更新。
在本实施例中,所述评价结果报告模块的评价报告可以由数据质量专家评价模块的结果生成评价报告,也可以直接接收数据质量符合性检测模块的结果生成评价报告。
实施例四:
如图1或图2所示,在实施例一或实施二所述的多中心研究的数据质量评价***基础上,所述数据质量标准知识库接受推荐标准进行更新,数据质量标准知识库的数据质量标准也可以提供给多中心研究数据库,供多中心调取使用。
以上对本申请所提供的一种多中心研究的数据质量评价方法、***及设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (5)
1.一种多中心研究的数据质量评价***,其特征在于,包括:
数据上报模块,数据上报模块由各中心调用,用于上报本中心纳入多中心研究的数据;
数据预处理模块,数据预处理模块对获得的数据进行格式转换以及去除噪声影响,对没有通过数据预处理的被试输出报错信息;
多中心数据校正模块,多中心数据校正模块收集经预处理后的多中心数据,进行协调校正处理,以消除不同中心数据非生物原因造成的数据间差异;
多中心数据存储模块,多中心数据存储模块部署于***服务器,用于将预处理和校正后的多中心数据及数据采集基本参数表存储在多中心研究数据库中;
数据质量符合性检测模块,数据质量符合性检测模块从***的数据质量标准知识库中依据研究类型选择评价标准,逐个比对数据质量标准符合情况并输出至评价结果报告模块,生成数据质量评价报告结果;
数据质量标准智能推荐模块,数据质量标准智能推荐模块由用户调取,以***存储的数据质量标准知识库的数据质量标准为初始值,为寻求满足研究条件的更佳的数据质量标准为目标,按照多目标约束优化的方法根据多中心研究数据的真实情况进行标准指标项数值的最优选择,并输出推荐标准;该推荐标准返回数据质量符合性检测模块进行符合性检测,满足符合性检测的则存储入数据质量标准知识库对标准知识库进行更新;以及,
数据质量标准知识库,数据质量标准知识库存储数据质量标准,并接受由数据质量标准智能推荐模块生成的推荐标准,以及数据质量标准知识库将推荐标准提供给多中心研究数据库,供多中心调取使用;
所述数据质量标准智能推荐模块按照多目标约束优化的方法进行标准指标项的最优选择;不失一般性,设有M个数据质量评价目标函数,N个待评价的标准指标项决策变量,其优化问题描述为:
其中,
RN为N维标准指标项决策变量,x=(x1,x2,…,xN)是待评价的第i个指标,D是N维评价指标空间;/>RM为M维目标变量,S为M维解空间;F(x)定义了M个由评价指标空间向解空间映射的目标分量函数,其中fi(x)是目标函数F(x)的第i个目标分量函数,代表更优的数据质量评价目标;gi(x)≤0,(i=1,2,...,p)定义了p个不等式约束条件,即指标项要满足的不等式约束条件,hj(x)=0,(j=1,2,...,q)定义了q个等式约束条件;Max表示多目标问题的优化模式是寻找最大值,其对应的输出x=(x1,x2,…,xN)就是推荐的最优解。
2.根据权利要求1所述的多中心研究的数据质量评价***,其特征在于:还包括数据质量专家评价模块,数据质量专家评价模块能够调取数据质量符合性检测模块输出的检测结果,并给出人工评价意见。
3.根据权利要求2所述的多中心研究的数据质量评价***,其特征在于:所述数据质量专家评价模块能够调用数据质量标准智能推荐模块,接收数据质量标准智能推荐模块推荐的定量标准,并按推荐标准再次进行数据质量符合性检测,被接受的推荐标准存入数据质量标准知识库,对数据质量标准知识库进行更新。
4.一种多中心研究的数据质量评价方法,其特征是,具体包括以下步骤:
(1)多中心上报医学影像数据;
(2)上报的医学影像数据进行格式转换以及去除噪声影响预处理后传送至多中心数据校正模块处理,对没有通过数据预处理的被试输出报错信息;
(3)多中心数据校正模块收集经数据格式转换及去噪声处理后的多中心数据,进行协调校正处理;校正后的数据及获取的数据采集基本参数表存储于多中心研究数据库;
(4)数据质量符合性检测模块从***的数据质量标准知识库中依据研究类型选择评价标准,比对数据质量标准符合情况,并生成数据质量评价报告结果;
(5)由用户调取数据质量标准智能推荐模块,以***存储的数据质量标准知识库的数据质量标准为初始值,根据研究需求寻求满足条件的更佳的数据质量标准为目标,基于多目标约束优化算法对存储的多中心数据基本参数信息进行迭代优化,自动生成满足数据质控指标的推荐定量标准;所述数据质量标准智能推荐模块按照多目标约束优化的方法进行标准指标项数值的最优选择,并输出推荐结果,即推荐标准,该推荐标准返回数据质量符合性检测模块进行符合性检测,满足符合性检测的则存储入数据质量标准知识库对标准知识库进行更新,数据质量标准知识库将推荐标准提供给多中心研究数据库,供多中心调取使用;
所述数据质量标准智能推荐模块按照多目标约束优化的方法进行标准指标项的最优选择;不失一般性,设有M个数据质量评价目标函数,N个待评价的标准指标项决策变量,其优化问题描述为:
其中,
RN为N维标准指标项决策变量,x=
(x1,x2,…,xN)是待评价的第i个指标,D是N维评价指标空间;RM为M维目标变量,S为M维解空间;F(x)定义了M个由评价指标空间向解空间映射的目标分量函数,其中fi(x)是目标函数F(x)的第i个目标分量函数,代表更优的数据质量评价目标;gi(x)≤0,(i=1,2,...,p)定义了p个不等式约束条件,即指标项要满足的不等式约束条件,
hj(x)=0,(j=1,2,...,q)定义了q个等式约束条件;Max表示多目标问题的优化模式是寻找最大值,其对应的输出
x=(x1,x2,…,xN)就是推荐的最优解。
5.一种多中心研究的数据质量评价设备,包括如权利要求1-3任一项所述的评价***。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210378683.9A CN115050479B (zh) | 2022-04-12 | 2022-04-12 | 多中心研究的数据质量评价方法、***及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210378683.9A CN115050479B (zh) | 2022-04-12 | 2022-04-12 | 多中心研究的数据质量评价方法、***及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115050479A CN115050479A (zh) | 2022-09-13 |
CN115050479B true CN115050479B (zh) | 2023-08-04 |
Family
ID=83158274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210378683.9A Active CN115050479B (zh) | 2022-04-12 | 2022-04-12 | 多中心研究的数据质量评价方法、***及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115050479B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102019207B1 (ko) * | 2018-11-12 | 2019-09-06 | 주식회사 와이즈넛 | 텍스트 분석을 위한 데이터 품질 평가 장치 및 방법 |
WO2022000803A1 (zh) * | 2020-07-02 | 2022-01-06 | 航天物联网技术有限公司 | 一种基于多源数据融合模型的军事训练水平综合评估方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5282493B2 (ja) * | 2008-09-04 | 2013-09-04 | 富士通株式会社 | 最適解関係表示装置、方法、及びプログラム |
DE102009044376A1 (de) * | 2009-10-30 | 2011-05-12 | Michael Wirtz | Vorrichtung und Verfahren zur Bestimmung eines Qualitätsindexes |
CN101777095A (zh) * | 2010-02-05 | 2010-07-14 | 廖利民 | 残疾人泌尿系易患重大疾病数据上报分析*** |
CN102708149A (zh) * | 2012-04-01 | 2012-10-03 | 河海大学 | 数据质量管理方法和*** |
KR101667270B1 (ko) * | 2015-03-17 | 2016-10-19 | 대우조선해양 주식회사 | 정도 분석 시뮬레이션 결과를 이용한 정도 품질 평가 시스템 |
CN105550511B (zh) * | 2015-12-11 | 2018-02-09 | 北京锐软科技股份有限公司 | 一种基于数据校验技术的数据质量测评***及方法 |
CN110347662B (zh) * | 2019-07-12 | 2021-08-03 | 之江实验室 | 一种基于通用数据模型的多中心医疗数据结构标准化*** |
CN113035308B (zh) * | 2021-04-19 | 2024-02-23 | 上海智赢健康科技有限公司 | 电子健康档案的质量评价方法和*** |
-
2022
- 2022-04-12 CN CN202210378683.9A patent/CN115050479B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102019207B1 (ko) * | 2018-11-12 | 2019-09-06 | 주식회사 와이즈넛 | 텍스트 분석을 위한 데이터 품질 평가 장치 및 방법 |
WO2022000803A1 (zh) * | 2020-07-02 | 2022-01-06 | 航天物联网技术有限公司 | 一种基于多源数据融合模型的军事训练水平综合评估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115050479A (zh) | 2022-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109411082B (zh) | 一种医疗质量评价及就诊推荐方法 | |
CN113314205B (zh) | 一种高效的医学影像标注与学习*** | |
US20210225510A1 (en) | Human body health assessment method and system based on sleep big data | |
CN111493822A (zh) | 一种基于睡眠脑电的快速眼动期睡眠行为障碍分类方法 | |
CN114549469A (zh) | 一种基于置信度校准的深层神经网络医疗图像诊断方法 | |
Stripelis et al. | Scaling neuroscience research using federated learning | |
CN111436929A (zh) | 一种神经生理信号的生成和识别方法 | |
CN117542536B (zh) | 一种基于体检数据的智能护理方法及*** | |
CN114748053A (zh) | 一种基于fMRI高维时间序列的信号分类方法及装置 | |
CN115148327B (zh) | 一种面向麻醉智能决策的多方协同原型***及其方法 | |
CN115271033B (zh) | 基于联邦知识蒸馏医学图像处理模型构建及其处理方法 | |
CN115185936A (zh) | 一种基于大数据的医疗临床数据质量分析*** | |
CN115050479B (zh) | 多中心研究的数据质量评价方法、***及设备 | |
CN116542401B (zh) | 一种住院诊疗服务单元的医保超支预测方法与*** | |
CN116344042B (zh) | 基于多模态分析的认知储备干预提升方法及*** | |
CN113257410A (zh) | 一种基于中医临床医疗知识库和深度学习模型的问诊方法 | |
CN117095828A (zh) | 基于糖尿病患者随访记录的血糖值预测和告警方法 | |
CN117338234A (zh) | 一种屈光度与视力联合检测方法 | |
CN116469148A (zh) | 一种基于面部结构识别的概率预测***及预测方法 | |
CN116309754A (zh) | 一种基于局部-全局信息协作的大脑医学图像配准方法及*** | |
CN112530598B (zh) | 一种基于健康数据的健康风险自测量表推荐方法 | |
CN115798709A (zh) | 基于多任务图同构网络的阿尔兹海默病分类装置及方法 | |
CN111243697A (zh) | 一种基于神经网络对目标对象数据进行判断的方法及*** | |
CN118260684B (zh) | 一种基于人工智能的fMRI分类方法 | |
CN113517057B (zh) | 基于数据表示和神经网络的医疗图像信息识别存储方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 214000 1000 Hefeng Road, Binhu District, Wuxi City, Jiangsu Province Applicant after: AFFILIATED HOSPITAL OF JIANGNAN University Address before: No. 1-2202-8, Financial Eighth Street, Wuxi Economic Development Zone, Wuxi City, Jiangsu Province, 214000 Applicant before: AFFILIATED HOSPITAL OF JIANGNAN University |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |