CN117219214B - 一种临床科研一体化信息平台的数据管理方法 - Google Patents
一种临床科研一体化信息平台的数据管理方法 Download PDFInfo
- Publication number
- CN117219214B CN117219214B CN202311467304.4A CN202311467304A CN117219214B CN 117219214 B CN117219214 B CN 117219214B CN 202311467304 A CN202311467304 A CN 202311467304A CN 117219214 B CN117219214 B CN 117219214B
- Authority
- CN
- China
- Prior art keywords
- parameters
- parameter information
- disease
- case
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000011160 research Methods 0.000 title claims abstract description 24
- 238000013523 data management Methods 0.000 title claims abstract description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 107
- 201000010099 disease Diseases 0.000 claims abstract description 105
- 238000013507 mapping Methods 0.000 claims description 21
- 238000003745 diagnosis Methods 0.000 claims description 18
- 230000010354 integration Effects 0.000 claims description 13
- 238000013500 data storage Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 2
- 239000007787 solid Substances 0.000 abstract description 2
- 206010036790 Productive cough Diseases 0.000 description 10
- 210000003802 sputum Anatomy 0.000 description 9
- 208000024794 sputum Diseases 0.000 description 9
- 206010011224 Cough Diseases 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 102000001554 Hemoglobins Human genes 0.000 description 4
- 108010054147 Hemoglobins Proteins 0.000 description 4
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 3
- 206010037660 Pyrexia Diseases 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 201000005202 lung cancer Diseases 0.000 description 3
- 208000020816 lung neoplasm Diseases 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 206010006458 Bronchitis chronic Diseases 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010036226 antigen CYFRA21.1 Proteins 0.000 description 2
- 206010006451 bronchitis Diseases 0.000 description 2
- 208000007451 chronic bronchitis Diseases 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 206010029410 night sweats Diseases 0.000 description 2
- 230000036565 night sweats Effects 0.000 description 2
- 230000036387 respiratory rate Effects 0.000 description 2
- 206010008479 Chest Pain Diseases 0.000 description 1
- 206010008469 Chest discomfort Diseases 0.000 description 1
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 1
- 208000000059 Dyspnea Diseases 0.000 description 1
- 206010013975 Dyspnoeas Diseases 0.000 description 1
- 206010062717 Increased upper airway secretion Diseases 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 206010037437 Pulmonary thrombosis Diseases 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 201000009267 bronchiectasis Diseases 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 201000003453 lung abscess Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000026435 phlegm Diseases 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 208000020029 respiratory tract infectious disease Diseases 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
一种临床科研一体化信息平台的数据管理方法,包括:若参数类型表中不存在未标记的参数的次数大于等于第一阈值,结束;否则,获取并标记参数类型表中未被标记的且参数的次数大于等于第二阈值的所有参数,其中,第一阈值大于第二阈值;基于所述所有参数,新建病例表;对临时表中的疾病参数信息逐一进行判断,基于所述所有参数,将临时表中的疾病参数信息存储至新建的病例表中,并修改临时表中所述疾病参数信息的参数字符串;对新建的病例表中的每一个疾病参数信息,若参数字符串为空,从临时表中删掉所述疾病参数信息。本发明首先通过对数据库进行了迭代式的设计,确保能够兼容更多的参数,为临床科研一体化信息平台提供坚实的数据基础。
Description
技术领域
本发明属于临床科研领域,更具体的,涉及一种临床科研一体化信息平台的数据管理方法。
背景技术
随着全球化的加速和技术的快速发展,企业和组织面临着越来越复杂的挑战。为了应对这些挑战,许多组织开始寻求更加灵活和高效的工作模式。基于此,ARO-CRO-SMO分工合作模式应运而生,它是一种新型的合作模式,旨在将不同的专业领域进行整合,提高工作效率和质量。ARO-CRO-SMO 分工合作模式在许多领域都得到了广泛应用,特别是在制药、生物技术和医疗器械等行业。通过这种模式,企业和组织可以更加快速和高效地进行研究和开发,推动技术和产品的创新。
更为具体的,本发明的临床科研一体化信息平台用于实现临床大数据与科研数据资源整合共享,随着大量的病患疾病信息也被***地记录和存储。这种积累的信息逐步催生了一种依赖大数据智能化的诊疗方法。
更具体地说,如果我们以与咳嗽相关的疾病为例,这其中就包括了慢性支气管炎、慢性阻塞性肺疾病、肺结核、肺脓肿、肺血栓、肺部炎症、支气管扩张症和肺癌等多种疾病。在很多情况下,医生可能仅仅是根据一些基本的生理信息来做出诊断,这极有可能会导致误诊或漏诊,进而造成严重的后果。因此,在这种情况下,临床科研一体化信息平台的辅助诊疗就显得尤为重要。
这个平台不仅能够帮助医生更加全面地了解患者的情况,还能够通过分析大量的数据,帮助医生做出更加准确的诊断。这样,就能够避免因为缺乏信息而造成的误诊或漏诊,从而保护患者的健康。
在当前的技术中,患者的疾病信息主要依赖于生理参数(即通过医疗设备测量得到的数据)。然而,病历中的信息,如病史、患者的口头描述等,通常是文本形式的,过于抽象,因此难以整合到大数据分析中。但是,仅依赖生理参数信息是不够的,结合病历中的文本信息才能更全面地了解患者的情况,从而避免误诊或漏诊。临床科研一体化信息平台的作用就是整合这两方面的信息,以提供更全面的诊疗建议。
以咳嗽关联的疾病为例,其中,慢性支气管炎的患者可能发生的症状有:持续的咳嗽、咳痰、呼吸困难、胸部不适、呼吸道感染等等。如果仅仅根据生理参数,如此众多且相似的疾病,容易造成误判与漏判。临床科研一体化信息平台如图1所示,包括:自然语言处理模块、数据控制模块、数据存储模块、数据访问模块与辅助诊断模块。其中,自然语言处理模块用于生成疾病参数信息,例如,可以根据病史的语义描述,定量化的生成相应的疾病参数信息;数据控制模块用于对数据库中的数据进行整合;数据存储模块可以是数据库,用于存储疾病参数信息。数据访问模块用于访问数据库,获取数据库中的数据。辅助诊断模块用于根据疾病参数信息,进行辅助诊断。在一些实施例中,辅助诊断模块可以基于深度学习算法,构建监督学习分类器,从而进行辅助诊断。
发明内容
为解决现有技术中存在的不足,本发明的目的在于解决上述缺陷,进而提出一种临床科研一体化信息平台的数据管理方法。
本发明采用如下的技术方案。
本发明第一方面公开了一种临床科研一体化信息平台的数据管理方法,包括数据整合方法、数据存储方法以及数据访问方法;数据整合方法包括步骤C1~步骤C5;
步骤C1,若参数类型表中不存在未标记的参数的次数大于等于第一阈值,结束步骤;
步骤C2,否则,获取并标记参数类型表中未被标记的且参数的次数大于等于第二阈值的所有参数,其中,第一阈值大于第二阈值;
步骤C3,基于所述所有参数,新建病例表;
步骤C4,对临时表中的疾病参数信息逐一进行判断,基于所述所有参数,将临时表中的疾病参数信息存储至新建的病例表中,并修改临时表中所述疾病参数信息的参数字符串;
步骤C5,对新建的病例表中的每一个疾病参数信息,若参数字符串为空,从临时表中删掉所述疾病参数信息。
进一步的,数据整合方法设置为每日的夜间定时触发。
进一步的,步骤C3具体包括步骤C31~步骤C32;
步骤C31,基于所有参数的数量、所有参数对应的次数以及疾病参数信息的总条数,计算出统计参数的个数;
步骤C32,基于统计参数的个数,新建病例表。
进一步的,数据存储方法可以包括步骤S1~步骤S2;
步骤S1,响应于接收病史、疾病检查与诊断结果,并基于病史、疾病检查与诊断结果,生成疾病参数信息;
步骤S2,基于参数类型表中参数的标记,将疾病参数信息存储至临时表或病例表中。
进一步的,基于病史生成的疾病参数信息,通过词嵌入算法将语义转化成对应的键值对。
进一步的,步骤C5还包括:若参数字符串不为空,更新新建的病例表中所述疾病参数信息对应的next字段为临时表;相应的,步骤S2还包括:疾病参数信息存储至每一个病历表中时,根据参数类型表中参数的标记,以字段next记录下一次迭代的表名。
进一步的,数据访问方法包括单条数据查询方法,包括步骤A11~步骤A13;
步骤A11,以一级病例表作为目标表;若不存在一级病例表,则将临时表作为目标表;其中,一级病例表为最先创建的病例表;
步骤A12,在目标表中,根据ID查询对应的疾病参数信息,并判断所述疾病参数信息中对应的next是否为空;
步骤A13,若为空,结束步骤;若不为空,以next作为目标表,返回步骤A12。
进一步的,步骤C3还包括:在参数类型表中,将所述所有参数建立依次以2的幂次建立索引;并且数据访问方法包括关联数据查询方法,包括步骤A21~步骤A22;
步骤A21,根据参数类型表,生成疾病参数信息对应的至少一个映射字符串,其中,每一个映射字符串基于参数类型表中的索引生成,并关联一个病例表名;
步骤A22,对每一个映射字符串,在所述映射字符串关联的病例表名中进行查找,获取关联的疾病参数信息。
本发明第二方面公开了一种终端,包括处理器及存储介质;其特征在于:
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行第一方面所述方法的步骤。
本发明第三方面公开了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现第一方面所述方法的步骤。
本发明的有益效果在于,与现有技术相比,本发明具有以下优点:
(1)本发明首先通过对数据库进行了迭代式的设计,确保能够兼容更多的参数,为临床科研一体化信息平台提供坚实的数据基础。在迭代式的设计中,以参数的次数作为病例表的分类基础,一定程度上减少了同一个疾病参数信息分布在多个病例表中的情况。此外,也减少了所有病例表中数据的总条数。
(2)在此基础上,本发明创造性的引入统计参数与映射字符串,防止症状概率很低导致后期创建的病历表,例如二级病历表中的大量字段为空,造成空间上的浪费,同时也降低了访问效率。
(3)映射字符串应用于关联数据查询方法之中。在此基础上,本发明创造性的引入索引以建立映射字符串。通过计算映射字符串,可以快速访问相同病症的病人,也就是关联的疾病参数信息。
附图说明
图1是一种临床科研一体化信息平台的示意图。
图2是一种临床科研一体化信息平台的数据整合方法的流程图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
基于此,本发明公开了一种临床科研一体化信息平台的数据管理方法,包括数据整合方法、数据存储方法以及数据访问方法。
数据整合方法可以设置为定时触发,或者响应于存储疾病参数信息时(即:执行数据存储方法时)触发,如图2所示,可以包括步骤C1~步骤C5。
步骤C1,若参数类型表中不存在未标记的参数的次数大于等于第一阈值,结束步骤。
步骤C2,否则,获取并标记参数类型表中未被标记的且参数的次数大于等于第二阈值的所有参数,其中,第一阈值大于第二阈值。
步骤C3,基于所述所有参数,新建病例表。
步骤C4,对临时表中的疾病参数信息逐一进行判断,基于所述所有参数,将临时表中的疾病参数信息存储至新建的病例表中,并修改临时表中所述疾病参数信息的参数字符串。
步骤C5,对新建的病例表中的每一个疾病参数信息,若参数字符串为空,从临时表中删掉所述疾病参数信息。
在一些实施例中,为了分摊临床科研一体化信息平台的线程压力,数据整合方法可以设置为每日的夜间定时触发。
为了方便起见,将上述提及的参数(例如:下文中的白色粘痰、血红蛋白、CEA等)表示为wi,其中,i为正整数。参数类型表可以如表1所示。
表1
参数 | 次数 | 单位 | 病例表名 | 索引 |
w1 | 1 | 次 | case_tmp | |
w2 | 72 | 次/分 | case_20221118 | 1 |
w3 | 126 | g/mL | case_20210213 | 1 |
w4 | 213 | g/mL | case_20210213 | 2 |
w5 | 47 | ng/mL | case_20221118 | 2 |
w6 | 27 | 次 | case_20221118 | 4 |
w7 | 88 | 10^9/L | case_20221118 | 8 |
参数的次数表示参数在所有疾病参数信息中的数量。也就是说,若此时响应于存储一条新的疾病参数信息时,且疾病参数信息包括白色粘痰与CEA这两个参数,而不包括血红蛋白,则白色粘痰与CEA的值分别加1。
第一阈值的设置区间可以为[100,500],第二阈值的设置区间可以为[2,10]。如果临床科研一体化信息平台初始化时,此时参数类型表中所有参数的次数必然等于0。
或者在第一实施例中,如果以表1作为参考,并假设第一阈值与第二阈值在本发明的所有实施例中分别设置为100与5,可以理解的是,假设步骤C3新建的病例表为case_20221118,则步骤C2中刚刚被标记的参数为w2,w5,w6与w7。而w3与w4作为字段信息存储至先前创建的病例表(例如:case_20210213)中。而这个字段尚未出现在任何病例表中。通过这种迭代式的设计方式,既能够兼容所有的参数,即将所有的参数进行定量化的存储而非以字符串形式存储,以便于随时访问分析。此外,对于出现次数较少(即达不到第二阈值)的参数,例如w1,由于这些参数数据量不足导致暂时缺乏分析的意义,则暂不进行定量化存储,则将其存储至临时表,即case_tmp中。
进一步的,步骤C3还包括:在参数类型表中,将所述所有参数建立依次以2的幂次建立索引。也就是说,在同一个病例表名下,不同的参数的索引可以依次为1、2、4、8、16等。
从上段可知,病例表是随着参数不断迭代生成的,因此其数量为至少一个。为了方便描述,对病例表按照创建的时间为顺序,依次称为k级病例表,其中,k为正整数。
一级病例表可以如表2所示。
表2
ID | time | w3 | w4 | next | map |
101 | 12 | 33 | case_tmp | 3 | |
102 | 4 | 41 | case_tmp | 3 | |
103 | 37 | 2 |
其中,ID用于标识病人,time为该条疾病参数信息的创建时间,next用于表示该条疾病参数信息是否结束。以一级病例表为例,假设疾病参数信息中仅含参数w3,则next为空;假设疾病参数信息中含参数w3与w5,则next不为空。也就是说,同一个疾病参数信息,其结果可能分布在多个不同的病例表中。map为参数的索引之和,用于方便本发明实施例的数据访问方法。
在步骤C2中,若病例表名不为临时表,则其对应的字段为已标记,例如:w3与w5;若病例表名为临时表,则其对应的字段为未标记,例如:w1。
表3与表4分别示例性的示出了临时表与二级病例表。
表3
ID | time | parameter |
101 | “w2:14” | |
102 | “w1:3;w5:22;w6:15;w7:9” |
表4
ID | time | para1 | para2 | next | map | remain |
101 | 14 | 1 | ||||
102 | 22 | 15 | case_tmp | 14 | “9” |
其中,临时表可以看成是0级病例表,其包括字段parameter,类型为字符串,采用键值对的方式进行存储。在第一实施例中,即假设步骤C3新建的病例表为case_20221118,此时,步骤C4对临时表的疾病参数信息逐一判断。将临时表中的疾病参数信息存储至新建的病例表case_20221118中,可以如表4所示。可理解的,执行完步骤C5后,ID为101的疾病参数信息从临时表中删除,而ID为102的疾病参数信息的parameter更新为“w1:3”。
进一步的,步骤C5还包括:若参数字符串不为空,更新新建的病例表中所述疾病参数信息对应的next字段为临时表。即步骤C5还需要更新一下新建的病例表case_20221118中,所有疾病参数信息在上一级病例表中的next字段。也就是说,在表2(也就是病例表case_20210213)中,需要将ID为101与102的疾病参数信息的next更新为“case_20221118”。
二级病例表可以与一级病例表类似,即如表2所示。然而更优选的,二级病例表可以如表4所示。这是因为二级病例表中关联的参数基本为非常规症状。且病例表的级别越高,症状的概率越低。为了节省空间,防止二级病例表中的大量字段为空字符,同时也为了提高访问的效率,步骤C3可以具体包括步骤C31~步骤C32。
步骤C31,基于所有参数的数量、所有参数对应的次数以及疾病参数信息的总条数,计算出统计参数的个数。
步骤C32,基于统计参数的个数,新建病例表。
具体的,统计参数的个数可以参考下式所示:
其中,为所有参数的数量,/>为第/>个参数对应的次数,/>为疾病参数信息的总条数,/>为固定的大于1的常数,可以参考散列表的装填因子,例如可以是装填因子的倒数。这里需要注意的是,一方面,/>一定是严格小于/>的,而且至少应当小于/>,否则节约的空间有限,则不应当采用步骤C31~步骤C32的方法。另一方面,/>至少应当大于等于1。
在表4中,的值为2,/>的值为4。当出现极端情形时,例如,ID为101的疾病参数信息的字段为3个,大于/>。此时,表4中的字段remain用于存储剩余的参数对应的值,如果有多个值,则可以以分号隔开。
相应的,数据存储方法可以包括步骤S1~步骤S2。
步骤S1,响应于接收病史、疾病检查与诊断结果,并基于病史、疾病检查与诊断结果,生成疾病参数信息。
步骤S2,基于参数类型表中参数的标记,将疾病参数信息存储至临时表或至少一个病例表中。
例如,病人A的病史可以是:三个月前开始出现咳嗽,无明显诱因,伴有白色粘痰,逐渐加重。近一个月来,咳嗽加重,偶尔咳出少量血丝,伴有左侧胸口微痛,无发热、盗汗、夜间盗汗。疾病检查可以是:呼吸频率:20次/分,血红蛋白:150g/mL,白细胞:7.0*10^9/L,血小板:300*10^9/L,CEA:4ng/mL,CYFRA21-1:3.0ng/mL。诊断结果可以是:肺癌。因此,对应的疾病类型为:肺癌,对应的疾病参数信息中的多个参数可以是:呼吸频率:20次/分,血红蛋白:150g/mL,白细胞:7.0*10^9/L,血小板:300*10^9/L,CEA:4ng/mL,CYFRA21-1:3.0ng/mL;咳嗽天数:90,白色粘痰:3,血丝痰:2,胸痛:1,发热:0,盗汗:0。可理解的,疾病参数信息包括:ID、time、多个参数与疾病类型。
通过病史生成的疾病参数信息具体可以根据病史的语义描述,定量化的生成相应的疾病参数信息。例如,上段中对于白色粘痰、血丝与发热等症状的描述为“白色粘痰”、“少量血丝”以及“无发热”。以0~5进行打分,对应于“超多”、“较多”、“正常”、“较少”、“微量”与“无”。则可以基于词嵌入(Word Embeddings)算法,对这些语义进行分析,也就是训练学习,最终转化成对应的键值对,也就是参数与参数的值。例如,白色粘痰:3,血丝痰:2,发热:0。
可理解的,若疾病参数信息中存在参数x,并未出现在参数类型表中,则需要在参数类型表中添加该参数x,同时初始化次数、单位与病例表名。其中,次数设置为1,病例表名初始化为case_tmp。
可理解的,在参数类型表中,参数对应的病例表名限定了该疾病参数信息存储在哪些表中。以表1为例,若疾病参数信息中的参数仅包括w3,则将该疾病参数信息存储至case_20210213中;若疾病参数信息中的参数包括w3、w7与w8,则将该疾病参数信息分别存储至case_20210213、case_20221118与case_tmp中。需要说明的是,若疾病参数信息中的参数仅包括w7与w8,则该疾病参数信息也需要备份至case_20210213中。也就是说,所有的疾病参数信息都需要至少备份一次至一级病例表中。
步骤S2还包括:疾病参数信息存储至每一个病历表中时,根据参数类型表中参数的标记,以字段next记录下一次迭代的表名。可理解的,next字段用于将单个疾病参数信息所存储的病例表的信息串接起来。
相应的,数据访问方法可以支持单条数据查询方法、关联数据查询方法以及全局数据提取方法。其中,全局数据提取方法只需要以ID、time作为主键,提取出临时表与病例表中的所有数据即可。
单条数据查询方法通常以ID作为输入进行查询,可以包括步骤A11~步骤A13。
步骤A11,以一级病例表作为目标表;若不存在一级病例表,则将临时表作为目标表。
步骤A12,在目标表中,根据ID查询对应的疾病参数信息,并判断所述疾病参数信息中对应的next是否为空。
步骤A13,若为空,结束步骤;若不为空,以next作为目标表,返回步骤A12。
可理解的,若目标表中没有next字段,例如:临时表中就没有next字段,则视为next为空。
关联数据查询方法作为辅助诊断的重要手段,通常以疾病参数信息,也就是步骤A21中的疾病参数信息作为目标输入,查找与目标输入关联的疾病参数信息的情况。关联数据查询方法可以包括步骤A21~步骤A22。
步骤A21,根据参数类型表,生成疾病参数信息对应的至少一个映射字符串,其中,每一个映射字符串基于参数类型表中的索引生成,并关联一个病例表名。
步骤A22,对每一个映射字符串,在所述映射字符串关联的病例表名中进行查找,获取关联的疾病参数信息。
以表1作为说明,假设目标输入中的参数包括w3~w6,则一共生成2个映射字符串,对应于case_20221118的映射字符串为6,而对应于case_20221118的映射字符串为3。也就是说,映射字符串为所述目标输入中参数在同一个病例表名的索引之和。通过计算映射字符串,可以快速访问相同病症的病人,也就是关联的疾病参数信息。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
Claims (7)
1.一种临床科研一体化信息平台的数据管理方法,包括数据整合方法、数据存储方法以及数据访问方法;其特征在于,数据整合方法包括步骤C1~步骤C5;
步骤C1,若参数类型表中不存在未标记的参数的次数大于等于第一阈值,结束步骤;参数的次数表示参数在所有疾病参数信息中的数量;
步骤C2,否则,获取并标记参数类型表中未被标记的且参数的次数大于等于第二阈值的所有参数,其中,第一阈值大于第二阈值;
步骤C3,基于所述所有参数,新建病例表;
步骤C3具体包括步骤C31~步骤C32;
步骤C31,基于所有参数的数量、所有参数对应的次数以及疾病参数信息的总条数,计算出统计参数的个数;
步骤C32,基于统计参数的个数,新建病例表;
步骤C4,对临时表中的疾病参数信息逐一进行判断,基于所述所有参数,将临时表中的疾病参数信息存储至新建的病例表中,并修改临时表中所述疾病参数信息的参数字符串;临时表用于存储疾病参数信息中参数的次数小于第二阈值的参数;
步骤C5,对新建的病例表中的每一个疾病参数信息,若参数字符串为空,从临时表中删掉所述疾病参数信息;
数据存储方法包括步骤S1~步骤S2;
步骤S1,响应于接收病史、疾病检查与诊断结果,并基于病史、疾病检查与诊断结果,生成疾病参数信息;
步骤S2,基于参数类型表中参数的标记,将疾病参数信息存储至临时表或至少一个病例表中;其中,存储至临时表或至少一个病例表由参数类型表中参数对应的病例表名所限定;
步骤C5还包括:若参数字符串不为空,更新新建的病例表中所述疾病参数信息对应的next字段为临时表;相应的,步骤S2还包括:疾病参数信息存储至每一个病历表中时,根据参数类型表中参数的标记,以字段next记录下一次迭代的表名。
2.根据权利要求1所述的一种临床科研一体化信息平台的数据管理方法,其特征在于,数据整合方法设置为每日的夜间定时触发。
3.根据权利要求1所述的一种临床科研一体化信息平台的数据管理方法,其特征在于,基于病史生成的疾病参数信息,通过词嵌入算法将语义转化成对应的键值对。
4.根据权利要求1所述的一种临床科研一体化信息平台的数据管理方法,其特征在于,数据访问方法包括单条数据查询方法,包括步骤A11~步骤A13;
步骤A11,以一级病例表作为目标表;若不存在一级病例表,则将临时表作为目标表;其中,一级病例表为最先创建的病例表;
步骤A12,在目标表中,根据ID查询对应的疾病参数信息,并判断所述疾病参数信息中对应的next是否为空;
步骤A13,若为空,结束步骤;若不为空,以next作为目标表,返回步骤A12。
5.根据权利要求1所述的一种临床科研一体化信息平台的数据管理方法,其特征在于,步骤C3还包括:在参数类型表中,将所述所有参数建立依次以2的幂次建立索引;并且数据访问方法包括关联数据查询方法,包括步骤A21~步骤A22;
步骤A21,根据参数类型表,生成疾病参数信息对应的至少一个映射字符串,其中,每一个映射字符串基于参数类型表中的索引生成,并关联一个病例表名;
步骤A22,对每一个映射字符串,在所述映射字符串关联的病例表名中进行查找,获取关联的疾病参数信息。
6.一种终端,包括处理器及存储介质;其特征在于:
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1-5任一项所述方法的步骤。
7.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311467304.4A CN117219214B (zh) | 2023-11-07 | 2023-11-07 | 一种临床科研一体化信息平台的数据管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311467304.4A CN117219214B (zh) | 2023-11-07 | 2023-11-07 | 一种临床科研一体化信息平台的数据管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117219214A CN117219214A (zh) | 2023-12-12 |
CN117219214B true CN117219214B (zh) | 2024-02-20 |
Family
ID=89039262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311467304.4A Active CN117219214B (zh) | 2023-11-07 | 2023-11-07 | 一种临床科研一体化信息平台的数据管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117219214B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105849768A (zh) * | 2013-11-28 | 2016-08-10 | 富士胶片株式会社 | 诊疗信息处理装置、方法及程序 |
CN107833595A (zh) * | 2017-10-12 | 2018-03-23 | 山东大学 | 医疗大数据多中心整合平台及方法 |
CN108028077A (zh) * | 2015-09-10 | 2018-05-11 | 豪夫迈·罗氏有限公司 | 用于整合临床护理的信息学平台 |
CN112286956A (zh) * | 2020-10-28 | 2021-01-29 | 深圳市人民医院 | 一种临床数据处理方法以及相关装置 |
CN113871025A (zh) * | 2021-09-08 | 2021-12-31 | 四川大学华西医院 | 一种皮肤科临床专病数据库建设方法和*** |
US11443835B1 (en) * | 2017-06-30 | 2022-09-13 | Express Scripts Strategie Development, Inc. | Methods and systems for processing data inquires |
CN115841862A (zh) * | 2022-12-02 | 2023-03-24 | 启昇耀康信息科技(上海)有限公司 | 病例报告表生成方法、装置、设备及存储介质 |
CN115858823A (zh) * | 2023-02-28 | 2023-03-28 | 山东中医药大学第二附属医院(山东省中西医结合医院) | 一种中医药知识图谱的构建方法和*** |
CN116705255A (zh) * | 2023-05-22 | 2023-09-05 | 辽宁省检验检测认证中心 | 一种大智慧医疗基因测序分析管理*** |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015134668A1 (en) * | 2014-03-04 | 2015-09-11 | The Regents Of The University Of California | Automated quality control of diagnostic radiology |
AU2016228845A1 (en) * | 2015-03-10 | 2017-09-21 | Elekta, Inc. | Adaptive treatment management system with a workflow management engine |
US11545242B2 (en) * | 2019-06-21 | 2023-01-03 | nference, inc. | Systems and methods for computing with private healthcare data |
-
2023
- 2023-11-07 CN CN202311467304.4A patent/CN117219214B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105849768A (zh) * | 2013-11-28 | 2016-08-10 | 富士胶片株式会社 | 诊疗信息处理装置、方法及程序 |
CN108028077A (zh) * | 2015-09-10 | 2018-05-11 | 豪夫迈·罗氏有限公司 | 用于整合临床护理的信息学平台 |
US11443835B1 (en) * | 2017-06-30 | 2022-09-13 | Express Scripts Strategie Development, Inc. | Methods and systems for processing data inquires |
CN107833595A (zh) * | 2017-10-12 | 2018-03-23 | 山东大学 | 医疗大数据多中心整合平台及方法 |
CN112286956A (zh) * | 2020-10-28 | 2021-01-29 | 深圳市人民医院 | 一种临床数据处理方法以及相关装置 |
CN113871025A (zh) * | 2021-09-08 | 2021-12-31 | 四川大学华西医院 | 一种皮肤科临床专病数据库建设方法和*** |
CN115841862A (zh) * | 2022-12-02 | 2023-03-24 | 启昇耀康信息科技(上海)有限公司 | 病例报告表生成方法、装置、设备及存储介质 |
CN115858823A (zh) * | 2023-02-28 | 2023-03-28 | 山东中医药大学第二附属医院(山东省中西医结合医院) | 一种中医药知识图谱的构建方法和*** |
CN116705255A (zh) * | 2023-05-22 | 2023-09-05 | 辽宁省检验检测认证中心 | 一种大智慧医疗基因测序分析管理*** |
Non-Patent Citations (4)
Title |
---|
Inductive database to support iterative data mining: Application to biomarker analysis on patient data in the Fight-HF project;Emmanuel Bresso et al.;《Journal of Biomedical Informatics》;第135卷;第1-11页 * |
健康医疗大数据价值挖掘分析框架构建;张卫东等;《图书情报工作》;第67卷(第15期);第35-43页 * |
基于大数据平台的医疗健康数据分析与应用模式研究;陶波;《中国优秀硕士学位论文全文数据库 (医药卫生科技辑)》(第03期);第E054-41页 * |
科研管理信息***的设计与实现;薛若雯;《中国优秀硕士学位论文全文数据库 (信息科技辑)》;20110915(第09期);第I138-488页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117219214A (zh) | 2023-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10818383B2 (en) | Hospital matching of de-identified healthcare databases without obvious quasi-identifiers | |
CN107562732B (zh) | 电子病历的处理方法及*** | |
CN109074858B (zh) | 没有明显准标识符的去识别的健康护理数据库的医院匹配 | |
CN110277149A (zh) | 电子病历的处理方法、装置及设备 | |
CN112883157B (zh) | 一种多源异构医疗数据的标准化方法及装置 | |
US20020129031A1 (en) | Managing relationships between unique concepts in a database | |
WO2020247278A1 (en) | Generation of customized personal health ontologies | |
CN112655047B (zh) | 对医学记录分类的方法 | |
WO2021051496A1 (zh) | 诊断结果识别、模型训练的方法、计算机设备及存储介质 | |
CN111292814A (zh) | 一种医疗数据标准化的方法及装置 | |
Grossman et al. | A method for harmonization of clinical abbreviation and acronym sense inventories | |
CN111177309A (zh) | 病历数据的处理方法及装置 | |
CN113343680B (zh) | 一种基于多类型病历文本的结构化信息提取方法 | |
CN111091883A (zh) | 一种医疗文本处理方法、装置、存储介质及设备 | |
CN109102845B (zh) | 医疗单据审核方法、装置、计算机设备和存储介质 | |
Karaca et al. | Frequent pattern mining from multivariate time series data | |
CN117219214B (zh) | 一种临床科研一体化信息平台的数据管理方法 | |
US11914621B2 (en) | Determining an association metric for record attributes associated with cardinalities that are not necessarily the same for training and applying an entity resolution model | |
CN106844325B (zh) | 医疗信息处理方法和医疗信息处理装置 | |
US20230032180A1 (en) | Method and system for empowering cancer patient(s) | |
CN106503457A (zh) | 基于转化医学分析平台的临床数据集成技术数据导入方法 | |
US11269937B2 (en) | System and method of presenting information related to search query | |
EP3654339A1 (en) | Method of classifying medical records | |
US9002863B2 (en) | Method, apparatus and computer program product for providing a rational range test for data translation | |
CN111710431A (zh) | 一种识别同义诊断名称的方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |