CN112233794A - 一种基于血尿信息的疾病信息匹配*** - Google Patents
一种基于血尿信息的疾病信息匹配*** Download PDFInfo
- Publication number
- CN112233794A CN112233794A CN202011125991.8A CN202011125991A CN112233794A CN 112233794 A CN112233794 A CN 112233794A CN 202011125991 A CN202011125991 A CN 202011125991A CN 112233794 A CN112233794 A CN 112233794A
- Authority
- CN
- China
- Prior art keywords
- hematuria
- vector set
- information
- characteristic information
- clinical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000006750 hematuria Diseases 0.000 title claims abstract description 158
- 201000010099 disease Diseases 0.000 title claims abstract description 101
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 101
- 239000013598 vector Substances 0.000 claims abstract description 149
- 238000006243 chemical reaction Methods 0.000 claims abstract description 34
- 238000007781 pre-processing Methods 0.000 claims abstract description 25
- 238000004364 calculation method Methods 0.000 claims abstract description 15
- 238000012163 sequencing technique Methods 0.000 claims abstract description 9
- 208000024891 symptom Diseases 0.000 claims description 9
- 238000000034 method Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 11
- 239000013078 crystal Substances 0.000 description 5
- 210000002700 urine Anatomy 0.000 description 5
- 208000008839 Kidney Neoplasms Diseases 0.000 description 4
- 210000003734 kidney Anatomy 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 206010000077 Abdominal mass Diseases 0.000 description 2
- LEVWYRKDKASIDU-QWWZWVQMSA-N D-cystine Chemical compound OC(=O)[C@H](N)CSSC[C@@H](N)C(O)=O LEVWYRKDKASIDU-QWWZWVQMSA-N 0.000 description 2
- 208000000913 Kidney Calculi Diseases 0.000 description 2
- 206010029148 Nephrolithiasis Diseases 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- 229960003067 cystine Drugs 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000017074 necrotic cell death Effects 0.000 description 2
- 230000001338 necrotic effect Effects 0.000 description 2
- 206010038534 renal tuberculosis Diseases 0.000 description 2
- FDDDEECHVMSUSB-UHFFFAOYSA-N sulfanilamide Chemical compound NC1=CC=C(S(N)(=O)=O)C=C1 FDDDEECHVMSUSB-UHFFFAOYSA-N 0.000 description 2
- 229940124530 sulfonamide Drugs 0.000 description 2
- 206010007027 Calculus urinary Diseases 0.000 description 1
- 108010004103 Chylomicrons Proteins 0.000 description 1
- 206010009168 Chyluria Diseases 0.000 description 1
- 208000026372 Congenital cystic kidney disease Diseases 0.000 description 1
- 208000026292 Cystic Kidney disease Diseases 0.000 description 1
- 206010011793 Cystitis haemorrhagic Diseases 0.000 description 1
- 206010063044 Ectopic kidney Diseases 0.000 description 1
- 208000022461 Glomerular disease Diseases 0.000 description 1
- 208000032843 Hemorrhage Diseases 0.000 description 1
- 241000521257 Hydrops Species 0.000 description 1
- 206010029158 Nephroptosis Diseases 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 1
- 206010061336 Pelvic neoplasm Diseases 0.000 description 1
- 208000022313 Renal and urinary tract injury Diseases 0.000 description 1
- 206010038423 Renal cyst Diseases 0.000 description 1
- 206010061481 Renal injury Diseases 0.000 description 1
- LEHOTFFKMJEONL-UHFFFAOYSA-N Uric Acid Chemical compound N1C(=O)NC(=O)C2=C1NC(=O)N2 LEHOTFFKMJEONL-UHFFFAOYSA-N 0.000 description 1
- TVWHNULVHGKJHS-UHFFFAOYSA-N Uric acid Natural products N1C(=O)NC(=O)C2NC(=O)NC21 TVWHNULVHGKJHS-UHFFFAOYSA-N 0.000 description 1
- 208000009911 Urinary Calculi Diseases 0.000 description 1
- 206010046555 Urinary retention Diseases 0.000 description 1
- 208000011279 abdominal lump Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 208000033847 bacterial urinary tract infection Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 206010050975 congenital hydronephrosis Diseases 0.000 description 1
- 238000002574 cystoscopy Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 201000002802 hemorrhagic cystitis Diseases 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000011862 kidney biopsy Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 201000008383 nephritis Diseases 0.000 description 1
- 231100000915 pathological change Toxicity 0.000 description 1
- 230000036285 pathological change Effects 0.000 description 1
- 208000030761 polycystic kidney disease Diseases 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 229940116269 uric acid Drugs 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提出了一种基于血尿信息的疾病信息匹配***。包括:获取模块,用于获取血尿临床特征信息以及疾病临床特征信息,并建立特征信息数据向量集;预处理模块,用于采集待识别血尿临床特征信息,并建立待识别特征信息向量集;计算匹配模块,用于设定汉明编码转化规则,根据该汉明编码转化规则将特征信息数据向量集转化为第一编码向量集,将待识别特征信息向量集转化为第二编码向量集,并计算汉明重量;匹配模块,用于根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,并生成待识别血尿临床特征信息对应的疾病匹配报告。本发明通过设定汉明编码转化规则,将文本之间的匹配转化为特定字符之间的匹配,能够提高文本匹配的精确度。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种基于血尿信息的疾病信息匹配***。
背景技术
一般来说,尿液中的血液含量超出正常值就可以认为是血尿。血尿多作为其它疾病的症状(或者叫特征信息)出现,常见引起血尿的疾病有各种肾炎、泌尿***感染、***、泌尿系结石、肾结核、肾肿瘤、肾及尿道损伤等等。血尿是以上这些疾病的主要症状之一。
目前,血尿的检查和疾病诊断主要采用血液及尿液检查、膀胱镜检查、肾脏X线片或肾脏活检等方法,现有的诊断方法主要还是对于信息数据进行匹配来完成整个过程,本质是数据的匹配过程,但是现有的匹配过程往往只能判断信息之间的相似程度,无法判断出信息匹配之间的相似度占比,从而推测出信息的重要程度,根据重要程度来提高信息匹配的精确度。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种基于血尿信息的疾病信息匹配***,旨在解决现有技术无法实现通过利用汉明距离推测信息之间相似度比重,通过相似度比重提高信息匹配的精确度的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种基于血尿信息的疾病信息匹配***,所述基于血尿信息的疾病信息匹配***包括:
获取模块,用于获取血尿临床特征信息以及对应的疾病临床特征信息,并建立特征信息数据向量集;
预处理模块,用于采集待识别血尿临床特征信息,对该待识别血尿临床特征信息进行预处理,根据预处理结果建立待识别特征信息向量集;
计算匹配模块,用于设定汉明编码转化规则,根据该汉明编码转化规则将特征信息数据向量集转化为第一编码向量集,将待识别特征信息向量集转化为第二编码向量集,并计算第一编码向量集与第二编码向量集之间的汉明重量;
匹配模块,用于根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,汉明重量越大,血尿临床特征信息排名越靠前,根据前几位血尿临床特征信息生成待识别血尿临床特征信息对应的疾病匹配报告。
在以上技术方案的基础上,优选的,获取模块包括信息采集模块,用于采集血尿临床特征信息以及对应的疾病临床特征信息,所述血尿临床特征信息包括:血尿临床特征词以及血尿临床数据信息,所述疾病临床特征信息包括:疾病特征词、疾病症状特征词以及疾病对应的数据范围,根据血尿临床特征信息以及对应的疾病临床特征信息建立特征信息数据向量集。
在以上技术方案的基础上,优选的,获取模块包括集建立模块,用于根据血尿临床特征词以及血尿临床数据信息分别建立特征词向量集以及数据向量集,根据疾病临床特征信息建立疾病特征向量集,建立疾病特征词、疾病症状特征词以及疾病对应的数据范围之间的对应关系作为向量填入疾病特征向量集中,根据血尿临床特征信息与疾病临床特征信息之间的对应关系,将特征词向量集以及数据向量集分别与疾病特征向量集中对应。
在以上技术方案的基础上,优选的,预处理模块包括识别模块,用于采集待识别血尿临床特征信息,对采集待识别血尿临床特征信息进行识别,当待识别血尿临床特征信息为待识别血尿临床特征词以及待识别血尿临床数据信息时,分别建立待识别特征词向量集以及待识别数据向量集。
在以上技术方案的基础上,优选的,计算匹配模块包括转化模块,用于设定汉明编码转化规则,根据该汉明编码转化规则将特征词向量集中的特征词转化为对应的字符串,作为第一编码向量集,将待识别特征词向量集中的特征词转化为对应的字符串,作为第二编码向量集。
在以上技术方案的基础上,优选的,计算匹配模块包括比较模块,用于将第一编码向量集中的每个字符串与第二编码向量集中的每个字符串一一进行比较,获取比较结果作为汉明重量,将数据向量集与待识别数据向量集进行比较,获取比较结果作为数据判断表。
在以上技术方案的基础上,优选的,匹配模块包括报告生成模块,用于根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,汉明重量越大,血尿临床特征信息排名越靠前,结合数据判断表,生成待识别血尿临床特征信息对应的疾病匹配报告。
更进一步优选的,所述基于血尿信息的疾病信息匹配设备包括:
获取单元,用于获取血尿临床特征信息以及对应的疾病临床特征信息,并建立特征信息数据向量集;
预处理单元,用于采集待识别血尿临床特征信息,对该待识别血尿临床特征信息进行预处理,根据预处理结果建立待识别特征信息向量集;
计算匹配单元,用于设定汉明编码转化规则,根据该汉明编码转化规则将特征信息数据向量集转化为第一编码向量集,将待识别特征信息向量集转化为第二编码向量集,并计算第一编码向量集与第二编码向量集之间的汉明重量;
匹配单元,用于根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,汉明重量越大,血尿临床特征信息排名越靠前,根据前几位血尿临床特征信息生成待识别血尿临床特征信息对应的疾病匹配报告。
本发明的一种基于血尿信息的疾病信息匹配***相对于现有技术具有以下有益效果:
(1)通过设定汉明编码转化规则,通过利用汉明编码转化规则将文本之间的匹配转化为特定字符串之间的匹配,提高了文本之间的匹配精确度,减少了文本匹配时间;
(2)通过利用汉明距离来实现文本之间的匹配,能够清晰直观反映出文本之间的相似度,通过相似度能够提高匹配报告的精确度,提升用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于血尿信息的疾病信息匹配***第一实施例的结构框图;
图2为本发明基于血尿信息的疾病信息匹配***的第二实施例结构框图;
图3为本发明基于血尿信息的疾病信息匹配***的第三实施例结构框图;
图4为本发明基于血尿信息的疾病信息匹配***的第四实施例结构框图;
图5为本发明基于血尿信息的疾病信息匹配***的第五实施例结构框图;
图6为本发明基于血尿信息的疾病信息匹配设备结构框图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,图1为本发明基于血尿信息的疾病信息匹配***第一实施例的结构框图。其中,所述基于血尿信息的疾病信息匹配***包括:获取模块10、预处理模块20、计算匹配模块30和匹配模块40。
获取模块10,用于获取血尿临床特征信息以及对应的疾病临床特征信息,并建立特征信息数据向量集;
预处理模块20,用于采集待识别血尿临床特征信息,对该待识别血尿临床特征信息进行预处理,根据预处理结果建立待识别特征信息向量集;
计算匹配模块30,用于设定汉明编码转化规则,根据该汉明编码转化规则将特征信息数据向量集转化为第一编码向量集,将待识别特征信息向量集转化为第二编码向量集,并计算第一编码向量集与第二编码向量集之间的汉明重量;
匹配模块40,用于根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,汉明重量越大,血尿临床特征信息排名越靠前,根据前几位血尿临床特征信息生成待识别血尿临床特征信息对应的疾病匹配报告。
进一步地,如图2所示,基于上述各实施例提出本发明基于血尿信息的疾病信息匹配***的第二实施例结构框图,在本实施例中,获取模块10还包括:
信息采集模块101,用于采集血尿临床特征信息以及对应的疾病临床特征信息,所述血尿临床特征信息包括:血尿临床特征词以及血尿临床数据信息,所述疾病临床特征信息包括:疾病特征词、疾病症状特征词以及疾病对应的数据范围,根据血尿临床特征信息以及对应的疾病临床特征信息建立特征信息数据向量集。
集建立模块102,用于根据血尿临床特征词以及血尿临床数据信息分别建立特征词向量集以及数据向量集,根据疾病临床特征信息建立疾病特征向量集,建立疾病特征词、疾病症状特征词以及疾病对应的数据范围之间的对应关系作为向量填入疾病特征向量集中,根据血尿临床特征信息与疾病临床特征信息之间的对应关系,将特征词向量集以及数据向量集分别与疾病特征向量集中对应。
应当理解的是,本***会采集血尿临床特征信息以及对应的疾病临床特征信息,所述血尿临床特征信息包括:血尿临床特征词以及血尿临床数据信息,所述疾病临床特征信息包括:疾病特征词、疾病症状特征词以及疾病对应的数据范围,这些信息的来源可以是***内部的数据库,也可以是由管理员手动对数据库进行更新添加。
应当理解的是,为了节省人力,***往往会根据特征词检索对应的文本,比如,血尿伴腹部肿块:如果血尿伴单侧上腹部肿块,多为肾肿瘤、肾结石伴积水、肾损伤出血、肾下垂、肾囊肿、异位肾等;如果血尿伴双侧上腹部肿块常为多囊肾、先天性肾积水;如果血尿伴下腹部肿块则应考虑尿潴留或膀胱、盆腔肿瘤。再比如,通过血尿实验室检查发现:取新鲜尿液作常规检查,比重低而固定,见于肾实质损害;大量蛋白与管型见于肾小球病变;含红细胞淡影与管型,见于肾实质病变;含大量脓细胞、白细胞,见于尿路非特异性感染、肾结核、肾***坏死,而肾结石、肿瘤可有无菌性脓尿;含结晶者如尿酸结晶、草酸盐结晶,见于***,磺胺结晶见于服磺胺药者,胱氨酸结晶见于胱氨酸结石;含坏死组织见于肾、***;含坏死肾***见于肾***坏死;含乳糜块者,见于乳糜尿。然后从文本中提取对应的词语来对***的数据库进行更新。
应当理解的是,之后***会根据血尿临床特征词以及血尿临床数据信息分别建立特征词向量集以及数据向量集,根据疾病临床特征信息建立疾病特征向量集,建立疾病特征词、疾病症状特征词以及疾病对应的数据范围之间的对应关系作为向量填入疾病特征向量集中,根据血尿临床特征信息与疾病临床特征信息之间的对应关系,将特征词向量集以及数据向量集分别与疾病特征向量集中对应。
进一步地,如图3所示,基于上述各实施例提出本发明基于血尿信息的疾病信息匹配***的第三实施例结构框图,在本实施例中,预处理模块20还包括:
识别模块201,用于采集待识别血尿临床特征信息,对采集待识别血尿临床特征信息进行识别,当待识别血尿临床特征信息为待识别血尿临床特征词以及待识别血尿临床数据信息时,分别建立待识别特征词向量集以及待识别数据向量集。
应当理解的是,之后***会采集待识别血尿临床特征信息,对采集待识别血尿临床特征信息进行识别,为了保证数据的精确度,一般采集待识别血尿临床特征信息的流程是,首先通过患者口述确定对应症状或者患者在***上选择对应症状标签,接下来由医生对患者口述或者选择的症状进行确定纠正,然后输入到***之中,***对输入的信息进行识别,待识别血尿临床特征信息可能会是待识别血尿临床特征词以及待识别血尿临床数据信息两种中的任一种,也可能两种都有,此时***会分别建立待识别特征词向量集以及待识别数据向量集用于后续实现文本匹配。
进一步地,如图4所示,基于上述各实施例提出本发明基于血尿信息的疾病信息匹配***的第四实施例结构框图,在本实施例中,计算匹配模块30包括:
转化模块301,用于设定汉明编码转化规则,根据该汉明编码转化规则将特征词向量集中的特征词转化为对应的字符串,作为第一编码向量集,将待识别特征词向量集中的特征词转化为对应的字符串,作为第二编码向量集。
比较模块302,用于将第一编码向量集中的每个字符串与第二编码向量集中的每个字符串一一进行比较,获取比较结果作为汉明重量,将数据向量集与待识别数据向量集进行比较,获取比较结果作为数据判断表。
应当理解的是,本实施例中,***使用的是汉明编码转化规则来对对应的特征词进行转化,转化为字符串的形式更利于实现文本之间的匹配,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。由此我们可以很清楚看到两个不同文本之间的相似度如何以及相似程度。
应当理解的是,***会设定汉明编码转化规则,根据该汉明编码转化规则将特征词向量集中的特征词转化为对应的字符串,作为第一编码向量集,将待识别特征词向量集中的特征词转化为对应的字符串,作为第二编码向量集。
应当理解的是,本实施例中的汉明编码转化规则是对每一个字设定一个编码,编码由机器可以识别的特殊符号、数字以及字母组成,一个特征词根据汉明编码转化规则即形成了一串字符串。
应当理解的是,之后***会将第一编码向量集中的每个字符串与第二编码向量集中的每个字符串一一进行比较,获取比较结果作为汉明重量,将数据向量集与待识别数据向量集进行比较,获取比较结果作为数据判断表,本实施例中,针对文本数据比如特征词,是通过汉明重量来进行判断,对于数据向量集则可以直接来进行比较判断。
进一步地,如图5所示,基于上述各实施例提出本发明基于血尿信息的疾病信息匹配***的第五实施例结构框图,在本实施例中,匹配模块40包括:
报告生成模块401,用于根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,汉明重量越大,血尿临床特征信息排名越靠前,结合数据判断表,生成待识别血尿临床特征信息对应的疾病匹配报告。
应当理解的是,最后***会根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,汉明重量越大,血尿临床特征信息排名越靠前,结合数据判断表,生成待识别血尿临床特征信息对应的疾病匹配报告。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例提出了一种基于血尿信息的疾病信息匹配***,包括:获取模块,用于获取血尿临床特征信息以及对应的疾病临床特征信息,并建立特征信息数据向量集;预处理模块,用于采集待识别血尿临床特征信息,对该待识别血尿临床特征信息进行预处理,根据预处理结果建立待识别特征信息向量集;计算匹配模块,用于设定汉明编码转化规则,根据该汉明编码转化规则将特征信息数据向量集转化为第一编码向量集,将待识别特征信息向量集转化为第二编码向量集,并计算第一编码向量集与第二编码向量集之间的汉明重量;匹配模块,用于根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,汉明重量越大,血尿临床特征信息排名越靠前,根据前几位血尿临床特征信息生成待识别血尿临床特征信息对应的疾病匹配报告。本发明通过设定汉明编码转化规则,将文本之间的匹配转化为特定字符之间的匹配,能够提高文本匹配的精确度。
此外,本发明实施例还提出一种基于血尿信息的疾病信息匹配设备。如图6所示,该基于血尿信息的疾病信息匹配设备包括:获取单元10、预处理单元20、计算匹配单元30以及匹配单元40。
获取单元10,用于获取血尿临床特征信息以及对应的疾病临床特征信息,并建立特征信息数据向量集;
预处理单元20,用于采集待识别血尿临床特征信息,对该待识别血尿临床特征信息进行预处理,根据预处理结果建立待识别特征信息向量集;
计算匹配单元30,用于设定汉明编码转化规则,根据该汉明编码转化规则将特征信息数据向量集转化为第一编码向量集,将待识别特征信息向量集转化为第二编码向量集,并计算第一编码向量集与第二编码向量集之间的汉明重量;
匹配单元40,用于根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,汉明重量越大,血尿临床特征信息排名越靠前,根据前几位血尿临床特征信息生成待识别血尿临床特征信息对应的疾病匹配报告。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于血尿信息的疾病信息匹配***,此处不再赘述。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于血尿信息的疾病信息匹配***,其特征在于,所述基于血尿信息的疾病信息匹配***包括:
获取模块,用于获取血尿临床特征信息以及对应的疾病临床特征信息,并建立特征信息数据向量集;
预处理模块,用于采集待识别血尿临床特征信息,对该待识别血尿临床特征信息进行预处理,根据预处理结果建立待识别特征信息向量集;
计算匹配模块,用于设定汉明编码转化规则,根据该汉明编码转化规则将特征信息数据向量集转化为第一编码向量集,将待识别特征信息向量集转化为第二编码向量集,并计算第一编码向量集与第二编码向量集之间的汉明重量;
匹配模块,用于根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,汉明重量越大,血尿临床特征信息排名越靠前,根据前几位血尿临床特征信息生成待识别血尿临床特征信息对应的疾病匹配报告。
2.如权利要求1所述的基于血尿信息的疾病信息匹配***,其特征在于:获取模块包括信息采集模块,用于采集血尿临床特征信息以及对应的疾病临床特征信息,所述血尿临床特征信息包括:血尿临床特征词以及血尿临床数据信息,所述疾病临床特征信息包括:疾病特征词、疾病症状特征词以及疾病对应的数据范围,根据血尿临床特征信息以及对应的疾病临床特征信息建立特征信息数据向量集。
3.如权利要求2所述的基于血尿信息的疾病信息匹配***,其特征在于:获取模块包括集建立模块,用于根据血尿临床特征词以及血尿临床数据信息分别建立特征词向量集以及数据向量集,根据疾病临床特征信息建立疾病特征向量集,建立疾病特征词、疾病症状特征词以及疾病对应的数据范围之间的对应关系作为向量填入疾病特征向量集中,根据血尿临床特征信息与疾病临床特征信息之间的对应关系,将特征词向量集以及数据向量集分别与疾病特征向量集中对应。
4.如权利要求3所述的基于血尿信息的疾病信息匹配***,其特征在于:预处理模块包括识别模块,用于采集待识别血尿临床特征信息,对采集待识别血尿临床特征信息进行识别,当待识别血尿临床特征信息为待识别血尿临床特征词以及待识别血尿临床数据信息时,分别建立待识别特征词向量集以及待识别数据向量集。
5.如权利要求4所述的基于血尿信息的疾病信息匹配***,其特征在于:计算匹配模块包括转化模块,用于设定汉明编码转化规则,根据该汉明编码转化规则将特征词向量集中的特征词转化为对应的字符串,作为第一编码向量集,将待识别特征词向量集中的特征词转化为对应的字符串,作为第二编码向量集。
6.如权利要求5所述的基于血尿信息的疾病信息匹配***,其特征在于:计算匹配模块包括比较模块,用于将第一编码向量集中的每个字符串与第二编码向量集中的每个字符串一一进行比较,获取比较结果作为汉明重量,将数据向量集与待识别数据向量集进行比较,获取比较结果作为数据判断表。
7.如权利要求6所述的基于血尿信息的疾病信息匹配***,其特征在于:匹配模块包括报告生成模块,用于根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,汉明重量越大,血尿临床特征信息排名越靠前,结合数据判断表,生成待识别血尿临床特征信息对应的疾病匹配报告。
8.一种基于血尿信息的疾病信息匹配设备,其特征在于,所述基于血尿信息的疾病信息匹配设备包括:
获取单元,用于获取血尿临床特征信息以及对应的疾病临床特征信息,并建立特征信息数据向量集;
预处理单元,用于采集待识别血尿临床特征信息,对该待识别血尿临床特征信息进行预处理,根据预处理结果建立待识别特征信息向量集;
计算匹配单元,用于设定汉明编码转化规则,根据该汉明编码转化规则将特征信息数据向量集转化为第一编码向量集,将待识别特征信息向量集转化为第二编码向量集,并计算第一编码向量集与第二编码向量集之间的汉明重量;
匹配单元,用于根据汉明重量对第一编码向量集对应的血尿临床特征信息进行排序,汉明重量越大,血尿临床特征信息排名越靠前,根据前几位血尿临床特征信息生成待识别血尿临床特征信息对应的疾病匹配报告。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011125991.8A CN112233794A (zh) | 2020-10-20 | 2020-10-20 | 一种基于血尿信息的疾病信息匹配*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011125991.8A CN112233794A (zh) | 2020-10-20 | 2020-10-20 | 一种基于血尿信息的疾病信息匹配*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112233794A true CN112233794A (zh) | 2021-01-15 |
Family
ID=74118214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011125991.8A Pending CN112233794A (zh) | 2020-10-20 | 2020-10-20 | 一种基于血尿信息的疾病信息匹配*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112233794A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108282259A (zh) * | 2017-01-05 | 2018-07-13 | 华为技术有限公司 | 一种编码方法及装置 |
CN110032715A (zh) * | 2019-03-21 | 2019-07-19 | 武汉金豆医疗数据科技有限公司 | 一种疾病编码转换的方法 |
CN111145914A (zh) * | 2019-12-30 | 2020-05-12 | 四川大学华西医院 | 一种确定肺癌临床病种库文本实体的方法及装置 |
-
2020
- 2020-10-20 CN CN202011125991.8A patent/CN112233794A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108282259A (zh) * | 2017-01-05 | 2018-07-13 | 华为技术有限公司 | 一种编码方法及装置 |
CN110032715A (zh) * | 2019-03-21 | 2019-07-19 | 武汉金豆医疗数据科技有限公司 | 一种疾病编码转换的方法 |
CN111145914A (zh) * | 2019-12-30 | 2020-05-12 | 四川大学华西医院 | 一种确定肺癌临床病种库文本实体的方法及装置 |
Non-Patent Citations (1)
Title |
---|
《中国集成电路大全 》编写委员会: "中国集成电路大全 CMOS集成电路", 西安交通大学出版社, pages: 297 - 298 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111564223A (zh) | 传染病生存概率的预测方法、预测模型的训练方法及装置 | |
CN110111905B (zh) | 一种医疗知识图谱的构建***和构建方法 | |
CN111651991B (zh) | 一种利用多模型融合策略的医疗命名实体识别方法 | |
CN115497616B (zh) | 一种感染性疾病辅助决策的方法、***、设备及存储介质 | |
CN112101413A (zh) | 面向脑卒中风险预测的智能*** | |
CN112541066A (zh) | 基于文本结构化的医技报告检测方法及相关设备 | |
CN111292814A (zh) | 一种医疗数据标准化的方法及装置 | |
CN115206478A (zh) | 医学报告生成方法以及装置、电子设备、可读存储介质 | |
CN112017772B (zh) | 一种基于妇女白带的疾病认知模型构建方法及*** | |
CN109907751A (zh) | 一种基于人工智能监督学习的实验室胸痛数据检查辅助识别方法 | |
CN112233794A (zh) | 一种基于血尿信息的疾病信息匹配*** | |
CN108877932A (zh) | 智慧云医疗方法、计算机可读存储介质和终端 | |
CN110610766A (zh) | 基于症状特征权重推导疾病概率的装置和存储介质 | |
CN116680655A (zh) | 一种用于颈椎病病理信号的聚类集成方法 | |
CN113010685B (zh) | 医学术语标准化方法、电子设备和存储介质 | |
CN115862897A (zh) | 一种基于临床数据的症候群监测方法及*** | |
WO2021109385A1 (zh) | 基于医学症状词汇的问诊方法及*** | |
US11379980B2 (en) | Image processing method, apparatus, electronic device and storage medium | |
RU2742429C1 (ru) | Способ экспресс-оценки изменений легочной ткани при COVID-19 без применения компьютерной томографии органов грудной клетки | |
WO2022141929A1 (zh) | 一种健康自测***、服务器及健康检测*** | |
CN114664400A (zh) | 病历档案归档方法及装置 | |
CN109087712A (zh) | 一种基于随机子空间集成学习的主动脉夹层筛查模型及其建立方法、***和模型 | |
CN114664436A (zh) | 一种基于智能体决策的急救辅助*** | |
CN113793662A (zh) | 相关性识别方法、装置、电子设备和计算机可读存储介质 | |
CN110289065A (zh) | 一种辅助生成医学电子报告的控制方法以及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |