CN106845139A - 将结构化报告生成自然语言报告的***及其方法 - Google Patents
将结构化报告生成自然语言报告的***及其方法 Download PDFInfo
- Publication number
- CN106845139A CN106845139A CN201710112908.5A CN201710112908A CN106845139A CN 106845139 A CN106845139 A CN 106845139A CN 201710112908 A CN201710112908 A CN 201710112908A CN 106845139 A CN106845139 A CN 106845139A
- Authority
- CN
- China
- Prior art keywords
- natural language
- data
- report
- data processing
- focus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 80
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 23
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 23
- 230000010354 integration Effects 0.000 claims abstract description 11
- 238000006243 chemical reaction Methods 0.000 claims description 23
- 239000000284 extract Substances 0.000 claims description 3
- 241000208340 Araliaceae Species 0.000 claims description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 2
- 235000008434 ginseng Nutrition 0.000 claims description 2
- 238000003745 diagnosis Methods 0.000 abstract description 9
- 230000001427 coherent effect Effects 0.000 abstract description 5
- 241001269238 Data Species 0.000 description 16
- 238000010586 diagram Methods 0.000 description 16
- 210000003405 ileum Anatomy 0.000 description 16
- 230000003902 lesion Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 10
- 210000000232 gallbladder Anatomy 0.000 description 8
- 210000003734 kidney Anatomy 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 210000001072 colon Anatomy 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000000968 intestinal effect Effects 0.000 description 6
- 210000000936 intestine Anatomy 0.000 description 6
- 210000003384 transverse colon Anatomy 0.000 description 6
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 210000004907 gland Anatomy 0.000 description 4
- 210000004185 liver Anatomy 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 210000004977 neurovascular bundle Anatomy 0.000 description 3
- 230000002792 vascular Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 210000004914 menses Anatomy 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 210000002307 prostate Anatomy 0.000 description 2
- 201000007094 prostatitis Diseases 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明提供了一种将结构化报告生成自然语言报告的***,包括:获取模块,用于提取病灶列表中的结构化数据;其中结构化数据为该部位的病灶参数;数据处理模块,用于基于病灶参数的属性,对结构化数据进行数据处理,并将处理后的结构化数据根据语言规则进行重新组合,转换成完整通顺的自然语言数据;合成模块,用于基于病灶列表中的内容顺序,将自然语言数据进行排序整合,生成自然语言报告;显示模块,用于当用户对结构化报告编辑完成时,自动将自然语言报告显示到客户端。本发明还公开了一种将结构化报告生成自然语言报告的方法。本发明使医生既能使用结构化报告,也能按照自然语言生成完整通顺的影像表现和诊断等内容,提高了工作效率。
Description
技术领域
本发明涉及医疗信息领域,更具体地,涉及一种将结构化报告生成自然语言报告的***及其方法。
背景技术
随着信息技术的发展和医疗信息化的建设,现在医院都在逐渐使用了结构化报告***进行报告书写,但是输出到打印报告单上时,影像表现和诊断等信息显示形式单一,基本都是标签和值的形式,又或者是带数字和值的模式(1、2、3的模式),显然这种形式不能应用于所有类型报告中,而国内的医院和各个***需求又需要文本报告,那就需要医生再重新写一份报告,或者在标签和值的报告形式上进行修改,生成我们的自然语言报告,这样,就增加了医生的工作量,降低了效率;同时,自然语言的报告又需要通过医院信息***间的接口进行传导,增加了医院的成本。
发明内容
有鉴于此,本发明的主要目的在于提供一种将结构化报告生成自然语言报告的***及其方法,能够解决现有技术中存在的增加医生工作量、降低工作效率的问题。
为达到上述目的,本发明的技术方案是这样实现的:
一方面,本发明提供了一种将结构化报告生成自然语言报告的***,包括获取模块、数据处理模块、合成模块和显示模块,其中,获取模块,与数据处理模块相连,用于提取病灶列表中的结构化数据,并将结构化数据发送给数据处理模块;其中结构化数据为该部位的病灶参数;数据处理模块,分别与获取模块和合成模块相连,用于基于病灶参数的属性,对结构化数据进行数据处理,并将处理后的结构化数据根据语言规则进行重新组合,转换成完整通顺的自然语言数据;合成模块,分别与数据处理模块和显示模块相连,用于基于病灶列表中的内容顺序,将自然语言数据进行排序整合,生成自然语言报告;显示模块,与合成模块相连,用于当用户对结构化报告编辑完成时,自动将自然语言报告显示到客户端。
优选地,数据处理模块还包括计算单元,用于当病灶参数的属性为数值时,根据数值自动计算出该部位病灶的大小。
优选地,数据处理模块还包括字符串处理单元,用于基于用户的需求,对结构化数据进行字符串转换。
优选地,数据处理模块还包括大小写转换单元,用于基于用户的需求,对结构化数据进行大小写的转换。
优选地,数据处理模块还包括分割单元,用于根据自然语言数据的语义,在每个自然语言数据之间设置相应的标点符号。
另一方面,本发明还提供了一种将结构化报告生成自然语言报告的方法,包括:获取模块提取病灶列表中的结构化数据,并将结构化数据发送给数据处理模块;其中结构化数据为该部位的病灶参数;数据处理模块基于所述病灶参数的属性,对结构化数据进行数据处理,并将处理后的结构化数据根据语言规则进行重新组合,转换成完整通顺的自然语言数据;合成模块基于病灶列表中的内容顺序,将自然语言数据进行排序整合,生成自然语言报告;显示模块在用户对结构化报告编辑完成时,自动将自然语言报告显示到客户端。
优选地,基于病灶参数的属性,对所述结构化数据进行数据处理,包括:当病灶参数的属性为数值时,数据处理模块中的计算单元根据数值自动计算出该部位病灶的大小。
优选地,基于病灶参数的属性,对结构化数据进行数据处理,还包括:基于用户的需求,数据处理模块中的字符串处理单元对结构化数据进行字符串转换。
优选地,基于病灶参数的属性,对结构化数据进行数据处理,还包括:基于用户的需求,数据处理模块中的大小写转换单元对结构化数据进行大小写的转换。
优选地,该方法还包括:数据处理模块中的分割单元根据自然语言数据的语义,在每个自然语言数据之间设置相应的标点符号。
本发明的技术效果:
1.由于本发明中设置了数据处理模块和合成模块,医生在书写结构化报告时,***可以将结构化报告中的结构化数据进行相应的处理,并将处理后的结构化数据根据语言规则进行重新组合,转换成完整通顺的自然语言数据,并将自然语言数据进行排序整合,生成自然语言报告。使得医生既能使用结构化报告***也能按照自然语言的规则形成自然语言报告,完成通顺的影像表现和诊断等内容,使报告流程顺利完成,省去了医生重新写报告的时间,减少了医生的工作量,提高了工作效率;同时,结构化报告数据也可以保留,作为日后医疗诊断的大数据统计查询分析;
2.由于本发明设置了计算单元,对结构化数据中涉及到数值的参数时,可以自动将各个数值进行计算,将相应的计算结果显示到自然语言数据中,使得医生看到自然语言报告后一目了然,很迅速地捕捉到重要数据,免得医生拿到数值后再计算相应的结果,来判断该部位病灶的大小及严重性,提高了医生的阅读效率;
3.由于本发明设置了字符串处理单元和大小写转换单元,可以对结构化数据中涉及到需要进行字符串转换或者大小写转化的数据进行相应的转换,比如结构化数据中涉及到的参数为2.15cm,为了满足医学使用习惯,我们需要转换成为以mm为单位的长度计量,故***输出的自然语言报告则直接输出21.5mm,使得***更加人性化,方便了医生使用;
4.由于本发明还设置了分割单元,可以根据自然语言数据的语义,在每个自然语言数据之间设置相应的标点符号,使得更加符合自然语言的阅读规则。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例一的将结构化报告生成自然语言报告的***结构示意图;
图2示出了根据本发明实施例二的将结构化报告生成自然语言报告的***结构示意图;
图3示出了根据本发明实施例二的将结构化报告生成自然语言报告的***中***经线的相关结构化数据示意图;
图4示出了根据本发明实施例三的将结构化报告生成自然语言报告的***结构示意图;
图5示出了根据本发明实施例四的将结构化报告生成自然语言报告的***结构示意图;
图6示出了根据本发明实施例四的将结构化报告生成自然语言报告的***的病灶列表示意图;
图7示出了根据本发明实施例四的将结构化报告生成自然语言报告的***的病灶列表示意图;
图8示出了根据本发明实施例四的将结构化报告生成自然语言报告的***中神经血管束的相关结构化数据示意图;
图9示出了根据本发明实施例五的将结构化报告生成自然语言报告的方法流程图;
图10示出了根据本发明实施例五的将结构化报告生成自然语言报告的方法中***经线的相关结构化数据示意图;
图11示出了根据本发明实施例五的将结构化报告生成自然语言报告的方法的病灶列表示意图;
图12示出了根据本发明实施例五的将结构化报告生成自然语言报告的方法的病灶列表示意图;
图13示出了根据本发明实施例五的将结构化报告生成自然语言报告的方法中神经血管束的相关结构化数据示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
实施例一
图1示出了根据本发明实施例一的将结构化报告生成自然语言报告的***结构示意图;如图1所示,该***包括:获取模块10、数据处理模块20、合成模块30和显示模块40,其中,
获取模块10,与数据处理模块20相连,用于提取病灶列表中的结构化数据,并将结构化数据发送给数据处理模块20;其中结构化数据为该部位的病灶参数;
例如,病灶参数可以为:神经血管束受累、有、右侧;也可以为横结肠-降结肠、分布、局限性、肠管长度12.cm等等各种病灶参数;
数据处理模块20,分别与获取模块10和合成模块30相连,用于基于病灶参数的属性,对结构化数据进行数据处理,并将处理后的结构化数据根据语言规则进行重新组合,转换成完整通顺的自然语言数据;
合成模块30,分别与数据处理模块20和显示模块40相连,用于基于病灶列表中的内容顺序,将自然语言数据进行排序整合,生成自然语言报告;
显示模块40,与合成模块30相连,用于当用户对结构化报告编辑完成时,自动将自然语言报告显示到客户端。
针对数据处理模块20对应的脚本语言为如下程序逻辑:
(1)变量定义
所有界面中的元素均自动定义为变量,脚本语言可以获取及修改其值,亦可直接定义新变量。
脚本语法:
Var(变量名称)
(2)分支判断规则
脚本语法:
(3)循环执行规则
脚本语法:
针对合成模块30对应的脚本语言为如下程序逻辑:
自定义函数及过程,由用户自行扩展的函数
脚本语法:
Fun_函数名(input)
Begin
自定义脚本内容
Output()
End。
例:定义Fun_words(input)
输入:胆囊、肾脏
输出:胆囊和肾脏
输入:肝脏、NULL、胆囊、肾脏
输出:肝脏、胆囊及肾脏
本发明的实施设置了数据处理模块和合成模块,医生在书写结构化报告时,***可以将结构化报告中的结构化数据进行相应的处理,并将处理后的结构化数据根据语言规则进行重新组合,转换成完整通顺的自然语言数据,并将自然语言数据进行排序整合,生成自然语言报告。使得医生既能使用结构化报告***也能按照自然语言的规则形成自然语言报告,完成通顺的影像表现和诊断等内容,使报告流程顺利完成,省去了医生重新写报告的时间,减少了医生的工作量,提高了工作效率;同时,结构化报告数据也可以保留,作为日后医疗诊断的大数据统计查询分析。
实施例二
图2示出了根据本发明实施例二的将结构化报告生成自然语言报告的***结构示意图;如图2所示,数据处理模块20还包括计算单元202,用于当病灶参数的属性为数值时,根据数值自动计算出该部位病灶的大小。
比如,根据测量的相关数值可以自动计算出体积值、面积值、容积、指数、密度、范围等等。
针对计算单元对应的脚本语言为如下程序逻辑:
脚本语法:
@Computer(计算公式,附加参数)
例如:
输入:(3*3)+8
输出:17
图3示出了根据本发明实施例二的将结构化报告生成自然语言报告的***中***经线的相关结构化数据示意图,如图3所示,计算单元的计算流程为:
根据函数公式
输入:@Computer(Var(RL值)*Var(AP值)*Var(SI值),”0.2f”)
输出:1.97
该结构化数据输出的自然语言数据则为:“***径线体积为1.97cm3。”
本发明的实施例设置了计算单元,对结构化数据中涉及到数值的参数时,可以自动将各个数值进行计算,将相应的计算结果显示到自然语言数据中,使得医生看到自然语言报告后一目了然,很迅速地捕捉到重要数据,免得医生拿到数值后再计算相应的结果,来判断该部位病灶的大小及严重性,提高了医生的阅读效率。
实施例三
图4示出了根据本发明实施例三的将结构化报告生成自然语言报告的***结构示意图;如图4所示,
数据处理模块20还包括字符串处理单元204,用于基于用户的需求,对结构化数据进行字符串转换。
例如,结构化报告数据为2.15cm,为了满足医学使用习惯,我们需要把cm转换成mm的单位,字符串处理单元将结构化数据2.15cm分解为2.15和cm,然后根据运算规则2.15*10=21.5,再将cm转换成mm,即最后的输出自然语言数据为21.5mm。
数据处理模块20还包括大小写转换单元206,用于基于用户的需求,对结构化数据进行大小写的转换。
例如,结构化数据中会时常涉及到患者性别的,医生填写的如果是M/F/m/F/,若是需要大写的M/F就需要大小写转换单元来对该小写数据进行大写的转换。
再如,还有一些英文缩写的内容,比如BI-RADS(一种医学的分支名称)有的医生可能用了小写,我们就需要转换成大写,以适应医学使用习惯。
本发明的实施例设置了字符串处理单元和大小写转换单元,可以对结构化数据中涉及到需要进行字符串转换或者大小写转化的数据进行相应的转换,比如结构化数据中涉及到的参数为2.15cm,为了满足医学使用习惯,我们需要转换成为以mm为单位的长度计量,故***输出的自然语言报告则直接输出21.5mm,使得***更加人性化,方便了医生使用。
实施例四
图5示出了根据本发明实施例四的将结构化报告生成自然语言报告的***结构示意图;如图5所示,数据处理模块20还包括分割单元208,用于根据自然语言数据的语义,在每个自然语言数据之间设置相应的标点符号。
下面以一个例子来具体说明本实施例:
图6示出了根据本发明实施例四的将结构化报告生成自然语言报告的***的病灶列表示意图,如图6所示,此病灶列表示出了横结肠-降结肠的相关结构化数据;
图7示出了根据本发明实施例四的将结构化报告生成自然语言报告的***的病灶列表示意图,如图7所示,此病灶列表示出了中部回肠-上部回肠的相关结构化数据。
图6的横结肠-降结肠的相关结构化数据以及图7的中部回肠-上部回肠的相关结构化数据转换成自然语言数据的实现过程为:
定义变量Var(部位名称)
为如下逻辑为:
@replace(Var(部位值),“-”,“、”)可见病变
图6结构化数据输出为:“横结肠、降结肠可见病变”
图7结构化数据输出为:“中部回肠、上部回肠可见病变”
定义变量Var(肠管)
为如下逻辑为:
图6结构化数据输出为:“,肠管长度1.2cm”
图7结构化数据输出为:“”
定义变量Var(分布)
为如下逻辑为:
图6结构化数据输出为:“分布呈局限性,肠管长度1.2cm”
图7结构化数据输出为:“分布呈弥漫性”
定义变量Var(回盲部)
为如下逻辑为:
图6结构化数据输出为:“回盲部可见受累”
图7结构化数据输出为:“回盲部未见明确受累”
图6、图7合成模块的处理流程为:
自定义函数Fun_add()
输入:无限文字段
输出:使用逗号连接文字段,为空的不连接
定义变量Var(行总内容)
为如下逻辑为:
Fun_add(“Var(部位名称)”,“Var(分布)”,“Var(回盲部)”,“。”)
图6自然语言报告输出为:“横结肠、降结肠可见病变分布呈局限性,肠管为1.2cm,回盲部可见受累。”
图7自然语言报告输出为:“中部回肠、上部回肠可见病变分布呈弥漫性,回盲部未见明确受累。”
图6和图7自然语言报告的合并输出为:
定义变量Var(总内容)
最后输出为:“横结肠、降结肠可见病变分布呈局限性,肠管为1.2cm,回盲部可见受累。中部回肠、上部回肠可见病变分布呈弥漫性,回盲部未见明确受累。”
再如:图8示出了根据本发明实施例四的将结构化报告生成自然语言报告的***中神经血管束的相关结构化数据示意图,如图8所示,数据处理模块20的处理流程为:
该结构化数据的输出则为:“右侧神经血管束受累。”
本发明的实施例设置了分割单元,可以根据自然语言数据的语义,在每个自然语言数据之间设置相应的标点符号,使得更加符合自然语言的阅读规则。
实施例五
图9示出了根据本发明实施例五的将结构化报告生成自然语言报告的方法流程图,如图9所示,该方法包括以下步骤:
步骤S501,获取模块提取病灶列表中的结构化数据,并将结构化数据发送给数据处理模块;
例如,病灶参数可以为:神经血管束受累、有、右侧;也可以为横结肠-降结肠、分布、局限性、肠管长度12.cm等等各种病灶参数;
步骤S502,数据处理模块基于所述病灶参数的属性,对结构化数据进行数据处理,并将处理后的结构化数据根据语言规则进行重新组合,转换成完整通顺的自然语言数据;
步骤S503,合成模块基于病灶列表中的内容顺序,将自然语言数据进行排序整合,生成自然语言报告;
步骤S504,显示模块在用户对结构化报告编辑完成时,自动将自然语言报告显示到客户端。
针对数据处理模块对应的脚本语言为如下程序逻辑:
(1)变量定义
所有界面中的元素均自动定义为变量,脚本语言可以获取及修改其值,亦可直接定义
新变量。
脚本语法:
Var(变量名称)
(2)分支判断规则
脚本语法:
(3)循环执行规则
脚本语法:
针对合成模块对应的脚本语言为如下程序逻辑:
自定义函数及过程,由用户自行扩展的函数
脚本语法:
Fun_函数名(input)
Begin
自定义脚本内容
Output()
End。
例:定义Fun_words(input)
输入:胆囊、肾脏
输出:胆囊和肾脏
输入:肝脏、NULL、胆囊、肾脏
输出:肝脏、胆囊及肾脏。
其中,基于病灶参数的属性,对所述结构化数据进行数据处理,包括:当病灶参数的属性为数值时,数据处理模块中的计算单元根据数值自动计算出该部位病灶的大小。
比如,根据测量的相关数值可以自动计算出体积值、面积值、容积、指数、密度、范围等等。
针对计算单元对应的脚本语言为如下程序逻辑:
脚本语法:
@Computer(计算公式,附加参数)
例如:
输入:(3*3)+8
输出:17
图10示出了根据本发明实施例五的将结构化报告生成自然语言报告的方法中***经线的相关结构化数据示意图,如图10所示,计算单元的计算流程为:
根据函数公式
输入:@Computer(Var(RL值)*Var(AP值)*Var(SI值),”0.2f”)
输出:1.97
该结构化数据输出的自然语言数据则为:“***径线体积为1.97cm3。”
其中,基于病灶参数的属性,对结构化数据进行数据处理,还包括:基于用户的需求,数据处理模块中的字符串处理单元对结构化数据进行字符串转换。
例如,结构化报告数据为2.15cm,为了满足医学使用习惯,我们需要把cm转换成mm的单位,字符串处理单元将结构化数据2.15cm分解为2.15和cm,然后根据运算规则2.15*10=21.5,再将cm转换成mm,即最后的输出自然语言数据为21.5mm。
其中,基于病灶参数的属性,对结构化数据进行数据处理,还包括:基于用户的需求,数据处理模块中的大小写转换单元对结构化数据进行大小写的转换。
例如,结构化数据中会时常涉及到患者性别的,医生填写的如果是M/F/m/F/,若是需要大写的M/F就需要大小写转换单元来对该小写数据进行大写的转换。
再如,还有一些英文缩写的内容,比如BI-RADS(一种医学的分支名称)有的医生可能用了小写,我们就需要转换成大写,以适应医学使用习惯。
其中,该方法还包括:数据处理模块中的分割单元根据自然语言数据的语义,在每个自然语言数据之间设置相应的标点符号。
下面以一个例子来具体说明本实施例:
图11示出了根据本发明实施例五的将结构化报告生成自然语言报告的方法的病灶列表示意图,如图11所示,此病灶列表示出了横结肠-降结肠的相关结构化数据;
图12示出了根据本发明实施例五的将结构化报告生成自然语言报告的方法的病灶列表示意图,如图12所示,此病灶列表示出了中部回肠-上部回肠的相关结构化数据。
图11的横结肠-降结肠的相关结构化数据以及图12的中部回肠-上部回肠的相关结构化数据转换成自然语言数据的实现过程为:
定义变量Var(部位名称)
为如下逻辑为:
@replace(Var(部位值),“-”,“、”)可见病变
图11结构化数据输出为:“横结肠、降结肠可见病变”
图12结构化数据输出为:“中部回肠、上部回肠可见病变”
定义变量Var(肠管)
为如下逻辑为:
图11结构化数据输出为:“,肠管长度1.2cm”
图12结构化数据输出为:“”
定义变量Var(分布)
为如下逻辑为:
图11结构化数据输出为:“分布呈局限性,肠管长度1.2cm”
图12结构化数据输出为:“分布呈弥漫性”
定义变量Var(回盲部)
为如下逻辑为:
图11结构化数据输出为:“回盲部可见受累”
图12结构化数据输出为:“回盲部未见明确受累”
图11、图12合成模块的处理流程为:
自定义函数Fun_add()
输入:无限文字段
输出:使用逗号连接文字段,为空的不连接
定义变量Var(行总内容)
为如下逻辑为:
Fun_add(“Var(部位名称)”,“Var(分布)”,“Var(回盲部)”,“。”)
图11自然语言报告输出为:“横结肠、降结肠可见病变分布呈局限性,肠管为1.2cm,回盲部可见受累。”
图12自然语言报告输出为:“中部回肠、上部回肠可见病变分布呈弥漫性,回盲部未见明确受累。”
图11和图12自然语言报告的合并输出为:
最后输出为:“横结肠、降结肠可见病变分布呈局限性,肠管为1.2cm,回盲部可见受累。中部回肠、上部回肠可见病变分布呈弥漫性,回盲部未见明确受累。”
再如:
图13示出了根据本发明实施例五的将结构化报告生成自然语言报告的方法中神经血管束的相关结构化数据示意图,如图13所示,数据处理模块的处理流程为:
该结构化数据的输出则为:“右侧神经血管束受累。”
本发明的实施例中,医生在书写结构化报告时,可以将结构化报告中的结构化数据进行相应的处理,并将处理后的结构化数据根据语言规则进行重新组合,转换成完整通顺的自然语言数据,并将自然语言数据进行排序整合,生成自然语言报告。使得医生既能使用结构化报告***也能按照自然语言的规则形成自然语言报告,完成通顺的影像表现和诊断等内容,使报告流程顺利完成,省去了医生重新写报告的时间,减少了医生的工作量,提高了工作效率;同时,结构化报告数据也可以保留,作为日后医疗诊断的大数据统计查询分析;计算单元,对结构化数据中涉及到数值的参数时,可以自动将各个数值进行计算,将相应的计算结果显示到自然语言数据中,使得医生看到自然语言报告后一目了然,很迅速地捕捉到重要数据,免得医生拿到数值后再计算相应的结果,来判断该部位病灶的大小及严重性,提高了医生的阅读效率;字符串处理单元和大小写转换单元,可以对结构化数据中涉及到需要进行字符串转换或者大小写转化的数据进行相应的转换,比如结构化数据中涉及到的参数为2.15cm,为了满足医学使用习惯,我们需要转换成为以mm为单位的长度计量,故***输出的自然语言报告则直接输出21.5mm,使得***更加人性化,方便了医生使用;分割单元可以根据自然语言数据的语义,在每个自然语言数据之间设置相应的标点符号,使得更加符合自然语言的阅读规则。
从以上描述中,可以看出,本发明的上述实施例实现了如下技术效果:本发明的实施例中,设置了数据处理模块和合成模块,医生在书写结构化报告时,可以将结构化报告中的结构化数据进行相应的处理,并将处理后的结构化数据根据语言规则进行重新组合,转换成完整通顺的自然语言数据,并将自然语言数据进行排序整合,生成自然语言报告。使得医生既能使用结构化报告***也能按照自然语言的规则形成自然语言报告,完成通顺的影像表现和诊断等内容,使报告流程顺利完成,省去了医生重新写报告的时间,减少了医生的工作量,提高了工作效率;同时,结构化报告数据也可以保留,作为日后医疗诊断的大数据统计查询分析;由于设置了计算单元,对结构化数据中涉及到数值的参数时,可以自动将各个数值进行计算,将相应的计算结果显示到自然语言数据中,使得医生看到自然语言报告后一目了然,很迅速地捕捉到重要数据,免得医生拿到数值后再计算相应的结果,来判断该部位病灶的大小及严重性,提高了医生的阅读效率;由于***中设置了字符串处理单元和大小写转换单元,可以对结构化数据中涉及到需要进行字符串转换或者大小写转化的数据进行相应的转换,比如结构化数据中涉及到的参数为2.15cm,为了满足医学使用习惯,我们需要转换成为以mm为单位的长度计量,故***输出的自然语言报告则直接输出21.5mm,使得***更加人性化,方便了医生使用;由于***中设置了分割单元可以根据自然语言数据的语义,在每个自然语言数据之间设置相应的标点符号,使得更加符合自然语言的阅读规则。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种将结构化报告生成自然语言报告的***,其特征在于,包括获取模块、数据处理模块、合成模块和显示模块,其中,
所述获取模块,与所述数据处理模块相连,用于提取病灶列表中的结构化数据,并将所述结构化数据发送给所述数据处理模块;其中所述结构化数据为该部位的病灶参数;
所述数据处理模块,分别与所述获取模块和所述合成模块相连,用于基于所述病灶参数的属性,对所述结构化数据进行数据处理,并将处理后的结构化数据根据语言规则进行重新组合,转换成完整通顺的自然语言数据;
所述合成模块,分别与所述数据处理模块和所述显示模块相连,用于基于所述病灶列表中的内容顺序,将所述自然语言数据进行排序整合,生成自然语言报告;
所述显示模块,与所述合成模块相连,用于当用户对结构化报告编辑完成时,自动将所述自然语言报告显示到客户端。
2.根据权利要求1所述的将结构化报告生成自然语言报告的***,其特征在于,所述数据处理模块还包括计算单元,用于当所述病灶参数的属性为数值时,根据所述数值自动计算出该部位病灶的大小。
3.根据权利要求1所述的将结构化报告生成自然语言报告的***,其特征在于,所述数据处理模块还包括字符串处理单元,用于基于用户的需求,对所述结构化数据进行字符串转换。
4.根据权利要求1所述的将结构化报告生成自然语言报告的***,其特征在于,所述数据处理模块还包括大小写转换单元,用于基于用户的需求,对所述结构化数据进行大小写的转换。
5.根据权利要求1所述的将结构化报告生成自然语言报告的***,其特征在于,所述数据处理模块还包括分割单元,用于根据所述自然语言数据的语义,在每个所述自然语言数据之间设置相应的标点符号。
6.一种将结构化报告生成自然语言报告的方法,其特征在于,包括:
获取模块提取病灶列表中的结构化数据,并将所述结构化数据发送给数据处理模块;其中所述结构化数据为该部位的病灶参数;
所述数据处理模块基于所述病灶参数的属性,对所述结构化数据进行数据处理,并将处理后的结构化数据根据语言规则进行重新组合,转换成完整通顺的自然语言数据;
合成模块基于所述病灶列表中的内容顺序,将所述自然语言数据进行排序整合,生成自然语言报告;
显示模块在用户对结构化报告编辑完成时,自动将所述自然语言报告显示到客户端。
7.根据权利要求6所述的将结构化报告生成自然语言报告的方法,其特征在于,所述基于所述病灶参数的属性,对所述结构化数据进行数据处理,包括:当所述病灶参数的属性为数值时,所述数据处理模块中的计算单元根据所述数值自动计算出该部位病灶的大小。
8.根据权利要求6所述的将结构化报告生成自然语言报告的方法,其特征在于,所述基于所述病灶参数的属性,对所述结构化数据进行数据处理,还包括:基于用户的需求,所述数据处理模块中的字符串处理单元对所述结构化数据进行字符串转换。
9.根据权利要求6所述的将结构化报告生成自然语言报告的方法,其特征在于,所述基于所述病灶参数的属性,对所述结构化数据进行数据处理,还包括:基于用户的需求,所述数据处理模块中的大小写转换单元对所述结构化数据进行大小写的转换。
10.根据权利要求6所述的将结构化报告生成自然语言报告的方法,其特征在于,该方法还包括:所述数据处理模块中的分割单元根据所述自然语言数据的语义,在每个所述自然语言数据之间设置相应的标点符号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710112908.5A CN106845139A (zh) | 2017-02-28 | 2017-02-28 | 将结构化报告生成自然语言报告的***及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710112908.5A CN106845139A (zh) | 2017-02-28 | 2017-02-28 | 将结构化报告生成自然语言报告的***及其方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106845139A true CN106845139A (zh) | 2017-06-13 |
Family
ID=59137579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710112908.5A Pending CN106845139A (zh) | 2017-02-28 | 2017-02-28 | 将结构化报告生成自然语言报告的***及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106845139A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107526919A (zh) * | 2017-07-13 | 2017-12-29 | 北京赛迈特锐医疗科技有限公司 | 基于结构化的手术报告记录***及其记录方法 |
CN108665951A (zh) * | 2018-04-16 | 2018-10-16 | 北京天使软件技术有限公司 | 一种将预结构化数据生成医学报告的方法和*** |
CN108665950A (zh) * | 2018-04-16 | 2018-10-16 | 首都医科大学附属北京同仁医院 | 基于卷积神经网络生成结构化医学影像报告的方法和*** |
CN108665949A (zh) * | 2018-04-03 | 2018-10-16 | 首都医科大学附属北京同仁医院 | 一种结构化提取和展示眼眶mri影像数据的*** |
CN109065110A (zh) * | 2018-07-11 | 2018-12-21 | 哈尔滨工业大学 | 一种基于深度学习方法的自动生成医学影像诊断报告的方法 |
WO2019118256A1 (en) * | 2017-12-15 | 2019-06-20 | Microsoft Technology Licensing, Llc | Generation of text from structured data |
CN110162558A (zh) * | 2019-04-01 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 结构化数据处理方法及装置 |
CN110196670A (zh) * | 2019-05-31 | 2019-09-03 | 数坤(北京)网络科技有限公司 | 一种文本生成方法、设备及计算机可读存储介质 |
CN110931096A (zh) * | 2018-09-19 | 2020-03-27 | 北京赛迈特锐医疗科技有限公司 | 自动生成影像结构化报告模板的***及其方法 |
CN111863268A (zh) * | 2020-07-19 | 2020-10-30 | 杭州美腾科技有限公司 | 一种适用于医学报告内容提取与结构化方法 |
CN110459287B (zh) * | 2018-05-08 | 2024-03-22 | 西门子医疗有限公司 | 来自医学文本报告的结构化报告数据 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030144886A1 (en) * | 2002-01-29 | 2003-07-31 | Taira Rick K. | Method and system for generating textual medical reports |
CN101639829A (zh) * | 2009-08-28 | 2010-02-03 | 中国科学院软件研究所 | 一种软件缺陷报告分流方法及其*** |
US20150294088A1 (en) * | 2014-04-15 | 2015-10-15 | Cerner Innovations, LLC | Patient Summary Generation |
CN106021389A (zh) * | 2016-05-12 | 2016-10-12 | 新华通讯社 | 基于模板自动生成新闻的***和方法 |
CN206557777U (zh) * | 2017-02-28 | 2017-10-13 | 北京赛迈特锐医疗科技有限公司 | 将结构化报告生成自然语言报告的*** |
-
2017
- 2017-02-28 CN CN201710112908.5A patent/CN106845139A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030144886A1 (en) * | 2002-01-29 | 2003-07-31 | Taira Rick K. | Method and system for generating textual medical reports |
CN101639829A (zh) * | 2009-08-28 | 2010-02-03 | 中国科学院软件研究所 | 一种软件缺陷报告分流方法及其*** |
US20150294088A1 (en) * | 2014-04-15 | 2015-10-15 | Cerner Innovations, LLC | Patient Summary Generation |
CN106021389A (zh) * | 2016-05-12 | 2016-10-12 | 新华通讯社 | 基于模板自动生成新闻的***和方法 |
CN206557777U (zh) * | 2017-02-28 | 2017-10-13 | 北京赛迈特锐医疗科技有限公司 | 将结构化报告生成自然语言报告的*** |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107526919A (zh) * | 2017-07-13 | 2017-12-29 | 北京赛迈特锐医疗科技有限公司 | 基于结构化的手术报告记录***及其记录方法 |
WO2019118256A1 (en) * | 2017-12-15 | 2019-06-20 | Microsoft Technology Licensing, Llc | Generation of text from structured data |
US11544474B2 (en) | 2017-12-15 | 2023-01-03 | Microsoft Technology Licensing, Llc | Generation of text from structured data |
CN108665949A (zh) * | 2018-04-03 | 2018-10-16 | 首都医科大学附属北京同仁医院 | 一种结构化提取和展示眼眶mri影像数据的*** |
CN108665951B (zh) * | 2018-04-16 | 2022-01-28 | 北京天使软件技术有限公司 | 一种将预结构化数据生成医学报告的方法和*** |
CN108665951A (zh) * | 2018-04-16 | 2018-10-16 | 北京天使软件技术有限公司 | 一种将预结构化数据生成医学报告的方法和*** |
CN108665950A (zh) * | 2018-04-16 | 2018-10-16 | 首都医科大学附属北京同仁医院 | 基于卷积神经网络生成结构化医学影像报告的方法和*** |
CN108665950B (zh) * | 2018-04-16 | 2022-04-01 | 首都医科大学附属北京同仁医院 | 基于卷积神经网络生成结构化医学影像报告的方法和*** |
CN110459287B (zh) * | 2018-05-08 | 2024-03-22 | 西门子医疗有限公司 | 来自医学文本报告的结构化报告数据 |
CN109065110A (zh) * | 2018-07-11 | 2018-12-21 | 哈尔滨工业大学 | 一种基于深度学习方法的自动生成医学影像诊断报告的方法 |
CN109065110B (zh) * | 2018-07-11 | 2021-10-19 | 哈尔滨工业大学 | 一种基于深度学习方法的自动生成医学影像诊断报告的方法 |
CN110931096A (zh) * | 2018-09-19 | 2020-03-27 | 北京赛迈特锐医疗科技有限公司 | 自动生成影像结构化报告模板的***及其方法 |
CN110162558A (zh) * | 2019-04-01 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 结构化数据处理方法及装置 |
CN110196670A (zh) * | 2019-05-31 | 2019-09-03 | 数坤(北京)网络科技有限公司 | 一种文本生成方法、设备及计算机可读存储介质 |
CN111863268A (zh) * | 2020-07-19 | 2020-10-30 | 杭州美腾科技有限公司 | 一种适用于医学报告内容提取与结构化方法 |
CN111863268B (zh) * | 2020-07-19 | 2024-01-30 | 杭州美腾科技有限公司 | 一种适用于医学报告内容提取与结构化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106845139A (zh) | 将结构化报告生成自然语言报告的***及其方法 | |
TWI290698B (en) | System and method for updating and displaying patent citation information | |
CN111813963B (zh) | 知识图谱构建方法、装置、电子设备及存储介质 | |
Bruner et al. | Encephalization and allometric trajectories in the genus Homo: evidence from the Neandertal and modern lineages | |
CN109065110A (zh) | 一种基于深度学习方法的自动生成医学影像诊断报告的方法 | |
CN105843945A (zh) | 一种报表生成方法及*** | |
CN108710941A (zh) | 用于电子设备的神经网络模型的硬加速方法和装置 | |
CN107273117A (zh) | 一种编程友好型的敏捷代码自动生成*** | |
CN109726806A (zh) | 信息处理方法及终端设备 | |
US20080216000A1 (en) | System, process and logic element for providing and managing record keeping applications | |
CN108563666A (zh) | 一种基于大数据技术的数据可视化处理***及方法 | |
CN115146488A (zh) | 基于大数据的可变业务流程智能建模***及其方法 | |
CN110069892A (zh) | 一种fpga引脚分配设计方法及装置 | |
CN110472040A (zh) | 评价信息的提取方法及装置、存储介质、计算机设备 | |
Gai et al. | Galeaspid anatomy and the origin of vertebrate paired appendages | |
CN109726268A (zh) | 基于分层神经网络的文本表示方法和装置 | |
CN107291692A (zh) | 基于人工智能的分词模型的定制方法、装置、设备和介质 | |
CN113268227A (zh) | 一种零代码可视化的软件开发平台及开发方法 | |
Sajovic et al. | Bibliometric study and mapping of a journal in the field of visualization and computer graphics | |
CN109815478A (zh) | 基于卷积神经网络的药化实体识别方法及*** | |
CN114270313A (zh) | 一种计算机实现的方法、计算机程序以及物理计算环境 | |
CN106776508A (zh) | 一种电子表单生成方法及装置 | |
CN106776509A (zh) | 一种电子表单生成方法及装置 | |
US20030023951A1 (en) | MATLAB toolbox for advanced statistical modeling and data analysis | |
CN206557777U (zh) | 将结构化报告生成自然语言报告的*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |