CN112951444A - 一种文档处理方法以及*** - Google Patents
一种文档处理方法以及*** Download PDFInfo
- Publication number
- CN112951444A CN112951444A CN201911263781.2A CN201911263781A CN112951444A CN 112951444 A CN112951444 A CN 112951444A CN 201911263781 A CN201911263781 A CN 201911263781A CN 112951444 A CN112951444 A CN 112951444A
- Authority
- CN
- China
- Prior art keywords
- document
- processed
- template
- structured data
- clinical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 29
- 238000003908 quality control method Methods 0.000 claims abstract description 47
- 238000004458 analytical method Methods 0.000 claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000013507 mapping Methods 0.000 claims abstract description 20
- 238000004590 computer program Methods 0.000 claims description 16
- 238000002474 experimental method Methods 0.000 abstract description 37
- 238000011160 research Methods 0.000 abstract description 22
- 230000008569 process Effects 0.000 abstract description 15
- 230000001360 synchronised effect Effects 0.000 abstract description 5
- 238000007726 management method Methods 0.000 description 45
- 230000000875 corresponding effect Effects 0.000 description 32
- 238000007689 inspection Methods 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 7
- 239000003814 drug Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012550 audit Methods 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 206010067484 Adverse reaction Diseases 0.000 description 2
- 230000006838 adverse reaction Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000009102 absorption Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000012362 drug development process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Toxicology (AREA)
- Automatic Analysis And Handling Materials Therefor (AREA)
Abstract
本发明适用于医疗数据处理技术领域,提供了一种文档处理方法以及***,该方法包括:获取待处理文档;根据所述待处理文档对应的文档模板,对所述待处理文档进行解析,以获得至少一个字段数据;根据所述文档模板和所述待处理文档,对所述字段数据进行映射,以获得第一结构化数据体。本发明中临床核查员直接将完善的待处理文件上传至临床实验管理***进行文档解析,经过解析获得的结构化数据体还可以直接与质控平台进行同步,全过程通过在线进行,不仅有效缩短了流程,而且完全摆脱了对固定人员的依赖,可以大大提高处理效率,同时有助于实现临床研究文件的规范化。
Description
技术领域
本发明属于医疗数据处理技术领域,尤其涉及一种文档处理方法以及***。
背景技术
临床研究是指任何在人体(可以是病人或者健康志愿者)进行药物的***性研究,用于证实或揭示试验药物的作用、不良反应以及试验药物的吸收、分布、代谢和***等情况,目的在于确定试验药物的疗效与安全性。
药物研发过程通常会经历5个阶段,包括药物研发立项、Ⅰ期临床研究、Ⅱ期临床研究、Ⅲ期临床研究以及Ⅳ期临床研究。其中,Ⅰ期临床研究指的是首次在人体进行研究药物的周密试验计划,受试对象是少量正常成年健康自愿者,目的是观察药物在人体内的作用机制;Ⅱ期临床研究指的是在只患有确立的适应症的病患者上进行的研究,目的是找出最佳的剂量范围和考虑治疗可行性;Ⅲ期临床研究指的是确定研究药物的有效性和安全性、受益和危害比率;Ⅳ期临床研究指的是新药获准注册上市后的大型研究,检察普遍临床使用时的不良反应和毒性。
在进行临床研究的过程中会产生大量的相关文档,例如质控核查报告、检查报告以及稽查报告等。目前,临床研究产生的文档均采用离线交接的方式在相关环节的负责人之间依次流转处理,处理效率低下。
发明内容
有鉴于此,本发明实施例提供了一种文档处理方法以及装置,以解决现有技术对临床研究产生的文档进行处理时存在处理效率低下的技术问题。
本发明实施例的第一方面提供了一种文档处理方法,包括:
获取待处理文档;
根据所述待处理文档对应的文档模板,对所述待处理文档进行解析,以获得至少一个字段数据;
根据所述文档模板和所述待处理文档,对所述字段数据进行映射,以获得第一结构化数据体。
本发明实施例的第二方面提供了一种文档处理***,包括:
第一获取模块,用于获取待处理文档;
解析模块,用于根据所述待处理文档对应的文档模板,对所述待处理文档进行解析,以获得至少一个字段数据;
映射模块,用于根据所述文档模板和所述待处理文档,对所述字段数据进行映射,以获得第一结构化数据体。
本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的文档处理方法。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的文档处理方法。
本发明实施例与现有技术相比,存在的有益效果至少在于:
(1)本发明实施例提供的文档处理方法通过构建临床实验管理***,临床核查员直接将完善的待处理文件(例如核查报告)上传至临床实验管理***进行文档解析,经过解析获得的结构化数据体可直接与质控平台进行同步,全过程通过在线进行,不仅有效缩短了流程,而且完全摆脱了对固定人员的依赖,可以大大提高处理效率。
(2)本发明实施例在进行待处理文档的获取时,临床核查员可以通过统一的文档模板进行内容填充,有助于实现临床研究文件的规范化。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供的文档处理方法的实现流程示意图一;
图2是本发明实施例提供的文档处理方法的实现流程示意图二;
图3是本发明实施例提供的文档处理方法中获得字段数据的实现流程图;
图4是本发明实施例提供的文档处理方法中获得第一结构化数据体的实现流程图;
图5是本发明实施例提供的文档处理方法的实现流程示意图三;
图6是本发明实施例提供的文档处理方法的流程示意图;
图7是本发明实施例提供的文档处理***的示意图一;
图8是本发明实施例提供的文档处理***的示意图二;
图9是本发明实施例提供的文档处理***中解析模块的示意图;
图10是本发明实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
请参阅图1,本实施例提供了一种文档处理方法,包括:
步骤S11:获取待处理文档。
在本实施例中,待处理文档的类型可以根据需要进行设置。例如,待处理文档可以是临床研究过程中所获得的监查报告或者稽查报告等。报告类型不同,对应的文档模板也不相同。以监查报告为例,项目临床监查员根据临床研究项目的情况,对监查报告对应的文档模板的相应部分进行编写和内容填充,从而获得待处理文档。项目临床监查员在完善了待处理文档后,将其上传至临床实验管理***,临床实验管理***在获取待处理文档后,可以对待处理文档进行进一步的处理。当相同名称的待处理文档重复上传时,以最新一次上传的待处理文档为准。
项目临床监查员获取文档模板的途径可以根据实际需要进行选择。
在一个实施例中,项目临床监查员可以直接通过线下离线获取文档模板,例如,项目临床监查员根据过往的工作经验,其已经具有了针对不同临床研究项目的文档模板,在需要提交项目研究情况时,其只需要根据临床研究项目,找到相应的文档模板,并完成文档模板的对应部分,然后再上传至临床实验管理***即可,方式灵活。
在另一个实施例中,项目临床监查员可以根据临床研究项目,通过临床实验管理***下载相应的文档模板,在完成文档模板的对应部分后,再上传至临床实验管理***。当然,在通过该种方式获取文档模板时,临床实验管理***首先需要获取相应的文档模板。请参阅图2,此时,步骤S11前还包括:
步骤S10:获取文档模板,并为所述文档模板分配解析识别码。
临床实验管理***在获取文档模板时,项目临床监查员通过临床实验管理***后台上传文档模板至临床实验管理***,临床实验管理***对不同的文档模板分配相应的解析识别码(解析ID),并将解析识别码预置到文档模板中,不同的文档模板对应不同的解析识别码,从而后续在将待处理文档与文档模板进行匹配时可以根据解析识别码进行匹配,匹配速度快且准确率高。
当然,即便是临床实验管理***中已经保存了文档模板,项目临床监查员在获取模板时也可以通过离线的方式获取,而不一定每次在需要完善项目研究情况时均需要从临床实验管理***中下载。
文档模板是可以被结构化解析的模板,其包括的属性字段根据临床试验项目的不同而不同。例如,一份文档模板的属性字段可以包括:机构受理号、项目名称、项目状态、项目阶段、项目开始时间等中的至少一项。其中,机构受理号和项目名称作为文档模板的辨识字段,可以作为后续进行文档解析的辨识条件。项目临床监查员在获取文档模板后,根据文档模板中的属性字段完善相应部分的内容,从而可以获得待处理文档。
进一步地,临床实验管理***获取待处理文档的频率可以是固定频率,例如一个星期一次、一个月一次、一个季度一次或者半年一次等,也可以是无固定频率,临床监查员在产出监查报告或者获取监查报告/稽查报告后上传至临床实验管理***。当临床实验管理***按照固定频率获取待处理文档时,临床实验管理***可以根据设置向相关人员(例如临床监查员)发送提醒信息,以敦促相关人员上传待处理文档等。提醒信息的发送方式可以是通过邮箱发送,也可以是通过微信发送,还可以通过短信等方式发送,此处不做限制。
进一步地,临床实验管理***在获得了待处理文档后,可以进一步对待处理文档进行解析处理。
步骤S12:根据所述待处理文档对应的文档模板,对所述待处理文档进行解析,以获得至少一个字段数据。
在本实施例中,临床实验管理***在获取了待处理文档后,可以获取待处理文档的文档模板,并根据文档模板的模板结构对待处理文档进行解析。请参阅图3,其过程可以包括如下步骤:
步骤S121:根据所述待处理文档的解析识别码,获取对应的文档模板。
文档模板中预置有解析ID,临床监查员对文档模板进行编写和内容填充后获得的待处理文档仍然含有该解析ID,因此临床实验管理***在获取该待处理文档后,可以根据其解析ID获取对应的文档模板,从而可以获取文档模板的模板结构。
步骤S122:根据所述文档模板的模板结构,对所述待处理文档进行解析,以获得与所述模板结构中属性字段对应的字段数据。
在获取了文档模板的模板结构后,可以根据模板结构对待处理文件进行解析。例如,一份文档模板的模板结构包括机构受理号、项目名称、项目状态、项目阶段、项目开始时间等属性字段,此时可以根据该模板结构去对应解析待处理文件中的属性字段,并解析每个属性字段下相应的内容,从而获得该属性字段对应的字段数据,字段数据的数量与属性字段的数量相适应。
可以理解的是,在解析的过程中,根据上传的待处理文档实际情形的不同,文档解析也可能会失败。例如,如果临床监查员上传至临床实验管理***的待处理文档中未含有预置的解析ID,此时则无法从临床实验管理***中获取对应的文档模板,因而也就无法对其进行解析,该待处理文档解析失败。再如,如果临床监查员在根据文档模板完善相应属性字段的过程中对属性字段进行了重新编辑,以使得获得的待处理文档的整体结构与文档模板不同,或者属性字段做了更改,此时也会导致临床实验管理***在解析的过程中无法对属性字段进行解析,进而也就无法获得相应的字段数据,导致待处理文档的解析失败。当解析待处理文件失败时,则跳过该解析失败的待处理文件,而继续解析下一份待处理文件。当然,也可以返回解析失败的提示,以使得临床监查员可以知晓待处理文件的解析结果,从而敦促临床监查员对解析失败的待处理文件进行处理。
对于解析成功的待处理文档,则需要进一步对解析获得的字段数据进行处理。
步骤S13:根据所述文档模板和所述待处理文档,对所述字段数据进行映射,以获得第一结构化数据体。
结构化数据体是根据临床研究项目所构建的结构化数据,其中包含了临床研究项目的各个方面的信息,这些信息以结构化的形式进行存储和相互关联,能够反映临床研究项目的基本信息以及进展情况等,待处理文档中的内容需要对应映射至结构化数据体的对应部分。例如,待处理文档中的属性字段包括机构受理号、项目名称、项目状态、项目阶段、项目开始时间等,结构化数据体中也对应包括机构受理号、项目名称、项目状态、项目阶段、项目开始时间等部分,从而可以将待处理文档中属性字段的字段数据对应映射至结构化数据体的相应部分。在本实施例中,结构化数据体的为树形结构,并建立有完善的容错机制,可以利用机器学习的方式将待处理文档的内容映射至树形结构中,从而可以得到结构化的树形数据体。
请参阅图4,对字段数据进行映射的过程可以为:
步骤S131:根据所述待处理文档的辨识字段,获取对应的第二结构化数据体。
临床实验管理***中存储有多个临床研究项目的结构化数据体,因此,在对字段数据进行映射时,需要获得待处理文档的字段数据的映射对象。在本实施例中,待处理文档的辨识字段包括机构受理号和项目名称,临床实验管理***根据机构受理号和项目名称,可以获取其中存储的临床研究项目的结构化数据体,记为第二结构化数据体。第二结构化数据体中存储了从临床研究项目开始至今的所有数据,并通过定期或不定期的内容填充进行更新。
步骤S132:根据所述文档模板的模板结构,将所述字段数据对应映射入所述第二结构化数据体中,以获得第一结构化数据体。
在获得了第二结构化数据体以后,临床实验管理***可以根据文档模板的模板结构与第二结构化数据体进行对应,以将不同属性字段的字段数据对应映射入第二结构化数据体中,从而获得更新了的第二结构化数据体,即为第一结构化数据体。同时,在完成字段数据的映射后,也对解析正常的待处理文档进行存储。
在对待处理文档进行上述处理后,可以将待处理文档中各个属性字段的字段数据映射至结构化数据体中,从而实现对待处理文档的数据处理。
在获得了第一结构化数据体以后,还需要质控人员对临床研究项目进行质控分析。请参阅图5,因此,在步骤S13后,还包括:
步骤S14:将所述结构化数据体与质控平台同步,以对所述结构化数据体进行质控分析。
在本实施例中,临床实验管理***将更新的结构化数据体同步至质控平台,质控人员可以通过质控平台获取临床研究项目的数据,从而可以对临床研究项目进行质控分析。在临床实验管理***将结构化数据体同步至质控平台后,临床实验管理***还可以向质控人员发送提醒消息,以敦促质控人员及时进行质控分析,例如可以通过短信、微信或者邮件的方式将提醒消息发送至质控人员。
请参阅图6,进一步地,在完成质控分析后,临床监查员还可以通过临床实验管理***查看质控分析的结果,此时临床实验管理***可以对质控分析报告进行在线展示。
步骤S15:对所述第一结构化数据体和/或所述质控分析的结果进行在线展示。
临床实验管理***可以根据临床监查员的请求,在线展示不同类型的数据。例如,当临床监查员请求查看第一结构化数据体时,临床实验管理***可以提供在线查看界面,在该界面中展示更新的第一结构化数据体,从而使得临床监查员可以直观了解临床研究项目的整体进展。再如,当临床监查员请求查看质控分析报告时,质控人员在完成质控分析后,可以将质控分析报告发送至临床实验管理***,临床实验管理***可以根据临床监查员的请求,对质控分析的结果进行在线展示。
以下以质控核查报告为例对文档处理方法进行说明。
临床监查员进入临床实验管理***的质控核查报告填写界面获取文档模板,临床实验管理***将文档模板发送至临床监查员(可以是直接下载,也可以是发送至指定邮箱地址等)。临床核查员在文档模板的属性字段处补充相应内容后,将获得的待处理文档上传至临床实验管理***,临床实验管理***对待处理文档的结构化数据进行入库,获得更新的结构化数据体,更新的结构化数据体同步至质控平台。质控平台返回同步结果至临床实验管理***,临床实验管理***将解析结果以及质控分析报告返回给临床监查员,以使得临床监查员可以了解文档的解析情况以及临床研究项目的质控分析结果。当需要进行在线展示质控分析报告时,临床监查员可以向质控平台发起请求,质控平台可以在线显示质控分析结果。
本实施例提供的文档处理方法的有益效果至少在于:
(1)目前在进行临床研究项目的文档处理时,通常需要经过一个复杂的离线流程:对于质控核查报告等,由临床核查员以离线的形式将核查报告发送至临床实验协调员,临床实验协调员再将完善的核查报告以离线的形式发送至项目经理/主要研究者,项目经理再将核查报告发送数据解析模块进行数据解析,导出数据库文件,数据库数据文件再以离线的方式发送至质控平台进行质控分析。不仅流程长,而且全都以离线的方式进行,不仅容易遗忘,而且依赖固定人员进行,处理效率低下。
本实施例提供的文档处理方法通过构建临床实验管理***,临床核查员直接将完善的待处理文件(例如核查报告)上传至临床实验管理***进行文档解析,经过解析获得的结构化数据体可直接与质控平台进行同步,全过程通过在线进行,不仅有效缩短了流程,而且完全摆脱了对固定人员的依赖,可以大大提高处理效率。
(2)本实施例中的文档可以在各个***、平台间自动流转,避免文档在***、平台之间的壁垒,实现***文件打通。
(3)本实施例在进行待处理文档的获取时,临床核查员可以通过统一的文档模板进行内容填充,有助于实现临床研究文件的规范化。
(4)本实施例提供的文档处理方法中,临床实验管理***所存在的位置可以根据需要进行设置,例如可以搭建在公有云中,也可以搭建在私有云中,还可以搭建在混合云体系中,设置方式灵活多样。
请参阅图7,本实施例的目的还在于提供一种文档处理***,包括第一获取模块21、解析模块22以及映射模块23。其中,第一获取模块21用于获取待处理文档;解析模块22用于根据所述待处理文档对应的文档模板,对所述待处理文档进行解析,以获得至少一个字段数据;映射模块23用于根据所述文档模板和所述待处理文档,对所述字段数据进行映射,以获得第一结构化数据体。
进一步地,请参阅图8,文档处理***还包括第二获取模块20,第二获取模块20用于获取文档模板,并为所述文档模板分配解析识别码。
进一步地,请参阅图9,解析模块22包括模板获取单元221以及解析单元222。其中,模板获取单元221用于根据所述待处理文档的解析识别码,获取对应的文档模板;解析单元222用于根据所述文档模板的模板结构,对所述待处理文档进行解析,以获得与所述模板结构中属性字段对应的字段数据。
进一步地,映射模块23用于根据所述待处理文档的辨识字段,获取对应的第二结构化数据体;并根据所述文档模板的模板结构,将所述字段数据对应映射入所述第二结构化数据体中,以获得第一结构化数据体。
进一步地,文档处理***还包括同步模块24,同步模块24用于将所述结构化数据体与质控平台同步,以对所述结构化数据体进行质控分析。
进一步地,文档处理***还包括展示模块25,展示模块25用于对所述第一结构化数据体和/或所述质控分析的结果进行在线展示。
图10是本发明一实施例提供的终端设备的示意图。如图10所示,该实施例的终端设备3包括:处理器30、存储器31以及存储在存储器31中并可在处理器30上运行的计算机程序32。处理器30执行计算机程序32时实现上述各个文档处理方法实施例中的步骤。
示例性的,计算机程序32可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器31中,并由处理器30执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序32在终端设备3中的执行过程。
终端设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端设备3可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图10仅仅是终端设备3的示例,并不构成对终端设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备3还可以包括输入输出设备、网络接入设备、总线等。
处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器31可以是终端设备3的内部存储单元,例如终端设备3的硬盘或内存。存储器31也可以是终端设备3的外部存储设备,例如终端设备3上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器31还可以既包括终端设备3的内部存储单元也包括外部存储设备。存储器31用于存储计算机程序以及终端设备3所需的其它程序和数据。存储器31还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述***中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种文档处理方法,其特征在于,包括:
获取待处理文档;
根据所述待处理文档对应的文档模板,对所述待处理文档进行解析,以获得至少一个字段数据;
根据所述文档模板和所述待处理文档,对所述字段数据进行映射,以获得第一结构化数据体。
2.如权利要求1所述的文档处理方法,其特征在于,所述获取待处理文档步骤前,还包括:
获取文档模板,并为所述文档模板分配解析识别码。
3.如权利要求1所述的文档处理方法,其特征在于,所述根据所述待处理文档对应的文档模板,对所述待处理文档进行解析,以获得至少一个字段数据,包括:
根据所述待处理文档的解析识别码,获取对应的文档模板;
根据所述文档模板的模板结构,对所述待处理文档进行解析,以获得与所述模板结构中属性字段对应的字段数据。
4.如权利要求1所述的文档处理方法,其特征在于,所述根据所述文档模板和所述待处理文档,对所述字段数据进行映射,以获得第一结构化数据体,包括:
根据所述待处理文档的辨识字段,获取对应的第二结构化数据体;
根据所述文档模板的模板结构,将所述字段数据对应映射入所述第二结构化数据体中,以获得第一结构化数据体。
5.如权利要求1所述的文档处理方法,其特征在于,所述获取待处理文档步骤前,还包括:
发送提醒信息至相关人员,以提醒所述相关人员提供待处理文档。
6.如权利要求1~5任一项所述的文档处理方法,其特征在于,所述根据所述文档模板的模板结构,对所述字段数据进行映射,以获得结构化数据体步骤后,还包括:
将所述结构化数据体与质控平台同步,以对所述结构化数据体进行质控分析。
7.如权利要求6所述的文档处理方法,其特征在于,所述将所述结构化数据体与质控平台同步,以对所述结构化数据体进行质控分析步骤后,还包括:
对所述第一结构化数据体和/或所述质控分析的结果进行在线展示。
8.一种文档处理***,其特征在于,包括:
第一获取模块,用于获取待处理文档;
解析模块,用于根据所述待处理文档对应的文档模板,对所述待处理文档进行解析,以获得至少一个字段数据;
映射模块,用于根据所述文档模板和所述待处理文档,对所述字段数据进行映射,以获得第一结构化数据体。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~7任一项所述的文档处理方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~7任一项所述的文档处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911263781.2A CN112951444A (zh) | 2019-12-11 | 2019-12-11 | 一种文档处理方法以及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911263781.2A CN112951444A (zh) | 2019-12-11 | 2019-12-11 | 一种文档处理方法以及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112951444A true CN112951444A (zh) | 2021-06-11 |
Family
ID=76226093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911263781.2A Pending CN112951444A (zh) | 2019-12-11 | 2019-12-11 | 一种文档处理方法以及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112951444A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114065719A (zh) * | 2021-11-23 | 2022-02-18 | 中国工商银行股份有限公司 | 文档处理方法及其装置、电子设备、计算机可读存储介质 |
CN114140810A (zh) * | 2022-01-30 | 2022-03-04 | 北京欧应信息技术有限公司 | 用于文档结构化识别的方法、设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106649223A (zh) * | 2016-12-23 | 2017-05-10 | 北京文因互联科技有限公司 | 基于自然语言处理的金融报告自动生成方法 |
CN107832443A (zh) * | 2017-11-20 | 2018-03-23 | 郑州云海信息技术有限公司 | 一种json文档数据的处理方法、装置和介质 |
CN108492172A (zh) * | 2018-03-13 | 2018-09-04 | 四川享宇金信金融服务外包有限公司 | 贷款材料打包方法以及装置 |
CN110415831A (zh) * | 2019-07-18 | 2019-11-05 | 天宜(天津)信息科技有限公司 | 一种医疗大数据云服务分析平台 |
-
2019
- 2019-12-11 CN CN201911263781.2A patent/CN112951444A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106649223A (zh) * | 2016-12-23 | 2017-05-10 | 北京文因互联科技有限公司 | 基于自然语言处理的金融报告自动生成方法 |
CN107832443A (zh) * | 2017-11-20 | 2018-03-23 | 郑州云海信息技术有限公司 | 一种json文档数据的处理方法、装置和介质 |
CN108492172A (zh) * | 2018-03-13 | 2018-09-04 | 四川享宇金信金融服务外包有限公司 | 贷款材料打包方法以及装置 |
CN110415831A (zh) * | 2019-07-18 | 2019-11-05 | 天宜(天津)信息科技有限公司 | 一种医疗大数据云服务分析平台 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114065719A (zh) * | 2021-11-23 | 2022-02-18 | 中国工商银行股份有限公司 | 文档处理方法及其装置、电子设备、计算机可读存储介质 |
CN114140810A (zh) * | 2022-01-30 | 2022-03-04 | 北京欧应信息技术有限公司 | 用于文档结构化识别的方法、设备和介质 |
CN114140810B (zh) * | 2022-01-30 | 2022-04-22 | 北京欧应信息技术有限公司 | 用于文档结构化识别的方法、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110826309B (zh) | 一种临床试验电子病例报告表的生成***及方法 | |
US11011259B2 (en) | Automated pharmacy translation engine for prescription medication instructions | |
US20130159012A1 (en) | Qualifying data and associated metadata during a data collection process | |
CN111552734A (zh) | 用户画像的生成方法及装置、计算机设备、存储介质 | |
CN112951444A (zh) | 一种文档处理方法以及*** | |
US20170177796A1 (en) | Method and system for intelligent completion of medical record based on big data analytics | |
CN113724829A (zh) | 处方审核方法和装置、电子设备、存储介质 | |
CN106139298B (zh) | 医嘱信息处理方法和*** | |
US20230245738A1 (en) | Interoperable platform for reducing redundancy in medical database management | |
CN108447548A (zh) | 患者医疗影像归档方法及*** | |
CN111784453A (zh) | 基于区块链的跨平台医药集采价格同步方法及相关装置 | |
CN116543870A (zh) | 一种高血压患者药物依从性分析方法、***、设备和介质 | |
CN115966275A (zh) | 检验检查结果互认方法、装置、存储介质以及电子设备 | |
CN114020926A (zh) | 数据处理方法、装置和电子设备 | |
CN113486314A (zh) | 处方数据处理方法、装置以及电子设备 | |
JP5772379B2 (ja) | 電子カルテサーバ、オーダ送信方法、オーダ送信プログラム及び表示プログラム | |
CN111048193A (zh) | 患者输血信息管理方法、装置、移动终端及其存储介质 | |
Drevin et al. | Outcome measurement at a Ugandan referral hospital: validation of the Mbarara surgical services quality assurance database | |
CN117035402B (zh) | 一种药品风险管控方法及*** | |
CN113987016B (zh) | 临床递交数据对比方法、装置、计算机设备和存储介质 | |
CN116525064B (zh) | 放疗计划的检测装置、电子设备及计算机可读存储介质 | |
Singh et al. | prasavGraph: an Android-based e-Partograph | |
JP2002149817A (ja) | 診療データ判定システム及び診療データ判定用プログラムがコンピュータで読取可能に記録された情報記録媒体 | |
RU2818874C1 (ru) | Система поддержки принятия врачебных решений | |
WO2023133905A1 (zh) | 临床试验开发计划数据点收集方法、装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210611 |