CN116959733A - 医疗数据的分析方法、装置、设备及存储介质 - Google Patents
医疗数据的分析方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116959733A CN116959733A CN202310269558.9A CN202310269558A CN116959733A CN 116959733 A CN116959733 A CN 116959733A CN 202310269558 A CN202310269558 A CN 202310269558A CN 116959733 A CN116959733 A CN 116959733A
- Authority
- CN
- China
- Prior art keywords
- applet
- data
- user account
- sdk
- patient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 126
- 238000003860 storage Methods 0.000 title claims description 23
- 238000007405 data analysis Methods 0.000 title abstract description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 181
- 201000010099 disease Diseases 0.000 claims abstract description 130
- 238000004458 analytical method Methods 0.000 claims abstract description 61
- 230000008569 process Effects 0.000 claims description 48
- 230000003993 interaction Effects 0.000 claims description 29
- 238000003306 harvesting Methods 0.000 claims description 21
- 230000000694 effects Effects 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 208000035473 Communicable disease Diseases 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 10
- 208000015181 infectious disease Diseases 0.000 claims description 8
- 238000012552 review Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 abstract description 3
- 208000035475 disorder Diseases 0.000 description 44
- 238000004891 communication Methods 0.000 description 28
- 238000013461 design Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 18
- 238000013473 artificial intelligence Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 15
- 238000003745 diagnosis Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 11
- 238000007726 management method Methods 0.000 description 11
- 230000002093 peripheral effect Effects 0.000 description 11
- 230000001133 acceleration Effects 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 9
- 230000018109 developmental process Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 208000024891 symptom Diseases 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000013480 data collection Methods 0.000 description 6
- 230000036541 health Effects 0.000 description 6
- 238000011084 recovery Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 206010011224 Cough Diseases 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000009223 counseling Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 206010039101 Rhinorrhoea Diseases 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 208000035474 group of disease Diseases 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000009545 invasion Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 201000009240 nasopharyngitis Diseases 0.000 description 2
- 230000000474 nursing effect Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 206010013789 Dry throat Diseases 0.000 description 1
- 238000012351 Integrated analysis Methods 0.000 description 1
- 206010028748 Nasal obstruction Diseases 0.000 description 1
- 206010068319 Oropharyngeal pain Diseases 0.000 description 1
- 201000007100 Pharyngitis Diseases 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 208000003251 Pruritus Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 208000036071 Rhinorrhea Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 206010013781 dry mouth Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007803 itching Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 208000010753 nasal discharge Diseases 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/252—Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Pathology (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请公开了一种医疗数据的分析方法、装置、设备及存储介质,属于计算机技术领域。所述方法包括:获取第一小程序产生的第一数据;获取第一小程序对应的第二小程序产生的第二数据;第一小程序是患者用户帐号登录的小程序,第二小程序是医生用户帐号登录的小程序;将第一小程序产生的第一数据和第二小程序产生的第二数据存储在同一数据仓库中;对数据仓库中存储的医疗数据进行分析,得到患者用户帐号对应的病症类别下的各病症组对应的关键词;医疗数据包括患者用户帐号和医生用户帐号的问诊会话信息,问诊会话信息是根据第一数据和第二数据确定的。本申请可实现全面地对医疗数据进行分析。
Description
技术领域
本申请涉及计算机技术领域,特别涉及一种医疗数据的分析方法、装置、设备及存储介质。
背景技术
为便于患者和医生使用医疗类应用,开发者通常会在常用的客户端中集成医疗类小程序。例如在即时通信客户端中集成医疗类小程序,医疗类小程序包括针对患者的患者小程序和针对医生的医生小程序。
在对医疗类小程序产生的数据进行分析时,分析方首先需要获取患者小程序产生的医疗数据或医生小程序产生的医疗数据。相关技术中,客户端的开发者会为客户端中集成的每个小程序单独提供数据存储的服务,以便于统一管理。
对于采用上述方案存储的医疗数据,在进行分析时,通常会从存储患者小程序的数据的位置获取患者小程序的数据进行分析,或从存储医生小程序的数据的位置获取医生小程序的数据进行分析,上述分析过程无法实现全面地对医疗数据进行分析。
发明内容
本申请提供了一种医疗数据的分析方法、装置、设备及存储介质,可以实现全面地对医疗数据进行分析。所述技术方案如下:
根据本申请的一方面,提供了一种医疗数据的分析方法,所述方法包括:
获取第一小程序产生的第一数据;获取所述第一小程序对应的第二小程序产生的第二数据;所述第一小程序是患者用户帐号登录的小程序,所述第二小程序是医生用户帐号登录的小程序,所述第一小程序和所述第二小程序是依赖同一客户端运行的不同小程序;
将所述第一小程序产生的所述第一数据和所述第二小程序产生的所述第二数据存储在同一数据仓库中;
对所述数据仓库中存储的医疗数据进行分析,得到所述患者用户帐号对应的病症类别下的各病症组对应的关键词;所述医疗数据包括所述患者用户帐号和所述医生用户帐号的问诊会话信息,所述问诊会话信息是根据所述第一数据和所述第二数据确定的。
根据本申请的另一方面,提供了一种医疗数据的分析装置,所述装置包括:
获取模块,用于获取第一小程序产生的第一数据;获取所述第一小程序对应的第二小程序产生的第二数据;所述第一小程序是患者用户帐号登录的小程序,所述第二小程序是医生用户帐号登录的小程序,所述第一小程序和所述第二小程序是依赖同一客户端运行的不同小程序;
存储模块,用于将所述第一小程序产生的所述第一数据和所述第二小程序产生的所述第二数据存储在同一数据仓库中;
分析模块,用于对所述数据仓库中存储的医疗数据进行分析,得到所述患者用户帐号对应的病症类别下的各病症组对应的关键词;所述医疗数据包括所述患者用户帐号和所述医生用户帐号的问诊会话信息,所述问诊会话信息是根据所述第一数据和所述第二数据确定的。
在一个可选的设计中,所述分析模块,用于:
对所述患者用户帐号和所述医生用户帐号的所述问诊会话信息进行聚类,得到所述问诊会话信息对应的所述病症类别;对所述问诊会话信息进行关键词提取,得到所述病症类别下的所述关键词;
基于主题聚类算法对所述病症类别下的所述关键词进行聚类,得到所述病症类别下的各病症组对应的所述关键词。
在一个可选的设计中,所述装置还包括:
确定模块,用于确定所述患者用户帐号在第一时段内发送的所述关键词中满足第一重复发送次数的第一目标关键词;
所述确定模块,用于确定所述第一目标关键词对应的所述病症类别下的目标病症组;
所述确定模块,用于根据首次发送时刻和当前时刻之间的时长,确定所述目标病症组对应的病症阶段,所述首次发送时刻是所述患者用户帐号在所述第一时段内首次发送所述第一目标关键词的时刻;
发送模块,用于向所述患者用户帐号的所述第一小程序发送所述病症阶段对应的康复建议信息。
在一个可选的设计中,所述确定模块,用于:
响应于所述患者用户帐号在所述第一小程序发起问诊且所述患者用户帐号位于医院范围内,确定所述医院中与所述目标病症组对应的所述病症阶段,对应的门诊和所述门诊对应的医生;
所述发送模块,用于向所述患者用户帐号的第一小程序发送所述门诊的门诊信息和所述医生的医生信息;
其中,所述门诊信息包括由所述患者用户帐号的位置移动至所述门诊的路线信息。
在一个可选的设计中,所述发送模块,用于:
响应于所述患者用户帐号在所述第一小程序发起与所述医生用户帐号的问诊会话,向所述医生用户帐号的所述第二小程序发送所述患者用户帐号的所述目标病症组对应的所述病症阶段。
在一个可选的设计中,所述装置还包括:
所述获取模块,用于获取属于分析范围的各个所述患者用户帐号在第二时段内发送的所述关键词中满足第二重复发送次数的第二目标关键词;
发送模块,用于响应于属于所述分析范围的所述患者用户帐号中,发送所述第二目标关键词的所述患者用户帐号的数量满足数量阈值,广播所述第二目标关键词对应的所述病症组的传染病提示信息。
在一个可选的设计中,所述装置还包括:
确定模块,用于在所述患者用户帐号对应的病友患者用户帐号中,确定满足治疗效果条件的目标病友用户帐号;所述病友用户帐号是与所述患者用户帐号对应相同的所述病症组和所述关键词的用户帐号;
发送模块,用于向所述患者用户帐号发送所述目标病友用户帐号对应的治疗信息;
其中,所述治疗信息是所述目标病友用户帐号对应的所述问诊会话信息中用于指示所述病症组和所述关键词对应的疾病的治疗方式的信息,所述满足治疗效果条件包括所述病友用户帐号在全部病友用户帐号中的康复时长最短,所述康复时长是根据所述病友用户帐号对应的问诊会话信息确定的。
在一个可选的设计中,所述第一小程序集成有第一采集SDK和第一上报SDK,所述第二小程序集成有第二采集SDK和第二上报SDK;所述获取模块,用于:
获取由所述第一上报SDK上报的,通过所述第一采集SDK采集的所述第一小程序产生的所述第一数据;获取由所述第二上报SDK上报的,通过所述第二采集SDK采集的所述第二小程序产生的所述第二数据。
在一个可选的设计中,所述第一采集SDK和所述第二采集SDK中集成有第一采集工具、第二采集工具和第三采集工具中的至少一个,所述第二采集工具是第三方提供的,所述第三采集工具是所述客户端的开发者提供的;所述获取模块,用于;
获取由所述第一上报SDK上报的,通过所述第一采集SDK中的至少一个采集工具采集的所述第一数据;获取由所述第二上报SDK上报的,通过所述第二采集SDK中的至少一个采集工具采集的所述第二数据;
其中,所述第一采集工具采集的所述第一数据包括所述患者用户帐号和所述医生用户帐号的所述问诊会话信息、所述患者用户帐号查阅所述问诊会话信息的时长、所述患者用户帐号发送的所述问诊会话信息中满足第二重复发送次数的所述问诊会话信息、以及所述患者用户帐号和所述医生用户帐号之间的会话次数中的至少一种;所述第一采集工具采集的所述第二数据包括所述患者用户帐号和所述医生用户帐号的所述问诊会话信息、所述医生用户帐号查阅所述问诊会话信息的时长、所述医生用户帐号发送的所述问诊会话信息中满足第三重复发送次数的所述问诊会话信息、以及所述医生用户帐号和所述患者用户帐号之间的会话次数中的至少一种;所述第二采集工具采集的所述第一数据包括所述患者用户帐号在所述第一小程序中的交互信息,所述第二采集工具采集的所述第二数据包括所述医生用户帐号在所述第二小程序中的交互信息;所述第三采集工具采集的所述第一数据包括所述患者用户帐号的基础信息,所述第三采集工具采集的所述第二数据包括所述医生用户帐号的基础信息。
在一个可选的设计中,所述获取模块,用于:
通过所述第一采集工具在所述第一小程序显示第一问诊会话界面的过程中,确定的所述问诊会话信息在所述第一问诊会话界面中的停留时长,获取由所述第一上报SDK上报的所述患者用户帐号查阅所述问诊会话信息的时长;
通过所述第一采集工具在所述第二小程序显示第二问诊会话界面的过程中,确定的所述问诊会话信息在所述第二问诊会话界面中的停留时长,获取由所述第二上报SDK上报的所述医生用户帐号查阅所述问诊会话信息的时长。
在一个可选的设计中,所述获取模块,用于:
响应于第一缓存队列中的数据的数据量满足第一数据量阈值,获取所述第一上报SDK上报的所述第一缓存队列中的数据,所述第一缓存队列是所述第一小程序中用于存储所述至少一个采集工具采集的所述第一数据的缓存队列;
响应于第二缓存队列中的数据的数据量满足第二数据量阈值,获取所述第二上报SDK上报的所述第二缓存队列中的数据,所述第二缓存队列是所述第二小程序中用于存储所述至少一个采集工具采集的所述第二数据的缓存队列。
在一个可选的设计中,所述获取模块,用于:
基于所述第一小程序对应的多个请求通道中的部分请求通道,获取所述第一小程序产生的所述第一数据;基于所述第二小程序对应的多个请求通道中的部分请求通道,获取所述第二小程序产生的所述第二数据;
其中,所述第一小程序对应的多个请求通道和所述第二小程序对应的多个请求通道,是所述客户端的开发者提供的用于对外进行数据传输的通道。
根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的医疗数据的分析方法。
根据本申请的另一方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的医疗数据的分析方法。
根据本申请的另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面的各种可选实现方式中提供的医疗数据的分析方法。
本申请提供的技术方案带来的有益效果至少包括:
通过对患者小程序和医生小程序各自产生的数据进行统一获取,并将获取到的数据统一存储至数据仓库中。在进行医疗数据分析时,通过同一个数据仓库即可同时获取到患者小程序产生的数据和医生小程序产生的数据,可简化分析医疗数据时获取医疗数据的过程,从而降低分析医疗数据过程的复杂程度。并且,同时对患者小程序产生的数据和医生小程序产生的数据进行分析,可实现全面地对医疗数据进行分析。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的计算机***的结构框图;
图2是本申请一个示例性实施例提供的分析医疗数据的过程的示意图;
图3是本申请一个示例性实施例提供的医疗数据的分析方法的流程示意图;
图4是本申请一个示例性实施例提供的医疗数据的分析方法的流程示意图;
图5是本申请一个示例性实施例提供的上报小程序产生的数据的过程的示意图;
图6是本申请一个示例性实施例提供的通过请求通道上报小程序产生的数据的过程的示意图;
图7是本申请一个示例性实施例提供的通过小程序问诊的过程的示意图;
图8是本申请一个示例性实施例提供的问诊会话界面的示意图;
图9是本申请一个示例性实施例提供的问诊会话管理界面的示意图;
图10是本申请一个示例性实施例提供的问诊会话检索界面的示意图;
图11是本申请一个示例性实施例提供的对医疗数据进行分析的过程的示意图;
图12是本申请一个示例性实施例提供的聚类效果的示意图;
图13是本申请一个示例性实施例提供的LDA的图模型的示意图;
图14是本申请一个示例性实施例提供的医疗数据的分析装置的结构示意图;
图15是本申请一个示例性实施例提供的医疗数据的分析装置的结构示意图;
图16是本申请一个示例性实施例提供的终端的结构示意图。
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先,对本申请实施例涉及的相关名词进行介绍:
中文医学主题词表(Chinese Medical Subject Headings,CMeSH):是由中国医学科学院医学信息研究所编制,2012版涵盖《MeSH 2012中译版》、《中国中医药学主题词表》及《主题词←→医学专业分类映射表》,是国内医学领域权威的主题分类一体化词表,对简化医学文献标引程序、提高标引效率与质量具有重要参考作用。
人工智能(Artificial Intelligence,AI):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML):是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
词语到向量(Word To Vector,Word2Vec):一种将不可计算、非结构化的词语转化为可计算、结构化的向量的方法。
跳字(Skip-Gram)模型:Word2Vec的一种训练模型,主要采用当前词语来预测上下文词语。
词频-逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF):一种统计方法,用以评估一个词语对于一个文档的权重。
K均值(K-means)算法:是一种迭代求解的聚类分析算法。该算法原理为:先将数据分为K组,随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,将每一个对象分配给距离它最近的聚类中心,聚类中心以及分配给它们的对象就代表一个聚类。即K-Means算法将输入表的某些列作为特征,根据用户指定的相似度计算方式,将原始数据聚成若干类。
误差平方和(Sum Of Square Error,SSE):聚类学***方和指标。
开源前端检测工具:是一站式前端检测解决方案,无代码侵入实现前端性能质量采集分析,守护前端页面健康,提高开发质量。
软件开发工具包(Software Development Kit,SDK):一般都是一些软件工程师为特定的软件包、软件框架、硬件平台、操作***等建立应用软件时的开发工具的集合。
图1是本申请一个示例性实施例提供的计算机***的结构框图。该计算机***100包括:第一终端110、第二终端120、第一服务器130和第二服务器140。
第一终端110安装和运行有支持小程序的应用程序111(客户端),应用程序111提供的小程序依赖应用程序111运行。应用程序111具体可以为即时通信客户端、社交客户端、医疗客户端、金融客户端、短视频客户端、视频点播客户端、音乐客户端、外卖客户端、网购客户端、知识类客户端和工具类客户端中的任意一种。当第一终端110调起应用程序111运行时,第一终端110的屏幕上显示应用程序111的用户界面,应用程序111中小程序运行时,第一终端110的屏幕上显示应用程序111的小程序的用户界面。第一终端110是用户112使用的终端,应用程序111上登录有用户112的用户帐号。第一终端110可以泛指多个终端中的一个。可选地,第一终端110的设备类型包括:智能手机、平板电脑、电子书阅读器、MP3播放器、MP4播放器、膝上型便携计算机和台式计算机中的至少一种。
第二终端120安装和运行有支持小程序的应用程序111(客户端),应用程序111提供的小程序依赖应用程序111运行。当第二终端120调起应用程序111运行时,第二终端120的屏幕上显示应用程序111的用户界面,应用程序111中小程序运行时,第二终端120的屏幕上显示应用程序111的小程序的用户界面。第二终端120是用户122使用的终端,应用程序111上登录有用户122的用户帐号。第二终端120可以泛指多个终端中的一个。可选地,第二终端120的设备类型包括:智能手机、平板电脑、电子书阅读器、MP3播放器、MP4播放器、膝上型便携计算机和台式计算机中的至少一种。
可选地,第一终端110和第二终端120上安装的应用程序是相同的,或两个终端上安装的应用程序是不同操作***平台上的同一类型应用程序。可选地,第一终端110的应用程序111中的小程序为患者小程序,患者小程序上登录有患者用户的患者用户帐号,第二终端120的应用程序111中的小程序为医生小程序,医生小程序上登录有医生用户的医生用户帐号;或者,第一终端110的应用程序111中的小程序为医生小程序,医生小程序上登录有医生用户的医生用户帐号,第二终端120的应用程序111中的小程序为患者小程序,患者小程序上登录有患者用户的患者用户帐号。其中,患者小程序与医生小程序相对应。例如,患者用户帐号通过患者小程序可与医生用户帐号的医生小程序进行问诊会话。
第一终端110和第二终端120通过无线网络或有线网络与第一服务器130相连。
第一服务器130包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。第一服务器130用于为支持小程序的应用程序111提供后台服务。可选地,第一服务器130承担主要计算工作,第一终端110和第二终端120承担次要计算工作;或者,第一服务器130承担次要计算工作,第一终端110和第二终端120承担主要计算工作;或者,第一服务器130和第一终端110、第二终端120之间采用分布式计算架构进行协同计算。
在一个示意性的例子中,第一服务器130包括处理器131、用户帐号数据库132、小程序处理模块133、面向用户的输入/输出接口(Input/Output Interface,I/O接口)134。其中,处理器131用于加载第一服务器130中存储的指令,处理用户帐号数据库132和小程序处理模块133中的数据;用户帐号数据库132用于存储第一终端110、第二终端120以及其它终端所使用的用户帐号的数据,比如用户帐号的头像、用户帐号的昵称、用户帐号所在的群组等;小程序处理模块133用于为应用程序111中的小程序提供必要的支持服务;面向用户的I/O接口134用于通过无线网络或有线网络和第一终端110、第二终端120建立通信交换数据。
第一终端110和第二终端120通过无线网络或有线网络与第二服务器140相连,使得第一终端110和第二终端120中的应用程序111能够与第二服务器140通信。第二服务器140用于获取第一终端110的应用程序111中的小程序产生的数据,以及获取第二终端120的应用程序111中的小程序产生的数据,并对获取的数据进行存储和分析。例如第二服务器140用于对患者小程序产生的数据和医生小程序产生的数据进行获取和存储,并对存储的数据进行分析。第二服务器140包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。
图2是本申请一个示例性实施例提供的分析医疗数据的过程的示意图。如图2所示,患者小程序和医生小程序是依赖同一客户端运行的不同小程序,患者小程序和医生小程序中集成有采集软件开发工具包(Software Development Kit,SDK)。该采集SDK中集成有第一采集工具、第二采集工具和第三采集工具。第一采集工具是自定义的,第二采集工具是第三方提供的,第三采集工具是客户端的开发者提供的。第一采集工具用于采集涉及复杂操作的信息,第二采集工具用于采集涉及基础操作的信息,第三采集工具用于采集基础信息。
在数据采集阶段201和采集聚合阶段202,采集SDK会对患者小程序和医生小程序产生的数据进行采集,并将采集到的数据进行聚合。在聚合上报阶段203,患者小程序和医生小程序中集成的上报SDK会对采集到并聚合的数据上报至计算机设备。在数据存储阶段204,计算机设备将上报SDK上报的数据统一存储至计算机设备的数据仓库中。此外,对于患者小程序和医生小程序中一些数据量较大的数据,计算机设备会通过患者小程序和医生小程序各自对应的后端服务直接获取。在智能分析阶段205、数据建模阶段206和病症聚类阶段207中,计算机设备对数据仓库中存储的医疗数据进行处理以及分析,并输出分析的结果。例如,计算机设备通过对数据仓库中存储的医疗数据进行分析,可得到患者用户帐号对应的病症类别下的各病症组对应的关键词,该分析结果可辅助疾病诊断、疾病治疗、门诊推荐等决策,从而实现AI化医疗。
通过对患者小程序和医生小程序各自产生的数据进行统一获取,并将获取到的数据统一存储至数据仓库中。在进行医疗数据分析时,通过一个数据仓库即可同时获取到患者小程序产生的数据和医生小程序产生的数据,可简化分析医疗数据时获取医疗数据的过程,从而降低分析医疗数据过程的复杂程度。并且,同时对患者小程序产生的数据和医生小程序产生的数据进行分析,可实现全面地对医疗数据进行分析。
图3是本申请一个示例性实施例提供的医疗数据的分析方法的流程示意图。该方法可以用于计算机设备或计算机设备上的客户端。如图3所示,该方法包括:
步骤302:获取第一小程序产生的第一数据。
第一小程序是客户端提供的小程序,该第一小程序依赖客户端运行。该第一小程序泛指一个或多个第一小程序。第一小程序是患者用户帐号登录的小程序,患者用户帐号是患者的用户帐号。需要说明的是,本申请实施例中的患者并不特指已被诊断患病的用户,使用第一小程序的用户均可称为患者。
第一小程序产生的第一数据包括多类数据。可选地,第一数据包括患者用户帐号相关的基础信息、患者用户帐号在第一小程序中执行的基础交互的交互信息、患者用户帐号在第一小程序中执行的复杂交互的交互信息中的至少一种。其中,复杂交互的交互操作相较于基础交互的交互操作更复杂,例如交互的步骤更多。
示例地,患者用户帐号相关的基础信息包括患者用户帐号的设备类型、设备信息、患者用户帐号的所在区域(所在位置)、患者用户帐号在第一小程序中访问的用户界面(用于统计第一小程序中各用户界面的访问人数)、患者用户帐号对第一小程序中的用户界面的访问次数(用于统计第一小程序中各用户界面的访问次数)、患者用户帐号在第一小程序中各用户界面的停留时长和患者用户帐号在第一小程序中各用户界面间的跳转路径等信息中的至少一种。示例地,基础交互的交互信息包括患者用户帐号对第一小程序中各模块的点击行为信息、第一小程序中各模块对患者用户帐号的曝光信息、患者用户帐号对第一小程序中的列表元素的滑动信息、患者用户帐号对第一小程序的各用户界面中的交互控件的交互触发信息等用户基础操作的信息中的至少一种。示例地,复杂交互的交互信息包括患者用户帐号的问诊会话信息和患者用户帐号查阅问诊会话信息的时长等用户复杂操作的信息中的至少一种。问诊会话信息是患者用户帐号在第一小程序中进行问诊的过程中,患者用户帐号发送的会话信息。例如第一小程序包括患者用户帐号和医生用户帐号的问诊会话界面,患者用户帐号在该用户界面中发送的会话信息即为患者用户帐号的问诊会话信息。该问诊会话信息以患者用户帐号和医生用户帐号之间的一条问诊会话消息为单位,和/或以患者用户帐号和医生用户帐号之间的一次问诊会话为单位。
可选地,计算机设备获取的第一小程序产生的第一数据是通过第一小程序中集成的采集工具采集的。第一小程序中集成有一个或多个采集工具,每个采集工具用于采集一类第一数据。可选地,该采集工具集成在第一小程序集成的第一采集SDK中。第一小程序还集成有第一上报SDK,计算机设备根据该第一上报SDK上报的数据,从而获取到第一采集SDK采集的第一数据。
步骤304:获取第一小程序对应的第二小程序产生的第二数据。
第二小程序是客户端提供的小程序,该第二小程序依赖客户端运行,第一小程序和第二小程序是依赖同一客户端运行的不同小程序。该第二小程序泛指一个或多个第二小程序。第二小程序是医生用户帐号登录的小程序,医生用户帐号是医生的用户帐号。
示例地,医生用户帐号相关的基础信息包括医生用户帐号的设备类型、设备信息、医生用户帐号的所在区域(所在位置)、医生用户帐号在第二小程序中访问的用户界面(用于统计第二小程序中各用户界面的访问人数)、医生用户帐号对第二小程序中的用户界面的访问次数(用于统计第二小程序中各用户界面的访问次数)、医生用户帐号在第二小程序中各用户界面的停留时长和医生用户帐号在第二小程序中各用户界面间的跳转路径等信息中的至少一种。示例地,基础交互的交互信息包括医生用户帐号对第二小程序中各模块的点击行为信息、第二小程序中各模块对医生用户帐号的曝光信息、医生用户帐号对第二小程序中的列表元素的滑动信息、医生用户帐号对第二小程序的各用户界面中的交互控件的交互触发信息等用户基础操作的信息中的至少一种。示例地,复杂交互的交互信息包括医生用户帐号的问诊会话信息和医生用户帐号查阅问诊会话信息的时长等用户复杂操作的信息中的至少一种。问诊会话信息是医生用户帐号在第二小程序中进行问诊的过程中,医生用户帐号发送的会话信息。例如第二小程序包括医生用户帐号和患者用户帐号的问诊会话界面,医生用户帐号在该用户界面中发送的会话信息即为医生用户帐号的问诊会话信息。
可选地,计算机设备获取的第二小程序产生的第二数据是通过第二小程序中集成的采集工具采集的。第二小程序中集成有一个或多个采集工具,每个采集工具用于采集一类第二数据。可选地,该采集工具集成在第二小程序集成的第二采集SDK中。第二小程序还集成有第二上报SDK,计算机设备根据该第二上报SDK上报的数据,从而获取到第二采集SDK采集的第二数据。该第二采集SDK与第一小程序中集成的第一采集SDK相同或不同,该第二上报SDK与第一小程序中集成的第一上报SDK相同或不同。
步骤306:将第一小程序产生的第一数据和第二小程序产生的第二数据存储在同一数据仓库中。
计算机设备在获取到第一小程序的第一数据和第二小程序的第二数据后,会将这两部分数据存储在同一数据仓库时,以便于在进行数据分析时同时获取第一小程序的第一数据和第二小程序的第二数据,从而实现全面地数据分析。
可选地,对于第一小程序和第二小程序中某些数据量较大(数据量大于阈值)的数据,计算机设备还能够通过第一小程序和第二小程序的后端服务来获取此类数据。第一小程序和第二小程序的后端服务是客户端的开发者提供的。可选地,计算机设备通过截获第一小程序向其后端服务上报的数据,以及截获第二小程序向其后端上报的数据,从而获取到此类数据量较大的数据。或者计算机设备直接从第一小程序的后端服务直接获取此类数据量较大的数据,以及从第二小程序的后端服务直接获取此类数据量较大的数据。计算机设备在获取到此类数据后,会将获取到的数据也存储至该数据仓库中。
例如,在第一小程序和第二小程序的问诊模块(问诊会话界面)中,同一会话中的医患对话内容可以达到上千条数据。在此情况下,计算设备不再通过前端(小程序)采集上报,而是通过小程序的后端数据接口上报给数据仓库,以此减轻前端上报带来的网络请求压力。
步骤308:对数据仓库中存储的医疗数据进行分析,得到患者用户帐号对应的病症类别下的各病症组对应的关键词。
该医疗数据包括患者用户帐号和医生用户帐号的问诊会话信息,问诊会话信息是根据第一数据和第二数据确定的。示例地,问诊会话信息是患者用户帐号和医生用户帐号在各自的小程序中进行问诊的过程中,患者用户帐号和医生用户帐号发送的会话信息。问诊是指采用对话方式,向患者问询疾病的发生、发展情况和现在症状、治疗经过等,以诊断疾病和给出疾病治疗建议的过程。
可选地,计算机设备通过相关的算法和机器学习模型,对问诊会话信息进行处理的分析,从而得到患者用户帐号对应的病症类别下的各病症组对应的关键词。该患者用户帐号包括登录第一小程序的一个或多个用户帐号,患者用户帐号对应的病症类别是根据问诊会话信息预测的患者可能患有的病症的类别,该关键词是从问诊会话信息中提取的,病症类别根据症状、病症阶段、治疗方式等可再划分为一个或多个病症组。可选地,通过对不同患者的病症类别以及病症类别对应的关键词进行主题聚类,可进一步预测病症类别下的各病症组对应的关键词。例如病症类别为感冒,该病症类别下包括2个病症组,分别为风寒感冒和风热感冒。其中风寒感冒对应的关键词包括鼻塞、打喷嚏、流清鼻涕、咽痒、咽痒就想咳嗽、口干、喜欢喝热水、怕冷比较重、发热比较轻、舌淡红、苔薄白。风热感冒对应的关键词包括流黄脓鼻涕、咽干、咽喉肿痛、咳嗽、咳黄黏痰、痰黏稠、不容易咳出来、小便黄、舌红、苔黄。根据对数据仓库中存储的医疗数据进行分析得到分析结果,可辅助疾病诊断、疾病治疗、门诊推荐等决策,从而实现AI化医疗。
综上所述,本实施例提供的方法,通过对患者小程序和医生小程序各自产生的数据进行统一获取,并将获取到的数据统一存储至数据仓库中。在进行医疗数据分析时,通过同一个数据仓库即可同时获取到患者小程序产生的数据和医生小程序产生的数据,可简化分析医疗数据时获取医疗数据的过程,从而降低分析医疗数据过程的复杂程度。并且,同时对患者小程序产生的数据和医生小程序产生的数据进行分析,可实现全面地对医疗数据进行分析。
图4是本申请一个示例性实施例提供的医疗数据的分析方法的流程示意图。该方法可以用于计算机设备或计算机设备上的客户端。如图4所示,该方法包括:
步骤402:获取由第一上报SDK上报的,通过第一采集SDK采集的第一小程序产生的第一数据。
第一小程序是客户端提供的小程序,该第一小程序依赖客户端运行。第一小程序是患者用户帐号登录的小程序,患者用户帐号是患者的用户帐号。第一小程序集成有第一采集SDK和第一上报SDK。第一采集SDK用于采集第一小程序产生的第一数据,第一上报SDK用于向计算机设备上报第一采集SDK采集的第一数据。可选地,第一采集SDK和第一上报SDK是开发人员开发并集成在第一小程序中的。
可选地,第一采集SDK中集成有第一采集工具、第二采集工具和第三采集工具中的至少一个。第二采集工具是第三方提供的,例如为开源前端检测工具。第三采集工具是客户端的开发者提供的。每种采集工具能够采集一类数据,计算机设备能够获取由第一上报SDK上报的,通过第一采集SDK中的至少一个采集工具采集的第一数据。
可选地,第一采集工具采集的第一数据包括患者用户帐号和医生用户帐号的问诊会话信息、患者用户帐号查阅问诊会话信息的时长、患者用户帐号发送的问诊会话信息中满足第二重复发送次数的问诊会话信息、以及患者用户帐号和医生用户帐号之间的会话次数中的至少一种。可选地,第二采集工具采集的第一数据包括患者用户帐号在第一小程序中的交互信息。可选地,第三采集工具采集的第一数据包括患者用户帐号的基础信息。该第二重复发送次数是开发人员设置的。
在通过第一采集工具采集患者用户帐号查阅问诊会话信息的时长的情况下,计算机设备通过第一采集工具在第一小程序显示第一问诊会话界面的过程中,确定的问诊会话信息在第一问诊会话界面中的停留时长,从而获取由第一上报SDK上报的患者用户帐号查阅问诊会话信息的时长。
可选地,在第一小程序显示第一问诊会话界面的过程中,第一采集工具会实时检测第一问诊会话界面中的会话列表滚动的事件,并计算会话文本对应的用户界面(UserInterface,UI)组件进入窗口(第一问诊会话界面)和滑出窗口的时间差,根据这个时间差即可确定问诊会话信息在第一问诊会话界面中的停留时长。
可选地,第一采集SDK采集的第一数据在通过第一上报SDK进行上报的过程,是基于缓存队列分批进行的。响应于第一缓存队列中的数据的数据量满足第一数据量阈值,计算机设备会获取第一上报SDK上报的第一缓存队列中的数据。其中,第一缓存队列是第一小程序中用于存储至少一个采集工具采集的第一数据的缓存队列。即在通过第一采集SDK集成的采集工具采集到第一数据后,第一小程序会将其存储在第一缓存队列中,之后第一上报SDK会对第一缓存队列中存储的数据的数据量进行检测。每当第一缓存队列中存储的数据的数据量大于或等于第一数据量阈值时,会触发第一上报SDK将第一缓存队列中存储的数据上报至计算机设备。第一数据量阈值是开发者设置的。
可选地,计算机设备基于第一小程序对应的多个请求通道中的部分请求通道,获取第一小程序产生的第一数据。即第一小程序在上报第一数据时,是通过多个请求通道中的部分请求通道上报的。其中,第一小程序对应的多个请求通道,是客户端的开发者提供的用于对外进行数据传输的通道。
步骤404:获取由第二上报SDK上报的,通过第二采集SDK采集的第二小程序产生的第二数据。
第二小程序是客户端提供的小程序,该第二小程序依赖客户端运行,第一小程序和第二小程序是依赖同一客户端运行的不同小程序。第二小程序是医生用户帐号登录的小程序,医生用户帐号是医生的用户帐号。第二小程序集成有第二采集SDK和第二上报SDK。第二采集SDK用于采集第二小程序产生的第二数据,第二上报SDK用于向计算机设备上报第二采集SDK采集的第二数据。可选地,第二采集SDK和第二上报SDK是开发人员开发并集成在第二小程序中的。
可选地,第二采集SDK中集成有第一采集工具、第二采集工具和第三采集工具中的至少一个。第二采集工具是第三方提供的,例如为开源前端检测工具。第三采集工具是客户端的开发者提供的。每种采集工具能够采集一类数据,计算机设备能够获取由第二上报SDK上报的,通过第二采集SDK中的至少一个采集工具采集的第二人数据。
可选地,第一采集工具采集的第二数据包括患者用户帐号和医生用户帐号的问诊会话信息、医生用户帐号查阅问诊会话信息的时长、医生用户帐号发送的问诊会话信息中满足第三重复发送次数的问诊会话信息、以及医生用户帐号和患者用户帐号之间的会话次数中的至少一种。可选地,第二采集工具采集的第二数据包括医生用户帐号在第二小程序中的交互信息。可选地,第三采集工具采集的第二数据包括医生用户帐号的基础信息。该第三重复发送次数是开发人员设置的。
在通过第一采集工具采集医生用户帐号查阅问诊会话信息的时长的情况下,计算机设备通过第一采集工具在第二小程序显示第二问诊会话界面的过程中,确定的问诊会话信息在第二问诊会话界面中的停留时长,从而获取由第二上报SDK上报的医生用户帐号查阅问诊会话信息的时长。
可选地,第二采集SDK采集的第二数据在通过第二上报SDK进行上报的过程,是基于缓存队列分批进行的。响应于第二缓存队列中的数据的数据量满足第二数据量阈值,计算机设备会获取第二上报SDK上报的第二缓存队列中的数据。其中,第二缓存队列是第二小程序中用于存储至少一个采集工具采集的第二数据的缓存队列。即在通过第二采集SDK集成的采集工具采集到第二数据后,第二小程序会将其存储在第二缓存队列中,之后第二上报SDK会对第二缓存队列中存储的数据的数据量进行检测。每当第二缓存队列中存储的数据的数据量大于或等于第二数据量阈值时,会触发第二上报SDK将第二缓存队列中存储的数据上报至计算机设备。第二数据量阈值是开发者设置的。
可选地,计算机设备基于第二小程序对应的多个请求通道中的部分请求通道,获取第二小程序产生的第二数据。即第二小程序在上报第二数据时,是通过多个请求通道中的部分请求通道上报的。其中,第二小程序对应的多个请求通道,是客户端的开发者提供的用于对外进行数据传输的通道。
可选地,对于第一小程序和第二小程序中某些数据量较大的数据,计算机设备还能够通过第一小程序和第二小程序的后端服务来获取此类数据。第一小程序和第二小程序的后端服务是客户端的开发者提供的。可选地,计算机设备通过截获第一小程序向其后端服务上报的数据,以及截获第二小程序向其后端上报的数据,从而获取到此类数据量较大的数据。或者计算机设备直接从第一小程序的后端服务直接获取此类数据量较大的数据,以及从第二小程序的后端服务直接获取此类数据量较大的数据。
示例地,图5是本申请一个示例性实施例提供的上报小程序产生的数据的过程的示意图。如图5所示,通过上述采集SDK采集的数据,可分为两部分:通过前端(小程序)无埋点采集到的数据501(第二采集工具、第三采集工具采集的数据)和通过前端精准埋点采集到的数据502(第一采集工具采集的数据),前端精准埋点会涉及到对被收集模块的代码侵入来实现完成。对于前端采集到的数据的上报,会采用聚合上报的方式,所有通过无埋点采集的数据501,和通过将代码注入模块从而精准采集的数据502,小程序会将这些数据分别有序存入到前端缓存队列503,缓存队列503中的数据达到一定阈值后自动触发上报至计算机设备的数据仓库505。另外,计算机设备还能够通过后端数据收集从而获取小程序中的数据504,该方案可辅助前端上报收集信息体量较大的数据内容。比如问诊模块中,一个场景中医患对话内容可以达到上千条数据,这里不再额外通过前端采集上报,而是通过后端数据接口上报给数据仓库,减轻前端上报带来的网络请求压力。
示例地,图6是本申请一个示例性实施例提供的通过请求通道上报小程序产生的数据的过程的示意图。如图6所示,小程序集成的采集SDK在采集到数据601后,会将数据聚合存储,并按序存储至缓存队列602中。在常规上报的情况下,缓存队列602中的缓存数据通过接口上报到服务端(计算机设备)的数据仓库604。在缓存队列602中的数据未完成上报但小程序关闭的情况下,小程序会将未完成上报的数据603进行储存,并在小程序下一次启动时通过接口上报到服务端的数据仓库604。可选地,上报接口在同一时间只会占用一个请求通道(例如wx.request),缓存队列602中的数据达到一定阈值后自动触发上报请求以通过请求通道上报数据。当目前的请求未完成时,新进入的采集数据会持续进入缓存队列602中,直到目前的请求完成,之后再重新发起新的上报请求。
步骤406:将第一小程序产生的第一数据和第二小程序产生的第二数据存储在同一数据仓库中。
计算机设备在获取到第一小程序的第一数据和第二小程序的第二数据后,会将这两部分数据存储在同一数据仓库时,以便于在进行数据分析时同时获取第一小程序的第一数据和第二小程序的第二数据,从而实现全面地数据分析。
计算机设备在数据仓库中存储的数据包括患者用户帐号和医生用户帐号的问诊会话信息,问诊会话信息是根据第一数据和第二数据确定的。问诊会话信息是患者用户帐号和医生用户帐号在各自的小程序中进行问诊的过程中,患者用户帐号和医生用户帐号发送的会话信息。
示例地,图7是本申请一个示例性实施例提供的通过小程序问诊的过程的示意图。如图7所示,在步骤A1中,第一小程序中的患者用户帐号发起患者咨询(问诊),输入咨询信息。在步骤A2中,第一小程序根据咨询信息通过语义识别等机器学习模型对患者用户帐号进行分类,判断咨询信息是否是有效的咨询。在步骤A3中,在患者用户帐号的咨询信息是有效咨询的情况下,第一小程序对患者用户帐号进行交互式引导,获取患者用户帐号输入的症状描述信息。在步骤A4中,第一小程序在症状描述信息中提取病症信息。在步骤A5中,第一小程序通过分类模型对病症信息进行分类,按照分类得到的病症对患者用户帐号进行分诊。在步骤A6中,人工确认分类结果是否准确。在步骤A7中,根据人工确认的病症信息的分类结果,触发患者用户帐号的问诊流程。在步骤A8中,在患者用户帐号的咨询信息不是有效咨询的情况下,第一小程序判定无法处理。在步骤A9中,第一小程序对该患者用户帐号进行人工接入处理。在步骤A10中,在患者用户帐号的咨询信息为常见问题的情况下,第一小程序根据常见问题以及相应的解答的对应关系,向患者用户帐号推荐咨询信息对应的解答信息。
示例地,图8是本申请一个示例性实施例提供的问诊会话界面的示意图。如图8所示,第一小程序的患者用户帐号发起问诊,第一小程序显示问诊会话界面801,问诊会话界面801对应问诊的症状描述阶段,在问诊会话界面801中显示有患者用户帐号的会话信息和医生助手用户帐号的会话信息,医生助手用户帐号是医生助手的用户帐号,或者是AI操控的用户帐号。在症状描述阶段后,会为患者安排医生从而进入咨询医生阶段,第一小程序会显示问诊会话界面802,在问诊会话界面802中显示有患者用户帐号的会话信息和医生用户帐号的会话信息,该会话信息即为患者用户帐号和医生用户帐号的问诊会话信息。
计算机设备在获取并存储患者用户帐号和医生用户帐号的问诊会话信息后,还能够提供问诊会话信息的管理以及检索功能。
示例地,图9是本申请一个示例性实施例提供的问诊会话管理界面的示意图。如图9所示,计算机设备显示问诊会话管理界面901,问诊会话管理界面901中显示有不同医生用户帐号和患者用户帐号的问诊会话信息的列表,列表中每行代表一次医生用户帐号和患者用户帐号的问诊会话对应的问诊会话信息。该问诊会话管理界面901中还显示有针对问诊会话信息的筛选控件,问诊会话管理界面901中还显示有每个问诊会话信息相关的信息,例如每个问诊会话信息对应的序号、关系链标识(指示某一个医生用户帐号和某一个患者用户帐号之间的对应关系)、医生用户帐号、患者用户帐号、会话来源(渠道)、医生的职称、医生所属医院、医生所属的一级科室、医生所属的第二科室等信息。响应于接收到问诊会话管理界面901中的针对问诊会话信息的查看操作,计算机设备显示该查看操作查看的问诊会话信息的会话详情界面902,该会话详情界面902显示有问诊会话信息中每条会话信息对应的发布方帐号、发布时间、来源(例如***、医生、患者)、信息类型(例如***消息、管理计划、患教)以及会话信息的文本内容。
示例地,图10是本申请一个示例性实施例提供的问诊会话检索界面的示意图。如图10所示,计算机设备显示问诊会话检索界面1001,该问诊会话检索界面1001中显示有不同检索方式的检索控件,例如按照问诊会话信息中出现的关键词检索、按照问诊会话信息对应的医生用户帐号检索、按照问诊会话信息的发送时间检索。响应于通过输入的关键字检索问诊会话信息,计算机设备在问诊会话检索界面1001中显示检索结果。该检索结果包括内容与关键字匹配的一条问诊会话信息或内容与关键字匹配的一次问诊会话下的全部问诊会话信息。显示的问诊会话信息中会对问诊会话信息中匹配的关键词进行突出显示,例如对匹配的关键词进行加粗、高亮、改变颜色等。该检索结果还包括问诊会话信息的发送时间、问诊会话信息对应的医生用户帐号的相关信息、以及医生用户帐号和相应的患者用户帐号的关系链创建时间。关系链创建时间包括线上关系链创建时间(通过小程序创建的关系)和线下关系链创建时间(通过线下面访创建的关系)。
步骤408:对患者用户帐号和医生用户帐号的问诊会话信息进行聚类,得到问诊会话信息对应的病症类别。
数据仓库中存储的医疗数据包括患者用户帐号和医生用户帐号的问诊会话信息,该问诊会话信息是根据第一数据和第二数据确定的。该问诊会话信息可分为疾病描述和问诊对话。可选地,疾病描述和问诊对话是通过根据问诊流程划分的或者是通过语义识别模型划分的。例如在问诊流程提示患者用户帐号输入疾病描述时,获取的问诊会话信息即为疾病描述,其它时刻的信息即为问诊对话。计算机设备将问诊会话信息输入语义识别模型,可得到语义识别模型对问诊会话信息中文本的分类结果,即疾病描述和问诊对话。该语义识别模型是通过样本疾病描述和样本问诊对话训练得到的。
可选地,图11是本申请一个示例性实施例提供的对医疗数据进行分析的过程的示意图。如图11所示,针对数据的预处理阶段1101:
在对数据仓库中存储的医疗数据进行分析时,计算机设备首先会对需要分析的数据进行预处理。在预处理过程中,计算机设备根据语料文本对问诊会话信息进行数据清洗、分词、确定权重等处理。考虑到医学文本的特殊性,可引入CMeSH作为专业词库来获取语料文本。在预处理过程中,计算机设备还会剔除问诊会话信息中的停用词、副词、介词、连词等虚词。
继续参照图11,针对数据建模阶段1102:
为了获取患者用户帐号与病症相关的特征,计算机设备采用Word2Vec词向量的Skip-Gram模型。将采集的问诊会话信息(疾病描述文本)作为训练语料,运用负采样(Negative Sampling)优化方法提高模型训练速度、并改善生成的词向量的质量。根据问诊会话信息以及Word2Vec的模型,计算机设备能够实现对每个患者用户帐号的疾病描述矢量化,即构建病患模型。示例地,患者p的疾病描述向量如下公式所示:
其中,N为疾病描述的词项数量,vi为对应词项i的词向量。
继续参照图11,针对病症聚类阶段1103:
病症聚类即是对矢量化的疾病描述进行聚类分析,划分在线问诊平台的患者人群的类型,即患者用户帐号的病症的类别。可选地,计算机设备采用K-means算法实现聚类,K-means算法的聚类表现主要取决于预先设定的聚类数k。k本身通过实验确定,即设定一组k分别进行聚类,根据聚类效果设置最优k值。可选地,计算机设备采用误差平方和作为聚类效果的指标,误差平方和的计算公式为:
其中,m对应特征维度,x为聚类对象,Ci为聚类i的中心,xj和Cij分别为x和Ci在第j维上的特征。一般来讲,SSE值随着聚类效果的提升而下降,随着k值的增大而减小,下降率突然变缓处即为最佳k值。
示例地,图12是本申请一个示例性实施例提供的聚类效果的示意图。如图12所示,x轴为聚类数,y轴为聚类的成本函数。根据图12可知,聚类效果随着k值的增大而减小,下降率突然变缓处即为最佳k值,该最佳k值为3。
可选地,当k值变化态势不明显时,计算机设备采用轮廓系数法进一步评测。轮廓系数法的表达式如下:
其中,a(i)为聚类对象i与同簇其他聚类对象的平均距离,反映聚类对象i的簇内差异度。b(i)为聚类对象i与其他簇中所有样本的平均距离,反映聚类对象i与其它簇中聚类对象的不相似度。罗阔系数s取值区间为[-1,1],越接近1表明聚类效果越好。
计算机设备根据对患者用户帐号和医生用户帐号的问诊会话信息进行聚类的聚类结果,即可得到问诊会话信息对应的病症类别。
步骤410:对问诊会话信息进行关键词提取,得到病症类别下的关键词。
计算机设备在获取到聚类结果后,可根据聚类结果,采用关键词提取、主题发现等文本分析方法对医疗数据进行进一步分析。
在计算机设备进行基于关键词的病症特征分析时,可选地,计算机设备采用TF-IDF方法对问诊会话信息中的分词进行加权。根据TF-IDF,计算机设备能够确定病症类别下的各个关键词。
步骤412:基于主题聚类算法对病症类别下的关键词进行聚类,得到病症类别下的各病症组对应的关键词。
在根据问诊会话信息确定病症类别以及病症类别对应的关键词后,可选地,计算机设备采用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型对各病症类别下的文本(关键词)进行主题聚类分析,从而得到病症类别下的各病症组对应的关键词。LDA是主流的主题聚类算法,基于贝叶斯概率模型,分为文档、主题、词项三层结构。
示例地,图13是本申请一个示例性实施例提供的LDA的图模型的示意图。如图13所示,M代表文档数量,N代表文档词语数量,文档的主题z与ω之间的概率分布服从超参数为β的Dirichlet分布。θ表示文档的主题概率分布,服从超参数为α的Dirichlet分布。LDA采用吉布斯采样对θ和进行参数估计。主题数由困惑度确定,困惑度越低说明聚类效果越好。
以抑郁症类别为例,计算机设备确定的抑郁症类别下的各病症组对应的关键词(主题词)如表1所示:
表1
可选地,计算机设备在根据患者用户帐号的问诊会话信息,确定患者用户帐号的病症类别,以及病症类别下的病症组对应的关键词后,能够对分析得到结果进行进一步分析处理,具体如下:
计算机设备确定患者用户帐号在第一时段内发送的关键词中满足第一重复发送次数的第一目标关键词。并确定第一目标关键词对应的病症类别下的目标病症组。计算机设备根据首次发送时刻和当前时刻之间的时长,确定目标病症组对应的病症阶段,之后计算机设备向患者用户帐号的第一小程序发送病症阶段对应的康复建议信息。
其中,第一时段是开发人员设置的,例如为近一天、近三天、近一周、近一月等。第一重复次数是开发人员设置的。首次发送时刻是患者用户帐号在第一时段内首次发送第一目标关键词的时刻。计算机设备根据不同病症组在不同时长下和病症阶段的对应关系,确定目标病症组对应的病症阶段,该对应关系是开发人员根据医学数据建立的。该病症阶段用于反映病症的发病和康复情况,例如可分为初期、中期、高峰期、恢复期、健康期。计算机设备根据病症组的病症阶段和康复建议信息的对应关系,确定目标病症组病症阶段对应的康复建议信息,该对应关系是开发人员根据医学数据建立的。第一小程序在接收到康复建议信息后,会在其用户界面中显示康复建议信息。
可选地,响应于患者用户帐号在第一小程序发起与医生用户帐号的问诊会话,计算机设备还会向医生用户帐号的第二小程序发送患者用户帐号的目标病症组对应的病症阶段。
响应于患者用户帐号在第一小程序发起问诊且患者用户帐号位于医院范围内,计算机设备确定医院中与目标病症组对应的病症阶段,对应的门诊和门诊对应的医生。并向患者用户帐号的第一小程序发送门诊的门诊信息和医生的医生信息。其中,门诊信息包括由患者用户帐号的位置移动至门诊的路线信息。
患者用户帐号的位置是计算机设备通过第一小程序获取的。不同病症组的病症阶段和医院门诊、门诊医生的对应关系是开发人员预先建立的。
计算机设备获取属于分析范围的各个患者用户帐号在第二时段内发送的关键词中满足第二重复发送次数的第二目标关键词。响应于属于分析范围的患者用户帐号中,发送第二目标关键词的患者用户帐号的数量满足数量阈值,计算机设备会广播第二目标关键词对应的病症组的传染病提示信息。
该分析范围是开发人员预设的范围,例如按照行政区划分或者覆盖面积、覆盖半径划分。第二时段是开发人员设置的,例如为近一天、近三天、近一周、近一月等。第二重复次数以及数量阈值是开发人员设置的。传染病提示信息用于提示第二目标关键词对应的病症组被预测为传染病。计算机设备广播传染病提示信息的对象包括属于分析范围的患者用户帐号、医生用户帐号以及医疗机构、卫生健康部门等中的至少一个。
在患者用户帐号对应的病友患者用户帐号中,计算机设备确定满足治疗效果条件的目标病友用户帐号。并向患者用户帐号发送目标病友用户帐号对应的治疗信息。
其中,病友用户帐号是与患者用户帐号对应相同的病症组和关键词的用户帐号,病友用户帐号也为患者用户帐号。治疗信息是目标病友用户帐号对应的问诊会话信息中用于指示病症组和关键词对应的疾病的治疗方式的信息。可选地,该治疗信息是通过语义识别模型在病友用户帐号的问诊会话信息中识别的,该语义识别模型是通过样本治疗信息训练得到的。满足治疗效果条件包括病友用户帐号在全部病友用户帐号中的康复时长最短,该康复时长是根据病友用户帐号对应的问诊会话信息确定的。例如计算机设备通过语义识别模型在问诊会话信息中确定疾病的发病时刻和康复时刻,根据该发病时刻和康复时刻之间的时长即可确定康复时长。该语义识别模型是通过描述发病时刻的样本文本和描述康复时刻的样本文本训练得到的。
在获取到患者用户帐号对应的病症类别下的各病症组对应的关键词后,计算机设备还能够针对不同病症类别下的每个病症组,分别创建病友交流会话,并发送至请求加入病友交流会话的患者用户帐号的第一小程序。即计算机设备创建的每个病友交流会话,对应有一个病症类别下的一个病症组。计算机设备创建的病友交流会话中,包括属于该病友交流会话对应的病症类别下的病症组,且请求加入病友交流会话的各个患者用户帐号。第一小程序在接收到病友交流会话后,能够显示该病友交流会话的用户界面,使登录该第一小程序的患者用户帐号能够与病友交流会话中,其他相同病症类别下的相同病症组的患者用户帐号进行会话交流。有助于患有相同疾病的患者之间高效交流,从而提升患者的康复进度。
可选地,病友交流会话的用户界面中,显示有加入病友交流会话的患者用户帐号。在显示的患者用户帐号的周侧,显示有该患者用户帐号在病友交流会话对应的病症类别下的病症组中对应的关键词。显示的该关键词有助于病友交流会话中的各用户更准确地了解其他用户的疾病类别以及症状,从而按需添加病友交流会话中的其他用户为好友以进一步沟通。
可选地,计算机设备在创建病友交流会话时,还会将负责该病友交流会话对应的病症类别下的病症组的医生用户帐号加入该会话。第一小程序在显示病友交流会话的用户界面时,会在该用户界面中显示加入病友交流会话的医生用户帐号。将医生用户帐号加入病友交流会话,有助于医生用户帐号为病友交流会话中的患者用户帐号提供整体的疾病诊断和疾病康复的建议,从而提升医生与患者之间的沟通效率。
综上所述,本实施例提供的方法,通过对患者小程序和医生小程序各自产生的数据进行统一获取,并将获取到的数据统一存储至数据仓库中。在进行医疗数据分析时,通过同一个数据仓库即可同时获取到患者小程序产生的数据和医生小程序产生的数据,可简化分析医疗数据时获取医疗数据的过程,从而降低分析医疗数据过程的复杂程度。并且,同时对患者小程序产生的数据和医生小程序产生的数据进行分析,可实现全面地对医疗数据进行分析。
本实施例提供的方法,还通过对问诊会话信息进行聚类分析、主题聚类和关键词提取,实现确定病症类别下的各病症组对应的关键词。提供了一种准确确定病症组对应的关键词的实现方式。
本实施例提供的方法,还通过判断患者可能患有的疾病,并确定该疾病当前的病症阶段并给出康复建议,提供了一种按照病症阶段智能化提供康复建议的方案,有助于患者快速康复。
本实施例提供的方法,还通过判断患者可能患有的疾病以及疾病的病症阶段,来在患者发起问诊的过程中,自动化为患者提供符合该疾病的病症阶段的医院门诊以及相关的路线信息,可提升患者线下问诊的效率。
本实施例提供的方法,还通过向医生提供患者可能患有的疾病,以及该疾病当前的病症阶段,可实现为医生诊断过程提供参考,提升医生进行疾病诊断和治疗的效率。
本实施例提供的方法,还通过对分析范围内的患者可能患有的疾病以及相应的关键词进行分析,来分析该范围内是否有传染病风险并给出提示信息。提供了一种智能化分析传染病的方案,且分析的效率以及时效性较高。
本实施例提供的方法,还通过向患者提供患有类似疾病的其他患者中,治疗效果最佳的患者的治疗信息,能够提升向患者发送治疗信息的准确度,有助于患者快速康复。
本实施例提供的方法,还通过在小程序中集成采集SDK和上报SDK,提供了一种高效的数据采集和上报的方案。
本实施例提供的方法,还通过在SDK中集成的不同采集工具来采集不同类型的数据,可实现提升采集的数据的丰富度,从而实现更全面地进行医疗数据分析。
本实施例提供的方法,还通过采集用户的问诊会话信息在问诊会话界面中的停留时长,可实现获知用户主要关注的问诊会话信息,以便于后续更准确的分析用户信息、提供辅助诊疗等功能。
本实施例提供的方法,还通过将采集的数据存储至缓存队列中再进行上报,通过缓存队列可实现精准控制上报的数据量,避免数据传输压力过大。
本实施例提供的方法,还通过控制数据传输使用的请求通道的数量,能够避免数据传输占用过多的请求通道,导致小程序中其它使用请求通道的服务无法正常运行的情况。
本申请实施例提供一种医疗业务场景下的大数据采集与处理方法,能够解决集成小程序的客户端官方提供的数据采集方案无法将医生端、患者端数据采集上报聚合和统一存储的技术问题,并且不能很高效的提供智能分析的能力。本申请实施例提供的方法,通过分别实现医生端、患者端数据采集的SDK,采集SDK将会通过三种方式来收集数据:客户端官方数据收集、开源工具数据收集、自定义工具数据收集;客户端官方将会收集通用的数据类型;开源工具主要负责用户基础操作的信息收集;自定义工具收集数据主要负责收集一些复杂交互的行为数据,并且这些特定复杂数据对于后续进行智能分析有着非常明显的效率提升帮助。例如,其中一个自定义复杂数据的收集是能够动态的收集问诊会话界面的窗口中,医生或者患者回复的文案在可视窗口中停留的时长,这对后续精准的分析数据非常有帮助。并且除了采用端上数据的采集,本申请实施例提供的方法还结合了后端数据的采集上报,这样在数据维度能够极大的满足业务分析诉求。当数据采集部分满足之后,可进行数据清洗,根据定向的业务诉求,将问诊会话相关的数据流入到智能分析***,从而更进一步的进行数据预处理,建模,完成智能提词等功能,最终的分析结果有助于解决智能辅助诊疗的问题。
示例性的,本申请实施例提供的方法可用于以下场景:
(1)智能患者教育:
在患者及医生授权下,通过对线上问诊环节中关于医患对病情讨论的上报采集,基于自然语言处理(Natural Language Processing,NLP)技术能够分析患者关心的病情问题及医生对病情的医嘱,提取相应病症的高频关键词,对患者提出的高频问题进行快速识别及自动反馈。由于线上问诊流程天然具备时序性,对收集的问诊信息经过时序性分析,可以得到不同疾病在不同病程阶段的内容,帮助医生便捷地定时对患者进行患者教育,利于患者病情康复。
(2)辅助诊断:
对整体医疗相关数据进行归一化处理,主成分分析,之后基于深度学习的多层感知机(Multilayer Perceptron,MLP)神经网络,对预处理后的数据进行处理,并对诊断数据进行主成分分析(Principal Components Analysis,PCA)降维,实现诊断分类。从而帮助专业医师提供精准的辅助诊断。根据患者临床诊疗,生物信息,生活习惯等采集数据,可实现研发文本处理算法,并进行数据结构化和清洗,集成分析,最后向个体提供健康咨询,生活方式与行为习惯指导,疾病护理与康复等一体化健康管理服务。
(3)公共卫生领域流行病预测:
疾病预报及预警:
通过对患者历史诊断病例的数据采集和对比分析,并应用机器学习理论的决策树,一种常用的树形结构分析工具,将其中的医疗检查项目,例如血液常规检验,血压等的数值,作为疾病类型的特征值,从而对疾病类型进行一定的预测判断和划分,建立医疗诊断分析模型。这也可以为非医疗人员对疾病诊断提供一些指导,患者也更能即时了解自己身体健康状况和隐患疾病的发展,减少心理上的焦虑的同时,也更能提前规划修养身体的时间。
全面疫情监测:
以传染性疾病为例,需要全面、准确、及时地统计确诊病例数据,包括报告时间、性别、年龄、居住地、活动逗留地址、坐标位置、关联人群、行程信息、确诊时间、就诊过程、患者治疗状况,以及对元数据进行快速统计和可视化展示分析,让社会公众更放心安全出行,医疗机构更精准应对疫情,政府部门更科学地制定防控政策。
需要进行说明的是,本申请在收集用户的相关数据之前以及在收集用户的相关数据的过程中,都可以显示提示界面、弹窗或输出语音提示信息,该提示界面、弹窗或语音提示信息用于提示用户当前正在搜集其相关数据,使得本申请仅仅在获取到用户对该提示界面或者弹窗发出的确认操作后,才开始执行获取用户相关数据的相关步骤,否则(即未获取到用户对该提示界面或者弹窗发出的确认操作时),结束获取用户相关数据的相关步骤,即不获取用户的相关数据。换句话说,本申请所采集的所有用户数据都是在用户同意并授权的情况下进行采集的,且相关用户数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
需要说明的是,本申请实施例提供的方法步骤的先后顺序可以进行适当调整,步骤也可以根据情况进行相应增减,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本申请的保护范围之内,因此不再赘述。
图14是本申请一个示例性实施例提供的医疗数据的分析装置的结构示意图。如图14所示,该装置包括:
获取模块1401,用于获取第一小程序产生的第一数据;获取所述第一小程序对应的第二小程序产生的第二数据;所述第一小程序是患者用户帐号登录的小程序,所述第二小程序是医生用户帐号登录的小程序,所述第一小程序和所述第二小程序是依赖同一客户端运行的不同小程序;
存储模块1402,用于将所述第一小程序产生的所述第一数据和所述第二小程序产生的所述第二数据存储在同一数据仓库中;
分析模块1403,用于对所述数据仓库中存储的医疗数据进行分析,得到所述患者用户帐号对应的病症类别下的各病症组对应的关键词;所述医疗数据包括所述患者用户帐号和所述医生用户帐号的问诊会话信息,所述问诊会话信息是根据所述第一数据和所述第二数据确定的。
在一个可选的设计中,所述分析模块1403,用于:
对所述患者用户帐号和所述医生用户帐号的所述问诊会话信息进行聚类,得到所述问诊会话信息对应的所述病症类别;对所述问诊会话信息进行关键词提取,得到所述病症类别下的所述关键词;
基于主题聚类算法对所述病症类别下的所述关键词进行聚类,得到所述病症类别下的各病症组对应的所述关键词。
在一个可选的设计中,如图15所示,所述装置还包括:
确定模块1404,用于确定所述患者用户帐号在第一时段内发送的所述关键词中满足第一重复发送次数的第一目标关键词;
所述确定模块1404,用于确定所述第一目标关键词对应的所述病症类别下的目标病症组;
所述确定模块1404,用于根据首次发送时刻和当前时刻之间的时长,确定所述目标病症组对应的病症阶段,所述首次发送时刻是所述患者用户帐号在所述第一时段内首次发送所述第一目标关键词的时刻;
发送模块1405,用于向所述患者用户帐号的所述第一小程序发送所述病症阶段对应的康复建议信息。
在一个可选的设计中,所述确定模块1404,用于:
响应于所述患者用户帐号在所述第一小程序发起问诊且所述患者用户帐号位于医院范围内,确定所述医院中与所述目标病症组对应的所述病症阶段,对应的门诊和所述门诊对应的医生;
所述发送模块1405,用于向所述患者用户帐号的第一小程序发送所述门诊的门诊信息和所述医生的医生信息;
其中,所述门诊信息包括由所述患者用户帐号的位置移动至所述门诊的路线信息。
在一个可选的设计中,所述发送模块1405,用于:
响应于所述患者用户帐号在所述第一小程序发起与所述医生用户帐号的问诊会话,向所述医生用户帐号的所述第二小程序发送所述患者用户帐号的所述目标病症组对应的所述病症阶段。
在一个可选的设计中,如图15所示,所述装置还包括:
所述获取模块1401,用于获取属于分析范围的各个所述患者用户帐号在第二时段内发送的所述关键词中满足第二重复发送次数的第二目标关键词;
发送模块1405,用于响应于属于所述分析范围的所述患者用户帐号中,发送所述第二目标关键词的所述患者用户帐号的数量满足数量阈值,广播所述第二目标关键词对应的所述病症组的传染病提示信息。
在一个可选的设计中,如图15所示,所述装置还包括:
确定模块1404,用于在所述患者用户帐号对应的病友患者用户帐号中,确定满足治疗效果条件的目标病友用户帐号;所述病友用户帐号是与所述患者用户帐号对应相同的所述病症组和所述关键词的用户帐号;
发送模块1405,用于向所述患者用户帐号发送所述目标病友用户帐号对应的治疗信息;
其中,所述治疗信息是所述目标病友用户帐号对应的所述问诊会话信息中用于指示所述病症组和所述关键词对应的疾病的治疗方式的信息,所述满足治疗效果条件包括所述病友用户帐号在全部病友用户帐号中的康复时长最短,所述康复时长是根据所述病友用户帐号对应的问诊会话信息确定的。
在一个可选的设计中,所述第一小程序集成有第一采集SDK和第一上报SDK,所述第二小程序集成有第二采集SDK和第二上报SDK;所述获取模块1401,用于:
获取由所述第一上报SDK上报的,通过所述第一采集SDK采集的所述第一小程序产生的所述第一数据;获取由所述第二上报SDK上报的,通过所述第二采集SDK采集的所述第二小程序产生的所述第二数据。
在一个可选的设计中,所述第一采集SDK和所述第二采集SDK中集成有第一采集工具、第二采集工具和第三采集工具中的至少一个,所述第二采集工具是第三方提供的,所述第三采集工具是所述客户端的开发者提供的;所述获取模块1401,用于;
获取由所述第一上报SDK上报的,通过所述第一采集SDK中的至少一个采集工具采集的所述第一数据;获取由所述第二上报SDK上报的,通过所述第二采集SDK中的至少一个采集工具采集的所述第二数据;
其中,所述第一采集工具采集的所述第一数据包括所述患者用户帐号和所述医生用户帐号的所述问诊会话信息、所述患者用户帐号查阅所述问诊会话信息的时长、所述患者用户帐号发送的所述问诊会话信息中满足第二重复发送次数的所述问诊会话信息、以及所述患者用户帐号和所述医生用户帐号之间的会话次数中的至少一种;所述第一采集工具采集的所述第二数据包括所述患者用户帐号和所述医生用户帐号的所述问诊会话信息、所述医生用户帐号查阅所述问诊会话信息的时长、所述医生用户帐号发送的所述问诊会话信息中满足第三重复发送次数的所述问诊会话信息、以及所述医生用户帐号和所述患者用户帐号之间的会话次数中的至少一种;所述第二采集工具采集的所述第一数据包括所述患者用户帐号在所述第一小程序中的交互信息,所述第二采集工具采集的所述第二数据包括所述医生用户帐号在所述第二小程序中的交互信息;所述第三采集工具采集的所述第一数据包括所述患者用户帐号的基础信息,所述第三采集工具采集的所述第二数据包括所述医生用户帐号的基础信息。
在一个可选的设计中,所述获取模块1401,用于:
通过所述第一采集工具在所述第一小程序显示第一问诊会话界面的过程中,确定的所述问诊会话信息在所述第一问诊会话界面中的停留时长,获取由所述第一上报SDK上报的所述患者用户帐号查阅所述问诊会话信息的时长;
通过所述第一采集工具在所述第二小程序显示第二问诊会话界面的过程中,确定的所述问诊会话信息在所述第二问诊会话界面中的停留时长,获取由所述第二上报SDK上报的所述医生用户帐号查阅所述问诊会话信息的时长。
在一个可选的设计中,所述获取模块1401,用于:
响应于第一缓存队列中的数据的数据量满足第一数据量阈值,获取所述第一上报SDK上报的所述第一缓存队列中的数据,所述第一缓存队列是所述第一小程序中用于存储所述至少一个采集工具采集的所述第一数据的缓存队列;
响应于第二缓存队列中的数据的数据量满足第二数据量阈值,获取所述第二上报SDK上报的所述第二缓存队列中的数据,所述第二缓存队列是所述第二小程序中用于存储所述至少一个采集工具采集的所述第二数据的缓存队列。
在一个可选的设计中,所述获取模块1401,用于:
基于所述第一小程序对应的多个请求通道中的部分请求通道,获取所述第一小程序产生的所述第一数据;基于所述第二小程序对应的多个请求通道中的部分请求通道,获取所述第二小程序产生的所述第二数据;
其中,所述第一小程序对应的多个请求通道和所述第二小程序对应的多个请求通道,是所述客户端的开发者提供的用于对外进行数据传输的通道。
需要说明的是:上述实施例提供的医疗数据的分析装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的医疗数据的分析装置与医疗数据的分析方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请的实施例还提供了一种计算机设备,该计算机设备包括:处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的医疗数据的分析方法。
示例地,图16是本申请一个示例性实施例提供的终端的结构示意图。
通常,终端1600包括有:处理器1601和存储器1602。
处理器1601可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1601可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1601也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1601可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1601还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1602可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1602还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1602中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1601所执行以实现本申请中方法实施例提供的医疗数据的分析方法。
在一些实施例中,终端1600还可选包括有:***设备接口1603和至少一个***设备。处理器1601、存储器1602和***设备接口1603之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口1603相连。具体地,***设备包括:射频电路1604、显示屏1605、摄像头组件1606、音频电路1607和电源1608中的至少一种。
***设备接口1603可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器1601和存储器1602。在一些实施例中,处理器1601、存储器1602和***设备接口1603被集成在同一芯片或电路板上;在一些其他实施例中,处理器1601、存储器1602和***设备接口1603中的任意一个或两个可以在单独的芯片或电路板上实现,本申请实施例对此不加以限定。
射频电路1604用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1604将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1604包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1604还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1605用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1605是触摸显示屏时,显示屏1605还具有采集在显示屏1605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1601进行处理。此时,显示屏1605还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1605可以为一个,设置终端1600的前面板;在另一些实施例中,显示屏1605可以为至少两个,分别设置在终端1600的不同表面或呈折叠设计;在再一些实施例中,显示屏1605可以是柔性显示屏,设置在终端1600的弯曲表面上或折叠面上。甚至,显示屏1605还可以设置成非矩形的不规则图形,也即异形屏。显示屏1605可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件1606用于采集图像或视频。可选地,摄像头组件1606包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端1600的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1606还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1601进行处理,或者输入至射频电路1604以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1601或射频电路1604的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1607还可以包括耳机插孔。
电源1608用于为终端1600中的各个组件进行供电。电源1608可以是交流电、直流电、一次性电池或可充电电池。当电源1608包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1600还包括有一个或多个传感器1609。该一个或多个传感器1609包括但不限于:加速度传感器1610、陀螺仪传感器1611、压力传感器1612、光学传感器1613以及接近传感器1614。
加速度传感器1610可以检测以终端1600建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1610可以用于检测重力加速度在三个坐标轴上的分量。处理器1601可以根据加速度传感器1610采集的重力加速度信号,控制触摸显示屏1605以横向视图或纵向视图进行用户界面的显示。加速度传感器1610还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1611可以检测终端1600的机体方向及转动角度,陀螺仪传感器1611可以与加速度传感器1610协同采集用户对终端1600的3D动作。处理器1601根据陀螺仪传感器1611采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1612可以设置在终端1600的侧边框和/或触摸显示屏1605的下层。当压力传感器1612设置在终端1600的侧边框时,可以检测用户对终端1600的握持信号,由处理器1601根据压力传感器1612采集的握持信号进行左右手识别或快捷操作。当压力传感器1612设置在触摸显示屏1605的下层时,由处理器1601根据用户对触摸显示屏1605的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
光学传感器1613用于采集环境光强度。在一个实施例中,处理器1601可以根据光学传感器1613采集的环境光强度,控制触摸显示屏1605的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏1605的显示亮度;当环境光强度较低时,调低触摸显示屏1605的显示亮度。在另一个实施例中,处理器1601还可以根据光学传感器1613采集的环境光强度,动态调整摄像头组件1606的拍摄参数。
接近传感器1614,也称距离传感器,通常设置在终端1600的前面板。接近传感器1614用于采集用户与终端1600的正面之间的距离。在一个实施例中,当接近传感器1614检测到用户与终端1600的正面之间的距离逐渐变小时,由处理器1601控制触摸显示屏1605从亮屏状态切换为息屏状态;当接近传感器1614检测到用户与终端1600的正面之间的距离逐渐变大时,由处理器1601控制触摸显示屏1605从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图16中示出的结构并不构成对终端1600的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本申请实施例中还提供了一种计算机可读存储介质,该可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,当该至少一条指令、至少一段程序、代码集或指令集由计算机设备的处理器加载并执行时,实现上述各方法实施例提供的医疗数据的分析方法。
本申请还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例提供的医疗数据的分析方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的可读存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同切换、改进等,均应包含在本申请的保护范围之内。
Claims (16)
1.一种医疗数据的分析方法,其特征在于,所述方法包括:
获取第一小程序产生的第一数据;获取所述第一小程序对应的第二小程序产生的第二数据;所述第一小程序是患者用户帐号登录的小程序,所述第二小程序是医生用户帐号登录的小程序,所述第一小程序和所述第二小程序是依赖同一客户端运行的不同小程序;
将所述第一小程序产生的所述第一数据和所述第二小程序产生的所述第二数据存储在同一数据仓库中;
对所述数据仓库中存储的医疗数据进行分析,得到所述患者用户帐号对应的病症类别下的各病症组对应的关键词;所述医疗数据包括所述患者用户帐号和所述医生用户帐号的问诊会话信息,所述问诊会话信息是根据所述第一数据和所述第二数据确定的。
2.根据权利要求1所述的方法,其特征在于,所述对所述数据仓库中存储的医疗数据进行分析,得到所述患者用户帐号对应的病症类别下的各病症组对应的关键词,包括:
对所述患者用户帐号和所述医生用户帐号的所述问诊会话信息进行聚类,得到所述问诊会话信息对应的所述病症类别;对所述问诊会话信息进行关键词提取,得到所述病症类别下的所述关键词;
基于主题聚类算法对所述病症类别下的所述关键词进行聚类,得到所述病症类别下的各病症组对应的所述关键词。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
确定所述患者用户帐号在第一时段内发送的所述关键词中满足第一重复发送次数的第一目标关键词;
确定所述第一目标关键词对应的所述病症类别下的目标病症组;
根据首次发送时刻和当前时刻之间的时长,确定所述目标病症组对应的病症阶段,所述首次发送时刻是所述患者用户帐号在所述第一时段内首次发送所述第一目标关键词的时刻;
向所述患者用户帐号的所述第一小程序发送所述病症阶段对应的康复建议信息。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
响应于所述患者用户帐号在所述第一小程序发起问诊且所述患者用户帐号位于医院范围内,确定所述医院中与所述目标病症组对应的所述病症阶段,对应的门诊和所述门诊对应的医生;
向所述患者用户帐号的第一小程序发送所述门诊的门诊信息和所述医生的医生信息;
其中,所述门诊信息包括由所述患者用户帐号的位置移动至所述门诊的路线信息。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
响应于所述患者用户帐号在所述第一小程序发起与所述医生用户帐号的问诊会话,向所述医生用户帐号的所述第二小程序发送所述患者用户帐号的所述目标病症组对应的所述病症阶段。
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取属于分析范围的各个所述患者用户帐号在第二时段内发送的所述关键词中满足第二重复发送次数的第二目标关键词;
响应于属于所述分析范围的所述患者用户帐号中,发送所述第二目标关键词的所述患者用户帐号的数量满足数量阈值,广播所述第二目标关键词对应的所述病症组的传染病提示信息。
7.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在所述患者用户帐号对应的病友患者用户帐号中,确定满足治疗效果条件的目标病友用户帐号;所述病友用户帐号是与所述患者用户帐号对应相同的所述病症组和所述关键词的用户帐号;
向所述患者用户帐号发送所述目标病友用户帐号对应的治疗信息;
其中,所述治疗信息是所述目标病友用户帐号对应的所述问诊会话信息中用于指示所述病症组和所述关键词对应的疾病的治疗方式的信息,所述满足治疗效果条件包括所述病友用户帐号在全部病友用户帐号中的康复时长最短,所述康复时长是根据所述病友用户帐号对应的问诊会话信息确定的。
8.根据权利要求1至7任一所述的方法,其特征在于,所述第一小程序集成有第一采集软件开发工具包SDK和第一上报SDK,所述第二小程序集成有第二采集SDK和第二上报SDK;
所述获取第一小程序产生的第一数据;获取所述第一小程序对应的第二小程序产生的第二数据,包括:
获取由所述第一上报SDK上报的,通过所述第一采集SDK采集的所述第一小程序产生的所述第一数据;获取由所述第二上报SDK上报的,通过所述第二采集SDK采集的所述第二小程序产生的所述第二数据。
9.根据权利要求8所述的方法,其特征在于,所述第一采集SDK和所述第二采集SDK中集成有第一采集工具、第二采集工具和第三采集工具中的至少一个,所述第二采集工具是第三方提供的,所述第三采集工具是所述客户端的开发者提供的;
所述获取由所述第一上报SDK上报的,通过所述第一采集SDK采集的所述第一小程序产生的所述第一数据;获取由所述第二上报SDK上报的,通过所述第二采集SDK采集的所述第二小程序产生的所述第二数据,包括:
获取由所述第一上报SDK上报的,通过所述第一采集SDK中的至少一个采集工具采集的所述第一数据;获取由所述第二上报SDK上报的,通过所述第二采集SDK中的至少一个采集工具采集的所述第二数据;
其中,所述第一采集工具采集的所述第一数据包括所述患者用户帐号和所述医生用户帐号的所述问诊会话信息、所述患者用户帐号查阅所述问诊会话信息的时长、所述患者用户帐号发送的所述问诊会话信息中满足第二重复发送次数的所述问诊会话信息、以及所述患者用户帐号和所述医生用户帐号之间的会话次数中的至少一种;所述第一采集工具采集的所述第二数据包括所述患者用户帐号和所述医生用户帐号的所述问诊会话信息、所述医生用户帐号查阅所述问诊会话信息的时长、所述医生用户帐号发送的所述问诊会话信息中满足第三重复发送次数的所述问诊会话信息、以及所述医生用户帐号和所述患者用户帐号之间的会话次数中的至少一种;所述第二采集工具采集的所述第一数据包括所述患者用户帐号在所述第一小程序中的交互信息,所述第二采集工具采集的所述第二数据包括所述医生用户帐号在所述第二小程序中的交互信息;所述第三采集工具采集的所述第一数据包括所述患者用户帐号的基础信息,所述第三采集工具采集的所述第二数据包括所述医生用户帐号的基础信息。
10.根据权利要求9所述的方法,其特征在于,所述获取由所述第一上报SDK上报的,通过所述第一采集SDK中的至少一个采集工具采集的所述第一数据,包括:
通过所述第一采集工具在所述第一小程序显示第一问诊会话界面的过程中,确定的所述问诊会话信息在所述第一问诊会话界面中的停留时长,获取由所述第一上报SDK上报的所述患者用户帐号查阅所述问诊会话信息的时长;
所述获取由所述第二上报SDK上报的,通过所述第二采集SDK中的至少一个采集工具采集的所述第二数据,包括:
通过所述第一采集工具在所述第二小程序显示第二问诊会话界面的过程中,确定的所述问诊会话信息在所述第二问诊会话界面中的停留时长,获取由所述第二上报SDK上报的所述医生用户帐号查阅所述问诊会话信息的时长。
11.根据权利要求9所述的方法,其特征在于,所述获取由所述第一上报SDK上报的,通过所述第一采集SDK中的至少一个采集工具采集的所述第一数据;获取由所述第二上报SDK上报的,通过所述第二采集SDK中的至少一个采集工具采集的所述第二数据,包括:
响应于第一缓存队列中的数据的数据量满足第一数据量阈值,获取所述第一上报SDK上报的所述第一缓存队列中的数据,所述第一缓存队列是所述第一小程序中用于存储所述至少一个采集工具采集的所述第一数据的缓存队列;
响应于第二缓存队列中的数据的数据量满足第二数据量阈值,获取所述第二上报SDK上报的所述第二缓存队列中的数据,所述第二缓存队列是所述第二小程序中用于存储所述至少一个采集工具采集的所述第二数据的缓存队列。
12.根据权利要求1至7任一所述的方法,其特征在于,所述获取第一小程序产生的第一数据;获取所述第一小程序对应的第二小程序产生的第二数据,包括:
基于所述第一小程序对应的多个请求通道中的部分请求通道,获取所述第一小程序产生的所述第一数据;基于所述第二小程序对应的多个请求通道中的部分请求通道,获取所述第二小程序产生的所述第二数据;
其中,所述第一小程序对应的多个请求通道和所述第二小程序对应的多个请求通道,是所述客户端的开发者提供的用于对外进行数据传输的通道。
13.一种医疗数据的分析装置,其特征在于,所述装置包括:
获取模块,用于获取第一小程序产生的第一数据;获取所述第一小程序对应的第二小程序产生的第二数据;所述第一小程序是患者用户帐号登录的小程序,所述第二小程序是医生用户帐号登录的小程序,所述第一小程序和所述第二小程序是依赖同一客户端运行的不同小程序;
存储模块,用于将所述第一小程序产生的所述第一数据和所述第二小程序产生的所述第二数据存储在同一数据仓库中;
分析模块,用于对所述数据仓库中存储的医疗数据进行分析,得到所述患者用户帐号对应的病症类别下的各病症组对应的关键词;所述医疗数据包括所述患者用户帐号和所述医生用户帐号的问诊会话信息,所述问诊会话信息是根据所述第一数据和所述第二数据确定的。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行以实现如权利要求1至12任一所述的医疗数据的分析方法。
15.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现如权利要求1至12任一所述的医疗数据的分析方法。
16.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行如权利要求1至12任一所述的医疗数据的分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310269558.9A CN116959733A (zh) | 2023-03-08 | 2023-03-08 | 医疗数据的分析方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310269558.9A CN116959733A (zh) | 2023-03-08 | 2023-03-08 | 医疗数据的分析方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116959733A true CN116959733A (zh) | 2023-10-27 |
Family
ID=88441666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310269558.9A Pending CN116959733A (zh) | 2023-03-08 | 2023-03-08 | 医疗数据的分析方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116959733A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117275752A (zh) * | 2023-11-20 | 2023-12-22 | 中国人民解放军总医院 | 基于机器学习的病例聚类分析方法及*** |
-
2023
- 2023-03-08 CN CN202310269558.9A patent/CN116959733A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117275752A (zh) * | 2023-11-20 | 2023-12-22 | 中国人民解放军总医院 | 基于机器学习的病例聚类分析方法及*** |
CN117275752B (zh) * | 2023-11-20 | 2024-03-22 | 中国人民解放军总医院 | 基于机器学习的病例聚类分析方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230351102A1 (en) | Machine content generation | |
US20220165371A1 (en) | Systems and methods for mental health assessment | |
US20210110894A1 (en) | Systems and methods for mental health assessment | |
CN110033851B (zh) | 信息推荐方法、装置、存储介质及服务器 | |
JP2020170516A (ja) | 臨床クエリを生成するための予測システム | |
CN111105852B (zh) | 一种电子病历推荐方法、装置、终端及存储介质 | |
Al-Samarraay et al. | A new extension of FDOSM based on Pythagorean fuzzy environment for evaluating and benchmarking sign language recognition systems | |
CN113724848A (zh) | 基于人工智能的医疗资源推荐方法、装置、服务器及介质 | |
CN113257383B (zh) | 匹配信息确定方法、显示方法、装置、设备及存储介质 | |
EP4068113A1 (en) | Method for determining text similarity, method for obtaining semantic answer text, and question answering method | |
WO2022193973A1 (zh) | 图像处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
Yan et al. | Online doctor recommendation with convolutional neural network and sparse inputs | |
CN113569042A (zh) | 文本信息分类方法、装置、计算机设备及存储介质 | |
CN116959733A (zh) | 医疗数据的分析方法、装置、设备及存储介质 | |
CN113674856B (zh) | 基于人工智能的医学数据处理方法、装置、设备及介质 | |
CN113257412B (zh) | 信息处理方法、装置、计算机设备及存储介质 | |
CN114333997A (zh) | 数据处理、数据处理模型的训练方法、装置、设备及介质 | |
CN114330482A (zh) | 一种数据处理方法、装置及计算机可读存储介质 | |
CN114139546A (zh) | 使用语法树集合之间的差异和语义树集合之间的差异制定问题 | |
CN112163095A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN114510942A (zh) | 获取实体词的方法、模型的训练方法、装置及设备 | |
Liu et al. | Multi-type decision fusion network for visual Q&A | |
CN113762585B (zh) | 数据的处理方法、账号类型的识别方法及装置 | |
Rathi et al. | Personalized health framework for visually impaired | |
CN114328948A (zh) | 文本标准化模型的训练方法、文本标准化方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40099940 Country of ref document: HK |