CN116665922A - 一种医患通信方法及*** - Google Patents

一种医患通信方法及*** Download PDF

Info

Publication number
CN116665922A
CN116665922A CN202310949211.9A CN202310949211A CN116665922A CN 116665922 A CN116665922 A CN 116665922A CN 202310949211 A CN202310949211 A CN 202310949211A CN 116665922 A CN116665922 A CN 116665922A
Authority
CN
China
Prior art keywords
doctor
patient
data
category
accuracy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310949211.9A
Other languages
English (en)
Inventor
叶桄希
陈巧林
杨林
吕佳忆
王璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Tianfu Zhilian Health Technology Co ltd
Original Assignee
Sichuan Tianfu Zhilian Health Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Tianfu Zhilian Health Technology Co ltd filed Critical Sichuan Tianfu Zhilian Health Technology Co ltd
Priority to CN202310949211.9A priority Critical patent/CN116665922A/zh
Publication of CN116665922A publication Critical patent/CN116665922A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H80/00ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及医患通信领域,具体涉及一种医患通信方法及***,极大地提高了医患通信***的准确性与稳定性。本发明医患通信方法包括:采集患者的医学信息,所述医学信息包括患者的基本信息、病史记录、诊断结果以及治疗方案;对采集到的医学信息进行预处理操作,所述预处理操作包括清洗、去噪以及归一化;从预处理后的医学信息中提取出特定特征,所述特定特征包括患者的年龄、性别以及病情严重程度;利用朴素贝叶斯算法对提取出的特定特征进行训练,建立医患通信的预测模型;使用测试数据集对建立的医患通信的预测模型进行评估,以确定其预测准确率和稳定性;基于评估后的预测模型进行医患通信。本发明适用于医生与患者之间的通信交流。

Description

一种医患通信方法及***
技术领域
本发明涉及医患通信领域,具体涉及一种医患通信方法及***。
背景技术
传统的医患通信方式包括以下几种:
1.面对面交流:患者可以亲自到医院或诊所与医生进行面对面的交流,医生会根据患者的病情和症状进行诊断和建议。
2.电话咨询:患者可以通过电话向医生咨询自己的病情和症状,医生会根据电话中提供的信息进行初步的诊断和建议。
3.短信或邮件咨询:患者可以通过短信或邮件向医生咨询自己的病情和症状,医生会通过回复短信或邮件的方式进行沟通和指导。
4.在线问诊:患者可以通过互联网平台进行在线问诊,医生会通过文字、语音或视频等方式进行诊断和建议。
面对面交流可以更直接地了解患者的病情和症状,但需要患者前往医院或诊所,需要花费大量的时间,效率较低,极为不便利;电话咨询和短信/邮件咨询方便快捷,但患者可能无法准确描述,医生可能无法全面了解患者的病情,通信交流的准确率较低;在线问诊可以节省时间和成本,但需要患者具备一定的网络技能和设备,医生也只能根据患者的描述进行单方面诊断,给出患者建议,其效率低下,准确率也不高。
现有技术中,如CN105812376A公开的一种应用strophe构建的医患多方即时通信***,其客户端程序启动后,底层通信模块就启动监听。通过协议解析模块转换为strophe协议格式到的数据包,经过底层通信协议将请求新发送到通信服务器端进行处理。即时通信***平台为即时通讯***提供了多种功能接口,方便客户端需求,客户端根据自己需求来进行相应功能的扩展。
该方案的实施例提供基于strophe的即时交流消息技术,通讯过程中应用strophe构建的医患多方即时通信机制管理机制,可以大幅度提高消息的更新的成功率。提高医患通信的效率,但其医患通信的准确性与稳定性较差。
发明内容
本发明的目的是提供一种医患通信方法,极大地提高了医患通信***的准确性与稳定性,同时保障了医患通信的效率。
本发明采取如下技术方案实现上述目的,一种医患通信方法,所述医患通信方法包括:
步骤1、采集患者的医学信息,所述医学信息包括患者的基本信息、病史记录、诊断结果以及治疗方案;
步骤2、对采集到的医学信息进行预处理操作,所述预处理操作包括清洗、去噪以及归一化;
步骤3、从预处理后的医学信息中提取出特定特征,所述特定特征包括患者的年龄、性别以及病情严重程度;
步骤4、利用朴素贝叶斯算法对提取出的特定特征进行训练,建立医患通信的预测模型;
步骤5、使用测试数据集对建立的医患通信的预测模型进行评估,以确定其预测准确率和稳定性;
步骤6、基于评估后的预测模型进行医患通信,具体包括:将患者的输入信息作为评估后的预测模型的输入,评估后的预测模型的输出信息呈现给医生,医生根据该输出信息回复患者。
进一步的是,步骤2具体包括:
步骤201、在数据清洗阶段,去除重复数据、缺失数据和异常值,具体包括:使用Python中的pandas库中的drop_duplicates函数去除重复数据,使用fillna函数填充缺失值,使用outliers函数检测异常值并进行处理;
步骤202、在数据去噪阶段,去除信号中的噪声和干扰,具体包括:使用Python中的scipy库中的signal模块来进行数据首次去噪;使用medfilt函数进行中位数滤波以及使用lfilter函数进行低通滤波,通过中位数滤波以及低通滤波进行二次去噪以及去除干扰;
步骤203、在数据归一化阶段,将不同特征的数据范围缩放到相同的范围内,具体包括:使用Python中的sklearn库中的MinMaxScaler类进行数据归一化处理,归一化处理方法包括将每个特征的数据减去最小值,然后除以最大值,以将数据范围缩放到0到1之间。
通过在数据清洗阶段,去除重复数据、缺失数据和异常值,在数据去噪阶段,去除信号中的噪声和干扰,在数据归一化阶段,将不同特征的数据范围缩放到相同的范围内,极大地提高了数据质量,统一了数据格式,减少后续分析难度,提高了后续建模的效率。
进一步的是,从预处理后的医学信息中提取出特定特征具体包括:
数据归一化处理完成后,使用Python中的scikit-learn库中的SelectKBest类进行特征选择,选择最佳的前k个特征,并计算它们与目标变量之间的相关系数或信息增益指标,以确定哪些特征是最重要的,将最重要的特征作为特定特征,k为大于0的整数。通过该方案提高了特征提取的准确率。
进一步的是,利用朴素贝叶斯算法对提取出的特定特征进行训练具体包括:
步骤401、将提取出的特定特征划分为训练集与验证集,并确定训练集中样本的数量和类别数;
步骤402、对于每个类别,根据历史数据计算其先验概率分布,并根据其特征和类别信息,使用贝叶斯定理计算其属于各个类别的后验概率分布,计算公式如下:
,其中,yi表示样本的类别,xi表示样本的特征,P(xi|yi)表示在给定的yi下,特征xi出现的概率,P(yi)表示类别yi的先验概率,P(xi)表示样本特征xi在训练集中出现的概率,P(yi|xi)表示后验概率分布;
步骤403、根据计算得到的后验概率分布建立分类器来进行预测,具体包括将每个类别的后验概率作为该类别的权重,将所有样本的特征加权求和后,再通过softmax函数将结果映射到0到1之间,即可得到样本属于各个类别的概率,最终,选择概率最大的类别作为预测结果。
通过上述训练过程,对于一些具有多个特征的数据集,可以有效地减少特征数量,提高模型的效率和准确性,对于某些类别的样本数量较少的情况,可以通过加权等方法来平衡数据集。
进一步的是,使用测试数据集对建立的医患通信的预测模型进行评估具体包括:
步骤501、将测试数据集中的每个样本输入到预测模型中,并计算预测模型对该样本属于各个类别的概率,选择概率最大的类别作为该样本的第一预测结果,以及选择概率最小的类别作为该样本的第二预测结果;
步骤502、将预测模型在测试数据集上的第一预测结果及第二预测结果分别与真实标签进行比较,计算预测模型在测试数据集上的准确率,得到对应的第一准确率与第二准确率;
步骤503、将第一准确率乘以第一权重,得到第一准确率比较参考值;将第二准确率乘以第二权重,得到第二准确率比较参考值;所述第一权重为概率最大的类别的权重,所述第二权重为概率最小的类别的权重;
步骤504、将第一准确率比较参考值与第二准确率比较参考值做差,将差值与设置的阈值范围进行比较,若差值在设置的阈值范围内,则判断预测模型的准确性在合理范围。
通过上述评估过程,能够提高评估过程的准确性。通过使用测试数据集,可以验证模型在未知数据上的泛化能力,即模型是否能够正确地预测新的数据。
一种医患通信***,所述医患通信***包括:
数据采集模块,用于采集患者的医学信息,所述医学信息包括患者的基本信息、病史记录、诊断结果以及治疗方案;
数据预处理模块,用于对采集到的医学信息进行预处理操作,所述预处理操作包括清洗、去噪以及归一化;
特征提取模块,用于从预处理后的医学信息中提取出特定特征,所述特定特征包括患者的年龄、性别以及病情严重程度;
模型训练模块,用于利用朴素贝叶斯算法对提取出的特定特征进行训练,建立医患通信的预测模型;
模型评估模块,用于使用测试数据集对建立的医患通信的预测模型进行评估,以确定其预测准确率和稳定性;
通信模块,用于基于评估后的预测模型进行医患通信,具体包括:将患者的输入信息作为评估后的预测模型的输入,评估后的预测模型的输出信息呈现给医生,医生根据该输出信息回复患者。
进一步的是,数据预处理模块具体用于,在数据清洗阶段,去除重复数据、缺失数据和异常值,具体包括:使用Python中的pandas库中的drop_duplicates函数去除重复数据,使用fillna函数填充缺失值,使用outliers函数检测异常值并进行处理;
在数据去噪阶段,去除信号中的噪声和干扰,具体包括:使用Python中的scipy库中的signal模块来进行数据首次去噪;使用medfilt函数进行中位数滤波以及使用lfilter函数进行低通滤波,通过中位数滤波以及低通滤波进行二次去噪以及去除干扰;
在数据归一化阶段,将不同特征的数据范围缩放到相同的范围内,具体包括:使用Python中的sklearn库中的MinMaxScaler类进行数据归一化处理,归一化处理方法包括将每个特征的数据减去最小值,然后除以最大值,以将数据范围缩放到0到1之间。
进一步的是,特征提取模块具体用于,数据归一化处理完成后,使用Python中的scikit-learn库中的SelectKBest类进行特征选择,选择最佳的前k个特征,并计算它们与目标变量之间的相关系数或信息增益指标,以确定哪些特征是最重要的,将最重要的特征作为特定特征,k为大于0的整数。
进一步的是,模型训练模块具体用于,将提取出的特定特征划分为训练集与验证集,并确定训练集中样本的数量和类别数;
对于每个类别,根据历史数据计算其先验概率分布,并根据其特征和类别信息,使用贝叶斯定理计算其属于各个类别的后验概率分布,计算公式如下:
,其中,yi表示样本的类别,xi表示样本的特征,P(xi|yi)表示在给定的yi下,特征xi出现的概率,P(yi)表示类别yi的先验概率,P(xi)表示样本特征xi在训练集中出现的概率,P(yi|xi)表示后验概率分布;
根据计算得到的后验概率分布建立分类器来进行预测,具体包括将每个类别的后验概率作为该类别的权重,将所有样本的特征加权求和后,再通过softmax函数将结果映射到0到1之间,即可得到样本属于各个类别的概率,最终,选择概率最大的类别作为预测结果。
进一步的是,模型评估模块具体用于,将测试数据集中的每个样本输入到预测模型中,并计算预测模型对该样本属于各个类别的概率,选择概率最大的类别作为该样本的第一预测结果,以及选择概率最小的类别作为该样本的第二预测结果;
将预测模型在测试数据集上的第一预测结果及第二预测结果分别与真实标签进行比较,计算预测模型在测试数据集上的准确率,得到对应的第一准确率与第二准确率;
将第一准确率乘以第一权重,得到第一准确率比较参考值;将第二准确率乘以第二权重,得到第二准确率比较参考值;所述第一权重为概率最大的类别的权重,所述第二权重为概率最小的类别的权重;
将第一准确率比较参考值与第二准确率比较参考值做差,将差值与设置的阈值范围进行比较,若差值在设置的阈值范围内,则判断预测模型的准确性在合理范围。
本发明的有益效果为:
本发明基于朴素贝叶斯的医患通信可以实现快速的自动分类和预测,节省了医生的时间和精力。
本发明朴素贝叶斯算法假设样本数据服从高斯分布,能够有效地处理不平衡的数据集,并且具有较高的准确性和稳定性。
本发明基于朴素贝叶斯的医患通信可以方便地进行模型训练和应用扩展,支持大规模数据的处理和分析。
本发明基于朴素贝叶斯的医患通信可以实现自动化的分类和预测,减少了人工干预的需求,提高了医患通信效率和准确性。
附图说明
图1 为本发明实施例提供的一种医患通信方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种医患通信方法,如图1所示,包括:
S1、采集患者的医学信息
其中,医学信息包括患者的基本信息、病史记录、诊断结果以及治疗方案。
在本发明的一种实施例中,采集患者的医学信息的方式包括:
确定采集的信息类型:根据医患通信的目的和范围,确定需要采集哪些类型的医学信息,例如基本信息、病史、诊断结果、治疗方案等。
收集患者基本信息:包括姓名、性别、年龄、联系方式等。这些信息可以通过患者填写的表格、医生询问等方式获取。
收集患者的病史:通过询问患者或查看病历记录等方式,收集患者的既往病史、家族病史、过敏史等。
确认患者的诊断结果:如果患者已经接受了医院或诊所的检查和诊断,可以向医生或医疗机构查询患者的诊断结果。
收集患者的治疗方案:如果患者已经开始接受治疗,可以向医生或医疗机构收集患者的治疗方案、用药情况等。
记录患者的症状和反馈:在医患沟通中,医生可能会询问患者的症状和反馈,这些信息可以帮助医生更好地了解患者的病情和治疗效果。
S2、对采集到的医学信息进行预处理操作
其中,预处理操作包括清洗、去噪以及归一化等方式。
在本发明的一种实施例中,对采集到的医学信息进行清洗、去噪以及归一化的具体方法包括:
步骤201、在数据清洗阶段,去除重复数据、缺失数据和异常值,具体包括:使用Python中的pandas库中的drop_duplicates函数去除重复数据,使用fillna函数填充缺失值,使用outliers函数检测异常值并进行处理;
步骤202、在数据去噪阶段,去除信号中的噪声和干扰,具体包括:使用Python中的scipy库中的signal模块来进行数据首次去噪;使用medfilt函数进行中位数滤波以及使用lfilter函数进行低通滤波,通过中位数滤波以及低通滤波进行二次去噪以及去除干扰;
步骤203、在数据归一化阶段,将不同特征的数据范围缩放到相同的范围内,具体包括:使用Python中的sklearn库中的MinMaxScaler类进行数据归一化处理,归一化处理方法包括将每个特征的数据减去最小值,然后除以最大值,以将数据范围缩放到0到1之间。
S3、从预处理后的医学信息中提取出特定特征
其中,特定特征可以包括患者的年龄、性别以及病情严重程度等。
在本发明的一种实施例中,从预处理后的医学信息中提取出特定特征方法具体包括:
数据归一化处理完成后,使用Python中的scikit-learn库中的SelectKBest类进行特征选择,选择最佳的前k个特征,并计算它们与目标变量之间的相关系数或信息增益指标,以确定哪些特征是最重要的,将最重要的特征作为特定特征,k为大于0的整数。
S4、利用朴素贝叶斯算法对提取出的特定特征进行训练,建立医患通信的预测模型
在本发明的一种实施例中,利用朴素贝叶斯算法对提取出的特定特征进行训练的方法具体包括:
步骤401、将提取出的特定特征划分为训练集与验证集,并确定训练集中样本的数量和类别数;
步骤402、对于每个类别,根据历史数据计算其先验概率分布,并根据其特征和类别信息,使用贝叶斯定理计算其属于各个类别的后验概率分布,计算公式如下:
,其中,yi表示样本的类别,xi表示样本的特征,P(xi|yi)表示在给定的yi下,特征xi出现的概率,P(yi)表示类别yi的先验概率,P(xi)表示样本特征xi在训练集中出现的概率,P(yi|xi)表示后验概率分布;
步骤403、根据计算得到的后验概率分布建立分类器来进行预测,具体包括将每个类别的后验概率作为该类别的权重,将所有样本的特征加权求和后,再通过softmax函数将结果映射到0到1之间,即可得到样本属于各个类别的概率,最终,选择概率最大的类别作为预测结果。
S5、使用测试数据集对建立的医患通信的预测模型进行评估
评估的目的是为了确定预测模型的准确性与稳定性。
在本发明的一种实施例中,使用测试数据集对建立的医患通信的预测模型进行准确性评估,可以采用如下方式:
步骤502、将预测模型在测试数据集上的第一预测结果及第二预测结果分别与真实标签进行比较,计算预测模型在测试数据集上的准确率,得到对应的第一准确率与第二准确率;
步骤503、将第一准确率乘以第一权重,得到第一准确率比较参考值;将第二准确率乘以第二权重,得到第二准确率比较参考值;所述第一权重为概率最大的类别的权重,所述第二权重为概率最小的类别的权重;
步骤504、将第一准确率比较参考值与第二准确率比较参考值做差,将差值与设置的阈值范围进行比较,若差值在设置的阈值范围内,则判断预测模型的准确性在合理范围。
本实施例中,真实标签指的是与测试数据对应的正确答案或者目标值,也称为真实值或真实标签。在机器学习中,使用真实标签来评估模型的性能和准确度,并根据评估结果对模型进行优化和改进。
在本发明的一种实施例中,使用测试数据集对建立的医患通信的预测模型进行稳定性评估,可以采用如下方式:
将预测结果与真实标签进行比较,计算出每个样本的平均绝对误差。平均绝对误差可以反映模型在预测过程中的波动情况,越小的平均绝对误差表示模型的预测稳定性越好。
还可以通过绘制ROC曲线,可以比较不同阈值下模型的性能,从而确定模型的预测稳定性。
S6、基于评估后的预测模型进行医患通信
医患通信过程中,将患者的输入信息作为评估后的预测模型的输入,评估后的预测模型的输出信息呈现给医生,医生根据该输出信息回复患者。
例如,患者输入姓名,年龄,感冒症状的初步描述后,评估后的预测模型对应输出患者之前得过感冒的症状、治疗方案、药物过敏等相关信息呈现给医生,医生对呈现的信息进行综合分析,根据分析结果与患者进行通信交流,极大地节省了医生的工作时间,提高了通信的效率以及准确性。
本发明还提供了一种医患通信***,用于实现本发明实施例记载的医患通信方法,该医患通信包括:
数据采集模块,用于采集患者的医学信息,所述医学信息包括患者的基本信息、病史记录、诊断结果以及治疗方案;
数据预处理模块,用于对采集到的医学信息进行预处理操作,所述预处理操作包括清洗、去噪以及归一化;
特征提取模块,用于从预处理后的医学信息中提取出特定特征,所述特定特征包括患者的年龄、性别以及病情严重程度;
模型训练模块,用于利用朴素贝叶斯算法对提取出的特定特征进行训练,建立医患通信的预测模型;
模型评估模块,用于使用测试数据集对建立的医患通信的预测模型进行评估,以确定其预测准确率和稳定性;
通信模块,用于基于评估后的预测模型进行医患通信,具体包括:将患者的输入信息作为评估后的预测模型的输入,评估后的预测模型的输出信息呈现给医生,医生根据该输出信息回复患者。
在本发明的一种实施例中,数据预处理模块具体用于,在数据清洗阶段,去除重复数据、缺失数据和异常值,具体包括:使用Python中的pandas库中的drop_duplicates函数去除重复数据,使用fillna函数填充缺失值,使用outliers函数检测异常值并进行处理;
在数据去噪阶段,去除信号中的噪声和干扰,具体包括:使用Python中的scipy库中的signal模块来进行数据首次去噪;使用medfilt函数进行中位数滤波以及使用lfilter函数进行低通滤波,通过中位数滤波以及低通滤波进行二次去噪以及去除干扰;
在数据归一化阶段,将不同特征的数据范围缩放到相同的范围内,具体包括:使用Python中的sklearn库中的MinMaxScaler类进行数据归一化处理,归一化处理方法包括将每个特征的数据减去最小值,然后除以最大值,以将数据范围缩放到0到1之间。
在本发明的一种实施例中,特征提取模块具体用于,数据归一化处理完成后,使用Python中的scikit-learn库中的SelectKBest类进行特征选择,选择最佳的前k个特征,并计算它们与目标变量之间的相关系数或信息增益指标,以确定哪些特征是最重要的,将最重要的特征作为特定特征,k为大于0的整数。
在本发明的一种实施例中,模型训练模块具体用于,将提取出的特定特征划分为训练集与验证集,并确定训练集中样本的数量和类别数;
对于每个类别,根据历史数据计算其先验概率分布,并根据其特征和类别信息,使用贝叶斯定理计算其属于各个类别的后验概率分布,计算公式如下:
,其中,yi表示样本的类别,xi表示样本的特征,P(xi|yi)表示在给定的yi下,特征xi出现的概率,P(yi)表示类别yi的先验概率,P(xi)表示样本特征xi在训练集中出现的概率,P(yi|xi)表示后验概率分布;
根据计算得到的后验概率分布建立分类器来进行预测,具体包括将每个类别的后验概率作为该类别的权重,将所有样本的特征加权求和后,再通过softmax函数将结果映射到0到1之间,即可得到样本属于各个类别的概率,最终,选择概率最大的类别作为预测结果。
在本发明的一种实施例中,模型评估模块具体用于,将测试数据集中的每个样本输入到预测模型中,并计算预测模型对该样本属于各个类别的概率,选择概率最大的类别作为该样本的第一预测结果,以及选择概率最小的类别作为该样本的第二预测结果;
将预测模型在测试数据集上的第一预测结果及第二预测结果分别与真实标签进行比较,计算预测模型在测试数据集上的准确率,得到对应的第一准确率与第二准确率;
将第一准确率乘以第一权重,得到第一准确率比较参考值;将第二准确率乘以第二权重,得到第二准确率比较参考值;所述第一权重为概率最大的类别的权重,所述第二权重为概率最小的类别的权重;
将第一准确率比较参考值与第二准确率比较参考值做差,将差值与设置的阈值范围进行比较,若差值在设置的阈值范围内,则判断预测模型的准确性在合理范围。
综上所述,本发明极大地提高了医患通信***的准确性与稳定性,同时保障了医患通信的效率。

Claims (10)

1.一种医患通信方法,其特征在于,所述医患通信方法包括:
步骤1、采集患者的医学信息,所述医学信息包括患者的基本信息、病史记录、诊断结果以及治疗方案;
步骤2、对采集到的医学信息进行预处理操作,所述预处理操作包括清洗、去噪以及归一化;
步骤3、从预处理后的医学信息中提取出特定特征,所述特定特征包括患者的年龄、性别以及病情严重程度;
步骤4、利用朴素贝叶斯算法对提取出的特定特征进行训练,建立医患通信的预测模型;
步骤5、使用测试数据集对建立的医患通信的预测模型进行评估,以确定其预测准确率和稳定性;
步骤6、基于评估后的预测模型进行医患通信,具体包括:将患者的输入信息作为评估后的预测模型的输入,评估后的预测模型的输出信息呈现给医生,医生根据该输出信息回复患者。
2.根据权利要求1所述的医患通信方法,其特征在于,步骤2具体包括:
步骤201、在数据清洗阶段,去除重复数据、缺失数据和异常值,具体包括:使用Python中的pandas库中的drop_duplicates函数去除重复数据,使用fillna函数填充缺失值,使用outliers函数检测异常值并进行处理;
步骤202、在数据去噪阶段,去除信号中的噪声和干扰,具体包括:使用Python中的scipy库中的signal模块来进行数据首次去噪;使用medfilt函数进行中位数滤波以及使用lfilter函数进行低通滤波,通过中位数滤波以及低通滤波进行二次去噪以及去除干扰;
步骤203、在数据归一化阶段,将不同特征的数据范围缩放到相同的范围内,具体包括:使用Python中的sklearn库中的MinMaxScaler类进行数据归一化处理,归一化处理方法包括将每个特征的数据减去最小值,然后除以最大值,以将数据范围缩放到0到1之间。
3.根据权利要求2所述的医患通信方法,其特征在于,从预处理后的医学信息中提取出特定特征具体包括:
数据归一化处理完成后,使用Python中的scikit-learn库中的SelectKBest类进行特征选择,选择最佳的前k个特征,并计算它们与目标变量之间的相关系数或信息增益指标,以确定哪些特征是最重要的,将最重要的特征作为特定特征,k为大于0的整数。
4.根据权利要求1所述的医患通信方法,其特征在于,利用朴素贝叶斯算法对提取出的特定特征进行训练具体包括:
步骤401、将提取出的特定特征划分为训练集与验证集,并确定训练集中样本的数量和类别数;
步骤402、对于每个类别,根据历史数据计算其先验概率分布,并根据其特征和类别信息,使用贝叶斯定理计算其属于各个类别的后验概率分布,计算公式如下:
,其中,yi表示样本的类别,xi表示样本的特征,P(xi|yi)表示在给定的yi下,特征xi出现的概率,P(yi)表示类别yi的先验概率,P(xi)表示样本特征xi在训练集中出现的概率,P(yi|xi)表示后验概率分布;
步骤403、根据计算得到的后验概率分布建立分类器来进行预测,具体包括将每个类别的后验概率作为该类别的权重,将所有样本的特征加权求和后,再通过softmax函数将结果映射到0到1之间,即可得到样本属于各个类别的概率,最终,选择概率最大的类别作为预测结果。
5.根据权利要求1所述的医患通信方法,其特征在于,使用测试数据集对建立的医患通信的预测模型进行评估具体包括:
步骤501、将测试数据集中的每个样本输入到预测模型中,并计算预测模型对该样本属于各个类别的概率,选择概率最大的类别作为该样本的第一预测结果,以及选择概率最小的类别作为该样本的第二预测结果;
步骤502、将预测模型在测试数据集上的第一预测结果及第二预测结果分别与真实标签进行比较,计算预测模型在测试数据集上的准确率,得到对应的第一准确率与第二准确率;
步骤503、将第一准确率乘以第一权重,得到第一准确率比较参考值;将第二准确率乘以第二权重,得到第二准确率比较参考值;所述第一权重为概率最大的类别的权重,所述第二权重为概率最小的类别的权重;
步骤504、将第一准确率比较参考值与第二准确率比较参考值做差,将差值与设置的阈值范围进行比较,若差值在设置的阈值范围内,则判断预测模型的准确性在合理范围。
6.一种医患通信***,用于实现如权利要求1-5任意一项所述的医患通信方法,其特征在于,所述医患通信***包括:
数据采集模块,用于采集患者的医学信息,所述医学信息包括患者的基本信息、病史记录、诊断结果以及治疗方案;
数据预处理模块,用于对采集到的医学信息进行预处理操作,所述预处理操作包括清洗、去噪以及归一化;
特征提取模块,用于从预处理后的医学信息中提取出特定特征,所述特定特征包括患者的年龄、性别以及病情严重程度;
模型训练模块,用于利用朴素贝叶斯算法对提取出的特定特征进行训练,建立医患通信的预测模型;
模型评估模块,用于使用测试数据集对建立的医患通信的预测模型进行评估,以确定其预测准确率和稳定性;
通信模块,用于基于评估后的预测模型进行医患通信,具体包括:将患者的输入信息作为评估后的预测模型的输入,评估后的预测模型的输出信息呈现给医生,医生根据该输出信息回复患者。
7.根据权利要求6所述的医患通信***,其特征在于,数据预处理模块具体用于,在数据清洗阶段,去除重复数据、缺失数据和异常值,具体包括:使用Python中的pandas库中的drop_duplicates函数去除重复数据,使用fillna函数填充缺失值,使用outliers函数检测异常值并进行处理;
在数据去噪阶段,去除信号中的噪声和干扰,具体包括:使用Python中的scipy库中的signal模块来进行数据首次去噪;使用medfilt函数进行中位数滤波以及使用lfilter函数进行低通滤波,通过中位数滤波以及低通滤波进行二次去噪以及去除干扰;
在数据归一化阶段,将不同特征的数据范围缩放到相同的范围内,具体包括:使用Python中的sklearn库中的MinMaxScaler类进行数据归一化处理,归一化处理方法包括将每个特征的数据减去最小值,然后除以最大值,以将数据范围缩放到0到1之间。
8.根据权利要求7所述的医患通信***,其特征在于,特征提取模块具体用于,数据归一化处理完成后,使用Python中的scikit-learn库中的SelectKBest类进行特征选择,选择最佳的前k个特征,并计算它们与目标变量之间的相关系数或信息增益指标,以确定哪些特征是最重要的,将最重要的特征作为特定特征,k为大于0的整数。
9.根据权利要求6所述的医患通信***,其特征在于,模型训练模块具体用于,将提取出的特定特征划分为训练集与验证集,并确定训练集中样本的数量和类别数;
对于每个类别,根据历史数据计算其先验概率分布,并根据其特征和类别信息,使用贝叶斯定理计算其属于各个类别的后验概率分布,计算公式如下:
,其中yi表示样本的类别,xi表示样本的特征,P(xi|yi)表示在给定的yi下,特征xi出现的概率,P(yi)表示类别yi的先验概率,P(xi)表示样本特征xi在训练集中出现的概率,P(yi|xi)表示后验概率分布;
根据计算得到的后验概率分布建立分类器来进行预测,具体包括将每个类别的后验概率作为该类别的权重,将所有样本的特征加权求和后,再通过softmax函数将结果映射到0到1之间,即可得到样本属于各个类别的概率,最终,选择概率最大的类别作为预测结果。
10.根据权利要求6所述的医患通信***,其特征在于,模型评估模块具体用于,将测试数据集中的每个样本输入到预测模型中,并计算预测模型对该样本属于各个类别的概率,选择概率最大的类别作为该样本的第一预测结果,以及选择概率最小的类别作为该样本的第二预测结果;
将预测模型在测试数据集上的第一预测结果及第二预测结果分别与真实标签进行比较,计算预测模型在测试数据集上的准确率,得到对应的第一准确率与第二准确率;
将第一准确率乘以第一权重,得到第一准确率比较参考值;将第二准确率乘以第二权重,得到第二准确率比较参考值;所述第一权重为概率最大的类别的权重,所述第二权重为概率最小的类别的权重;
将第一准确率比较参考值与第二准确率比较参考值做差,将差值与设置的阈值范围进行比较,若差值在设置的阈值范围内,则判断预测模型的准确性在合理范围。
CN202310949211.9A 2023-07-31 2023-07-31 一种医患通信方法及*** Pending CN116665922A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310949211.9A CN116665922A (zh) 2023-07-31 2023-07-31 一种医患通信方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310949211.9A CN116665922A (zh) 2023-07-31 2023-07-31 一种医患通信方法及***

Publications (1)

Publication Number Publication Date
CN116665922A true CN116665922A (zh) 2023-08-29

Family

ID=87722822

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310949211.9A Pending CN116665922A (zh) 2023-07-31 2023-07-31 一种医患通信方法及***

Country Status (1)

Country Link
CN (1) CN116665922A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304887A (zh) * 2018-02-28 2018-07-20 云南大学 基于少数类样本合成的朴素贝叶斯数据处理***及方法
CN109036568A (zh) * 2018-09-03 2018-12-18 浪潮软件集团有限公司 一种基于朴素贝叶斯算法的预测模型的建立方法
CN114093445A (zh) * 2021-11-18 2022-02-25 重庆邮电大学 一种基于偏多标记学习的患者筛选标记方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304887A (zh) * 2018-02-28 2018-07-20 云南大学 基于少数类样本合成的朴素贝叶斯数据处理***及方法
CN109036568A (zh) * 2018-09-03 2018-12-18 浪潮软件集团有限公司 一种基于朴素贝叶斯算法的预测模型的建立方法
CN114093445A (zh) * 2021-11-18 2022-02-25 重庆邮电大学 一种基于偏多标记学习的患者筛选标记方法

Similar Documents

Publication Publication Date Title
CN117253614B (zh) 基于大数据分析的糖尿病风险预警方法
CN114639479A (zh) 一种基于医疗知识图谱的智能诊断辅助***
CN110634566A (zh) 一种中医临床诊断数据处理***及方法、信息数据处理终端
CN112967803A (zh) 基于集成模型的急诊患者早期死亡率预测方法及***
CN112786203A (zh) 一种机器学习糖尿病视网膜病变发病风险预测方法及应用
CN111956214A (zh) 基于U-net端对端神经网络模型的QRS波自动检测方法
CN111370124A (zh) 一种基于面手部识别和大数据的健康分析***及方法
CN114582496A (zh) 一种常见妇科疾病预测模型构建方法和预测***
CN117457192A (zh) 智能远程诊断方法及***
CN116013511B (zh) 基于知识图谱的糖尿病干预智能推荐方法及***
CN116578845B (zh) 一种批量标识数据学习的风险识别方法及***
CN116665922A (zh) 一种医患通信方法及***
CN116453694A (zh) 基于有放回欠采样集成框架的疾病风险预测方法及***
CN116564521A (zh) 一种慢性病风险评估模型建立方法、介质及***
CN115376692A (zh) 一种健康数据的处理方法、装置、电子设备及存储介质
CN116167008A (zh) 基于数据增强的物联感知云数据中心异常定位方法
CN113889274B (zh) 一种孤独症谱系障碍的风险预测模型构建方法及装置
CN113436027B (zh) 医保报销异常数据检测方法及***
CN114550930A (zh) 疾病预测方法、装置、设备及存储介质
Nandhini et al. Random forest and genetic algorithm united with hyperparameter for diabetes prediction by using WBSMOTE, wrapper approach
CN111297348A (zh) 心电图分析结果的生成方法、心电图机及存储介质
AU2021102832A4 (en) System & method for automatic health prediction using fuzzy based machine learning
CN117649933B (zh) 在线问诊辅助方法、装置、电子设备和存储介质
Meriwani Enhancing Deep Neural Network Perforamnce on Small Datasets by the using Deep Autoencoder
CN116070120B (zh) 一种多标签时序电生理信号的自动识别方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230829