CN118053602B - 基于智慧病房呼叫***的数据处理方法及数据处理*** - Google Patents

基于智慧病房呼叫***的数据处理方法及数据处理*** Download PDF

Info

Publication number
CN118053602B
CN118053602B CN202410451964.1A CN202410451964A CN118053602B CN 118053602 B CN118053602 B CN 118053602B CN 202410451964 A CN202410451964 A CN 202410451964A CN 118053602 B CN118053602 B CN 118053602B
Authority
CN
China
Prior art keywords
monitoring
monitoring level
algorithm
uncertain
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410451964.1A
Other languages
English (en)
Other versions
CN118053602A (zh
Inventor
高雅
关欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xuanwu Hospital
Original Assignee
Xuanwu Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xuanwu Hospital filed Critical Xuanwu Hospital
Priority to CN202410451964.1A priority Critical patent/CN118053602B/zh
Publication of CN118053602A publication Critical patent/CN118053602A/zh
Application granted granted Critical
Publication of CN118053602B publication Critical patent/CN118053602B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本申请提供一种基于智慧病房呼叫***的数据处理方法及数据处理***,通过训练好的算法进行智慧病房中的患者的监测级别,能实现针对不同严重程度的病患的自动化监测决策,实时性和精确性高。在训练监测级别确定算法时,使不适于参加训练的日志学习样例产生的干扰得到降低。此外,缓解各监测级别不确定的日志学习样例的训练监督信息中的干扰。因各监测级别不确定的日志学习样例的训练监督信息中的干扰和不适于参加训练的样例的干扰得到压制,第一监测级别确定子算法的级别确定能力增强。依据第一监测级别确定子算法得到患者监测级别确定算法,由于第一监测级别确定子算法的级别确定效果达到目标,则患者监测级别确定算法的级别确定效果达到目标。

Description

基于智慧病房呼叫***的数据处理方法及数据处理***
技术领域
本申请涉及医疗数据处理领域,具体而言,涉及一种基于智慧病房呼叫***的数据处理方法及数据处理***。
背景技术
随着医疗技术的不断进步和智能化医疗***的日益发展,智慧病房作为现代医疗体系的重要组成部分,越来越受到广泛关注。在智慧病房中,对患者的实时监测和及时呼叫响应是确保医疗质量和患者安全的关键环节。传统的病房监测***往往依赖于医护人员的手动操作和定期巡查,这种方式不仅效率低下,而且难以及时准确地掌握患者的病情变化。
为了解决这一问题,近年来,基于机器学习和人工智能技术的智慧病房呼叫***逐渐兴起。这类***通过自动收集和分析患者的生理数据、行为数据等,旨在实现对患者监测级别的自动化判断,并根据判断结果提供相应的医疗服务和响应。然而,在实际应用中,由于患者病情的复杂性和多样性,以及数据收集和处理过程中的不确定性,现有的智慧病房呼叫***在监测级别的判断上仍存在较大的挑战。现有的***往往难以准确区分不同严重程度的病患,导致监测决策的实时性和精确性受到影响。此外,在训练监测级别确定算法时,现有的***通常未能充分利用监测级别不确定的日志学习样例,导致算法的训练效果不佳,进一步影响了监测级别的判断准确性。
发明内容
本发明的目的在于提供一种基于智慧病房呼叫***的数据处理方法及数据处理***。本申请实施例是这样实现的:
第一方面,本申请实施例提供了一种基于智慧病房呼叫***的数据处理方法,所述方法包括:获取健康监测日志,所述健康监测日志包括针对目标患者在目标监测周期内获取获得的健康数据和呼叫***触发数据;调用患者监测级别确定算法对所述健康监测日志进行监测级别确定,得到对应的目标患者的监测级别;所述患者监测级别确定算法通过日志学习样例库训练得到,所述日志学习样例库包括监测级别确定的日志学习样例库和监测级别不确定的日志学习样例库,所述患者监测级别确定算法的训练过程包括:将各个监测级别确定的日志学习样例的训练监督信息标注为真例,各个监测级别不确定的日志学习样例的训练监督信息标注为假例,通过各个日志学习样例的训练监督信息,以所述日志学习样例库为一个训练组对所述患者监测级别确定算法进行分组训练,得到第一监测级别确定子算法和所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,并得到第二监测级别确定子算法和所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,其中,所述第一监测级别确定子算法为历经M个分组训练获得的,所述第二监测级别确定子算法为历经N个分组训练获得的,所述M不等于N,并在所述分组训练中依据所述日志学习样例库的级别确定误差修正所述患者监测级别确定算法的算法参数;依据所述第一监测级别确定子算法和所述第二监测级别确定子算法分别针对所述监测级别不确定的日志学习样例库中各个监测级别不确定的日志学习样例预估的监测级别倾向值间的误差计算所述各个监测级别不确定的日志学习样例的未决系数;依据所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值修正所述各个监测级别不确定的日志学习样例的训练监督信息;通过各个监测级别不确定的日志学习样例的未决系数和修正后的训练监督信息,以所述监测级别不确定的日志学习样例库为一个训练组对所述第一监测级别确定子算法进行分组训练,得到训练后的第一监测级别确定子算法;通过所述训练后的第一监测级别确定子算法的算法参数,确定所述患者监测级别确定算法的算法参数。
可选地,所述依据所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值修正所述各个监测级别不确定的日志学习样例的训练监督信息,包括:对于所述监测级别不确定的日志学习样例库中的各个监测级别不确定的日志学习样例,如果所述第一监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值大于真例阈值,将所述监测级别不确定的日志学习样例的训练监督信息修正为真例;如果所述第一监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值不大于所述真例阈值,将所述监测级别不确定的日志学习样例的训练监督信息修正为假例。
可选地,所述通过各个监测级别不确定的日志学习样例的未决系数和修正后的训练监督信息,以所述监测级别不确定的日志学习样例库为一个训练组对所述第一监测级别确定子算法进行分组训练,包括:依据各个监测级别不确定的日志学习样例的未决系数确定各个监测级别不确定的日志学习样例的贡献度,所述贡献度与所述未决系数负相关;通过所述第一监测级别确定子算法确定各个监测级别不确定的日志学习样例的级别倾向值;依据各个监测级别不确定的日志学习样例的训练监督信息和级别倾向值确定各个监测级别不确定的级别确定误差;通过各个监测级别不确定的日志学习样例的级别确定误差和贡献度,确定所述监测级别不确定的日志学习样例库的级别确定误差;依据所述监测级别不确定的日志学习样例库的级别确定误差修正所述第一监测级别确定子算法的算法参数;如果所述第一监测级别确定子算法达到训练截止条件,则停止训练;如果所述第一监测级别确定子算法未达到训练截止条件,则重复通过所述第一监测级别确定子算法确定各个监测级别不确定的日志学习样例的监测级别,到依据所述监测级别不确定的日志学习样例库的级别确定误差修正所述第一监测级别确定子算法的算法参数的步骤。
可选地,各个监测级别不确定的日志学习样例的未决系数不小于0,所述依据各个监测级别不确定的日志学习样例的未决系数确定各个监测级别不确定的日志学习样例的贡献度,包括:将各个监测级别不确定的日志学习样例的未决系数除以第一设定值,得到相除结果;将所述相除结果乘以-1,得到相反结果;将所述相反结果作为预设常数的指数,得到各个监测级别不确定的日志学习样例的贡献度。
可选地,所述通过各个监测级别不确定的日志学***均级别确定误差,确定为第一级别确定误差,其中,所述第一样例集包括所述监测级别不确定的日志学***均级别确定误差,确定为第二级别确定误差,其中所述第二样例集包括所述监测级别不确定的日志学***均级别确定误差,确定为第三级别确定误差,其中所述第三样例集包括所述监测级别不确定的日志学***均值,确定得到所述监测级别不确定的日志学习样例库的级别确定误差;其中,所述真例阈值是所述监测级别不确定的日志学习样例库的监测级别不确定的日志学习样例的监测级别倾向值中,各个代表真例的监测级别倾向值的均值;所述假例阈值为所述监测级别不确定的日志学习样例库的监测级别不确定的日志学习样例的监测级别倾向值中,各个代表假例的监测级别倾向值的均值。
可选地,所述通过各个日志学***均结果,确定为所述第一监测级别确定子算法针对各个监测级别不确定的日志学***均结果,确定为所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值;或者;所述通过各个日志学习样例的训练监督信息,以所述日志学习样例库为一个训练组对所述患者监测级别确定算法进行分组训练,得到第一监测级别确定子算法和所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,以及第二监测级别确定子算法和所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,包括:对于各个监测级别不确定的日志学习样例,将所述患者监测级别确定算法在第一分组训练中对所述监测级别不确定的日志学习样例的级别倾向值与第二设定值的积确定为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第一分组训练预估的监测级别倾向值,所述第二设定值的取值范围为(0,1);依据下述公式确定所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的其他分组训练预估的监测级别倾向值:
pm(s)=f*pm-1(s)+e*qm(s),
其中,s为所述监测级别不确定的日志学习样例;m为分组训练的组序号;pm(s)为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第m分组训练预估的监测级别倾向值;pm-1(s)为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第m分组的前一分组训练预估的监测级别倾向值;e为所述第二设定值,f=1-e;qm(s)为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第m分组训练的级别倾向值;将所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的所述M个分组训练的监测级别倾向值,确定为所述第一监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值;将所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的所述N个分组训练的监测级别倾向值,确定为所述第二监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值。
可选地,所述依据所述第一监测级别确定子算法和所述第二监测级别确定子算法分别针对所述监测级别不确定的日志学习样例库中各个监测级别不确定的日志学习样例预估的监测级别倾向值之间的误差计算所述各个监测级别不确定的日志学习样例的未决系数,包括:确定第一监测级别确定子算法和第二监测级别确定子算法分别对各个监测级别不确定的日志学习样例预估的监测级别倾向值之间的绝对偏差量,确定为各个监测级别不确定的日志学习样例的第一误差;确定第一监测级别确定子算法和第二监测级别确定子算法分别对各个监测级别不确定的日志学习样例预估的监测级别倾向值之间的绝对和值,确定为各个监测级别不确定的日志学习样例的第二误差;确定各个监测级别不确定的日志学习样例的未决系数,其中各个监测级别不确定的日志学习样例的未决系数与所述各个监测级别不确定的日志学习样例的第一误差正向关联,且与所述各个监测级别不确定的日志学习样例的第二误差反向关联。
可选地,所述通过所述训练后的第一监测级别确定子算法的算法参数,确定所述患者监测级别确定算法的算法参数,包括:将所述训练后的第一监测级别确定子算法的算法参数,确定为所述患者监测级别确定算法的算法参数。
可选地,所述通过所述训练后的第一监测级别确定子算法的算法参数,确定所述患者监测级别确定算法的算法参数,包括:依据所述第二监测级别确定子算法针对各个监测级别不确定的日志学***均,将平均值确定为所述患者监测级别确定算法对应的参数。
第二方面,本申请提供一种数据处理***,包括:
一个或多个处理器;
存储器;一个或多个计算机程序;其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序被所述处理器执行时,实现以上所述的方法。
本申请的有益效果:本申请提供一种基于智慧病房呼叫***的数据处理方法及数据处理***,通过训练好的算法进行智慧病房中的患者的监测级别,能实现针对不同严重程度的病患的自动化监测决策,实时性和精确性高。在训练监测级别确定算法时,先通过真例的日志学习样例和监测级别不确定的日志学习样例对患者监测级别确定算法进行前置训练得到两个监测级别确定子算法,使该两个监测级别确定子算法产生一定的级别确定性能,便于准确确定未决系数和修正训练监督信息。之后,对比两个监测级别确定子算法对同一监测级别不确定的日志学习样例获得的监测级别倾向值,依据其误差计算监测级别不确定的日志学习样例的未决系数,从而得到监测级别不确定的日志学习样例在分组训练环节的影响,使不适于参加训练的日志学习样例产生的干扰得到降低。此外,依据监测级别倾向值修正一些监测级别不确定的日志学习样例的训练监督信息,缓解各监测级别不确定的日志学习样例的训练监督信息中的干扰。此外,在第一监测级别确定子算法的后续分组训练中,依据各个监测级别不确定的日志学习样例的未决系数和修正的训练监督信息修正各监测级别不确定的日志学习样例的级别确定误差,依据未决系数可以压制未决系数太大的监测级别不确定的日志学习样例对第一监测级别确定子算法的算法参数修正的干扰,那么代表未决系数小的监测级别不确定的日志学习样例对第一监测级别确定子算法的算法参数修正的干扰被适当提高,然后结合修正后的训练监督信息,因各监测级别不确定的日志学习样例的训练监督信息中的干扰和不适于参加训练的日志学习样例的干扰得到压制,第一监测级别确定子算法的级别确定质量得到增强。依据第一监测级别确定子算法得到患者监测级别确定算法,由于第一监测级别确定子算法的级别确定效果达到目标,则患者监测级别确定算法的级别确定效果达到目标。
附图说明
图1是本申请实施例提供的一种患者监测级别确定算法的训练流程图。
图2是本申请实施例提供的一种数据处理***的组成示意图。
具体实施方式
本申请实施例中基于智慧病房呼叫***的数据处理方法的执行主体为数据处理***,包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。服务器包括但不限于单个网络服务器、多个网络服务器组成的服务器组或于云计算的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,数据处理***可单独运行来实现本申请,也可接入网络并通过与网络中的其他数据处理***的交互操作来实现本申请。其中,数据处理***所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
本申请实施例提供了一种基于智慧病房呼叫***的数据处理方法,该方法应用于数据处理***,该方法包括:
步骤S10:获取健康监测日志,所述健康监测日志包括针对目标患者在目标监测周期内获取获得的健康数据和呼叫***触发数据。
步骤S10中,数据处理***从相关的数据源中收集健康监测日志。这些日志是专门针对目标患者在特定的监测周期内记录下来的。目标患者是正在使用智慧病房呼叫***,并同意接受健康监测的患者。目标监测周期,则是指定的一段时间范围,可以是几天、几周甚至几个月,具体取决于医疗需求和监测目的。
健康监测日志中包含了两种类型的数据:健康数据和呼叫***触发数据。健康数据主要是关于患者的生理参数、活动量以及其他与健康状况相关的指标。例如,对于一个心脏病患者,健康数据可能包括心率、血压、血氧饱和度等生理指标的实时监测值。这些数据通常由医疗设备自动采集,并通过无线传输技术发送到中央数据库进行存储。呼叫***触发数据则记录了患者在何时触发了呼叫***的信息。在智慧病房环境中,呼叫***通常被患者用来寻求医护人员的帮助或咨询。当患者按下呼叫按钮时,***生成一条记录,包括触发时间、患者身份以及呼叫类型等信息。这些触发数据对于分析患者的需求和行为模式非常有用。
举个例子来说明,假设有一位名叫张先生的糖尿病患者在智慧病房中接受治疗。他的健康监测日志可能包括每天定时测量的血糖值、胰岛素注射记录以及活动量的数据。同时,如果在某天的凌晨三点,张先生感到不适并触发了呼叫***,那么这条呼叫记录也会被记录在健康监测日志中。
通过获取这些详细的健康监测日志,数据处理***能够为后续的数据处理和分析提供丰富的信息基础。这些数据不仅可以帮助医护人员更好地了解患者的健康状况和需求,还可以用于优化呼叫***的功能和性能,从而提高医疗服务的质量和效率。
以下是一个健康监测日志的示例:
日期: 2024-03-31/患者姓名: 张三/患者ID: 123456/性别: 男/年龄: 65/病房号: 501。
体温记录:
时间|体温(℃)|备注
-----------|---------|------
06:00AM|36.8|正常
10:00AM|37.0|正常
02:00PM|36.9|正常
06:00PM|36.7|正常
血压记录:
时间|收缩压(mmHg)|舒张压(mmHg)|备注
-----------|--------------|--------------|------
06:00AM|120|80|正常
10:00AM|125|85|正常
02:00PM|122|82|正常
06:00PM|118|78|正常
呼叫***触发数据:
时间|呼叫类型|响应状态|响应时间(分钟)|备注
-----------|------------|----------|----------------|------
07:30AM|护士求助|已响应|2|需要换药
11:45AM|清洁服务|已响应|5|请求病房清洁
03:15PM|医生咨询|已响应|10|咨询病情
08:45PM|紧急呼叫|已响应|1|突感不适
备注信息:
-患者今日整体状况稳定,体温和血压均在正常范围内。
-上午07:30,患者通过呼叫***请求护士换药,护士在2分钟内响应。
-上午11:45,患者请求清洁服务,5分钟后清洁人员到达病房进行清洁。
-下午03:15,患者通过呼叫***咨询医生病情,医生在10分钟内到达病房进行解答。
-晚上08:45,患者突感不适,按下紧急呼叫按钮,医护人员立即响应并在1分钟内到达病房进行处理。
在这个更新后的实例中,呼叫***触发数据部分详细记录了患者使用呼叫***的情况。包括触发呼叫的时间、呼叫的类型(如护士求助、清洁服务、医生咨询、紧急呼叫等)、响应状态(是否已响应)、响应时间(从触发呼叫到得到响应的时间间隔)以及备注信息(对呼叫的额外说明或结果记录)。这些数据对于评估呼叫***的性能、了解患者的需求响应情况以及改进医疗服务流程都非常重要。通过记录和分析呼叫***触发数据,医院可以更有效地分配资源,提高患者满意度,并确保在紧急情况下能够迅速响应患者的需求。
可以理解,上述健康监测日志在被数据处理***进行处理前,可以先将其中的离散数据(非数值数据)编码为数值数据,便于数据处理***处理,例如基于独热编码进行编码,具体不做限定。
步骤S20:调用患者监测级别确定算法对所述健康监测日志进行监测级别确定,得到对应的目标患者的监测级别。
步骤S20中,对患者健康监测日志的深入分析,并确定每位患者的具体监测级别。首先,数据处理***调用一个预先定义好的患者监测级别确定算法。这个算法可以是一个深度学习算法,例如可以为卷积神经网络算法(CNN)、循环神经网络算法(RNN)、深度神经网络算法(DNN)、长短时记忆神经网络算法(LSTM)等,具体不做限定,它经过大量数据的训练和优化,已经学会了如何根据健康监测日志中的信息来判断患者的健康状况和监测需求。深度学习算法在处理这类问题时具有显著优势,因为它能够自动提取日志中的关键特征,如体温变化、血压波动、呼叫***的使用频率等,并将这些特征映射到不同的监测级别上。这种映射关系是通过算法在训练过程中自动学习得到的,因此能够更准确地反映实际情况。
在算法运行过程中,接收健康监测日志作为输入。如上步骤S10所述,日志包含了患者一段时间内的各种健康数据,如体温记录、血压记录、呼叫***触发数据等。算法逐项分析这些数据,提取出关键特征,并将这些特征组合成一个特征向量。这个特征向量可以看作是患者当前健康状况的数字化表示。接下来,算法会将这个特征向量输入到一个已经训练好的神经网络模型(即监测级别确定算法)中。其根据输入的特征向量来预测患者的监测级别。预测结果是一个具体的数值,它代表了患者当前需要的监测紧密程度。数值越大,意味着患者需要更频繁的健康检查和更及时的医疗干预。例如,如果算法分析发现患者的体温和血压都出现了异常波动,并且呼叫***的使用频率也显著增加,那么它可以输出一个较高的监测级别。这表明患者当前的健康状况不容乐观,需要医护人员给予更多的关注和照顾。最后,数据处理***将算法输出的监测级别作为目标患者的当前监测级别,并据此来制定相应的医疗计划和资源分配策略。基于此,***能够确保每位患者都能得到与其健康状况相匹配的监测和照顾,从而提高医疗服务的效率和质量。
下面介绍该监测级别确定算法的训练过程。
介绍该训练过程前,需要说明的是,监测级别确定的过程类似于一个多分类问题。监测级别确定算法本质为一个分类模型,在进行算法训练时,训练用的学习样例,也即训练样本,来源于病房的历史监测数据(可以理解,获取的该类数据是经过病患确认同意,符合法律法规采集的数据),这些历史监测数据在作为学习样例时,某些数据是没有确定监测级别的,也即不能确定监督指示信息(又叫标签),这可能是因为人力标注的成本较高,未进行及时标注,那么这些数据在训练算法时可能产生较大的扰动影响,使得最终训练得到的检测级别确定算法的精度下降。本申请接下来介绍的算法训练过程,将克服上述问题。
具体的,患者监测级别确定算法通过日志学习样例库训练得到,所述日志学习样例库包括监测级别确定的日志学习样例库和监测级别不确定的日志学习样例库,请参照图1,所述患者监测级别确定算法的训练过程包括:
步骤S1:将各个监测级别确定的日志学习样例的训练监督信息标注为真例,各个监测级别不确定的日志学习样例的训练监督信息标注为假例,通过各个日志学习样例的训练监督信息,以所述日志学习样例库为一个训练组对所述患者监测级别确定算法进行分组训练,得到第一监测级别确定子算法和所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,并得到第二监测级别确定子算法和所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,其中,所述第一监测级别确定子算法为历经M个分组训练获得的,所述第二监测级别确定子算法为历经N个分组训练获得的,所述M不等于N,并在所述分组训练中依据所述日志学习样例库的级别确定误差修正所述患者监测级别确定算法的算法参数。
首先,数据处理***对日志学习样例库中的样例进行标注。日志学习样例库包括监测级别确定的日志学习样例和监测级别不确定的日志学习样例。对于监测级别确定的样例,***将其训练监督信息标注为真例,表示这些样例的监测级别是已知的且确定的。而对于监测级别不确定的样例,***将其训练监督信息标注为假例,表示这些样例的监测级别是未知或不确定的。接下来,***使用这些已标注的日志学习样例对患者监测级别确定算法进行分组训练,也称为batch训练。在这个过程中,***将日志学习样例库作为一个训练组(即一个batch),通过样例的训练监督信息来训练算法。这种分组训练的方式有助于算法更好地学习和适应不同类型的数据。
在分组训练过程中,***得到两个监测级别确定子算法:第一监测级别确定子算法和第二监测级别确定子算法。这两个子算法是通过不同数量的分组训练获得的。具体来说,第一监测级别确定子算法是历经M个分组训练得到的,而第二监测级别确定子算法是历经N个分组训练得到的,且M不等于N。这意味着这两个子算法在训练过程中接触到了不同数量和多样性的数据,从而具有不同的预测性能和泛化能力。
此外,***在分组训练中还依据日志学习样例库的级别确定误差来修正患者监测级别确定算法的算法参数。这是为了确保算法能够更准确地预测患者的监测级别。具体来说,当算法对某个样例的监测级别预测出现误差时,***根据这个误差来调整算法的参数,以使算法在后续的训练中能够更好地学习和适应数据。
最后,训练过程不仅得到了两个监测级别确定子算法,还得到了这两个子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值。这个倾向值是一个数值,例如真例对应的数值为1,假例对应的数值为-1。这个倾向值可以看作是算法对不确定样例的监测级别预测的一个信心度或倾向性,有助于***在后续的处理中更好地判断和决策。
综上所述,步骤S1是患者监测级别确定算法训练过程中的一个关键步骤,它通过对日志学习样例的标注、分组训练以及算法参数的修正来确保算法能够更准确地预测患者的监测级别。
作为一种实施方式,所述步骤S1,通过各个日志学习样例的训练监督信息,以所述日志学习样例库为一个训练组对所述患者监测级别确定算法进行分组训练,得到第一监测级别确定子算法和所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,以及第二监测级别确定子算法和所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,包括:
步骤Sa11:在所述患者监测级别确定算法的所述M个分组训练中,将第M个训练组训练的对各个监测级别不确定的日志学习样例的级别倾向值确定为所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值;
步骤Sa12:在所述患者监测级别确定算法的所述N个分组训练中,将第N个训练组训练的对各个监测级别不确定的日志学习样例的级别倾向值确定为所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值。
步骤Sa11中,***已经完成了M个分组训练,每个分组都包含了一定数量的日志学习样例,并且这些样例被用来训练和优化算法。具体来说,当数据处理***进行到第M个(也就是最后一个)分组训练时,它会特别关注那些监测级别不确定的日志学习样例。这些样例之所以被标注为不确定,是因为它们所包含的信息不足以让***直接确定一个明确的监测级别。然而,通过前面的M-1个分组训练,算法已经学习到了如何从类似的样例中提取有用特征,并基于这些特征来预测监测级别。在第M个分组训练中,算法利用之前学到的知识和经验,对这些监测级别不确定的日志学习样例进行分析和预测。对于每一个这样的样例,算法都会给出一个预估的监测级别倾向值。这个倾向值是一个数值,它反映了算法认为这个样例应该被归属到哪个监测级别的信心或倾向性。
最终,数据处理***将第M个训练组训练得到的这些倾向值确定为第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值。这些倾向值不仅反映了算法在当前训练阶段的学习成果,也为后续的患者监测级别确定提供了重要的参考依据。
举例来说,假设有一个日志学习样例记录了一位患者在夜间的体温波动情况,但由于数据波动范围在正常范围内,所以其监测级别是不确定的。然而,在第一监测级别确定子算法经过M个分组训练后,它可以根据学习到的知识(比如夜间体温波动可能与某些疾病有关)给这个样例一个较高的监测级别倾向值。这样一来,当***后续遇到类似的患者数据时,就可以更加准确地判断其监测需求。
步骤Sa12同理,数据处理***关注第N个(即最后一个)训练组中监测级别不确定的日志学习样例。具体来说,当***执行到第N个分组训练时,它已经利用前N-1个分组的日志学习样例对算法进行了多次迭代和优化。这些先前的训练过程使得算法能够更好地理解和学习数据中的模式,从而提高其预测的准确性。在第N个分组训练中,算法会对监测级别不确定的日志学习样例进行最后的分析和预测。这些样例的监测级别不确定,意味着它们所包含的信息不足以直接确定一个明确的监测级别。然而,通过之前的训练,算法已经具备了从这些数据中提取有用特征并进行预测的能力。对于每一个监测级别不确定的日志学习样例,算法根据其学习到的知识和经验给出一个预估的监测级别倾向值。这个倾向值反映了算法对于这个样例可能属于哪个监测级别的预测或倾向。例如,如果一个样例的监测级别倾向值接近1,那么算法可能认为这个样例需要更高级别的监测;如果倾向值接近-1,则可能需要较低级别的监测。
最终,数据处理***将第N个训练组训练得到的这些监测级别倾向值确定为第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值。这些倾向值是基于算法在N个分组训练过程中的学习成果得出的,因此它们为后续的患者监测级别确定提供了有价值的参考信息。
作为另一种实施方式,所述步骤S1,通过各个日志学习样例的训练监督信息,以所述日志学习样例库为一个训练组对所述患者监测级别确定算法进行分组训练,得到第一监测级别确定子算法和所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,以及第二监测级别确定子算法和所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,包括:
步骤Sb11:基于设定调节权值,确定所述患者监测级别确定算法针对各个监测级别不确定的日志学***均结果,确定为所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值;
步骤Sb12:基于所述设定调节权值,确定所述患者监测级别确定算法针对各个监测级别不确定的日志学***均结果,确定为所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值。
在步骤Sb11中,数据处理***首先设定一个调节权值。这个调节权值是一个预设的权重,用于在后续计算中平衡和调节各个分组训练输出的级别倾向值的重要性。设定调节权值的目的是确保不同分组训练的结果能够以合理的方式被综合起来,从而得到一个更加准确和可靠的监测级别倾向值。接下来,***关注那些在M个分组训练中监测级别不确定的日志学***均计算。具体来说,***将每个分组训练输出的级别倾向值乘以对应的调节权值,然后将得到的乘积相加,得到一个加权求和结果。最后,***将这个加权求和结果除以调节权值的总和,以确保得到的是一个加权平均数,这个平均数就是第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值。
这个预估的监测级别倾向值是一个综合了M个分组训练结果的预测值,它考虑了不同分组训练对最终结果的不同贡献,因此更加全面和稳健。这个倾向值将被用于后续的患者监测工作,帮助医护人员更加准确地判断患者的健康状况并采取相应的措施。
举例来说,假设数据处理***进行了三个分组训练(M=3),并且针对某个监测级别不确定的日志学习样例,这三个分组训练分别输出了级别倾向值0.3、0.5和0.7。同时,***设定了一个调节权值数组[0.2,0.5,0.3],分别对应这三个分组训练的权重。那么,根据步骤Sb11的计算方法,该样例的预估监测级别倾向值将是(0.3*0.2+0.5*0.5+0.7*0.3)=0.52。
同理,步骤Sb12与步骤Sb11类似,但应用于N个分组训练的场景。在步骤Sb12中,数据处理***首先参考先前设定的调节权值。这个调节权值与步骤Sb11中提到的权值作用相同,都是为了在加权计算中平衡不同分组训练输出的级别倾向值的重要性。然而,这里的调节权值可能根据N个分组训练的特点或需求进行特定的设置或调整。接下来,***专注于那些在N个分组训练中监测级别不确定的日志学习样例。同样地,这些样例的监测级别由于各种原因而无法直接确定,因此需要通过算法进行进一步的处理和预测。在每个分组训练中,算法会根据当前阶段的学习和分析,为这些不确定的样例输出一个级别倾向值。
然后,与步骤Sb11类似,数据处理***利用设定调节权值对这些级别倾向值进行加权平均计算。逐一将每个分组训练输出的级别倾向值与对应的调节权值相乘,并将所有乘积相加,得到一个总的加权求和结果。为了确保结果的准确性,***还会将这个加权求和结果除以调节权值的总和,从而得到一个加权平均数。
这个加权平均数即被确定为第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值。这个倾向值综合考虑了N个分组训练的结果,反映了算法在经过多轮训练后对样例监测级别的综合预测。举例来说,假设数据处理***进行了四个分组训练(N=4),对于某个监测级别不确定的日志学习样例,这四个分组训练分别输出了级别倾向值0.4、0.6、0.5和0.7。***为这四个分组训练设定了调节权值数组[0.1,0.3,0.4,0.2]。根据步骤Sb12的计算方法,该样例的预估监测级别倾向值将是(0.4*0.1+0.6*0.3+0.5*0.4+0.7*0.2)=0.56。
作为又一种实施方式,所述步骤S1,通过各个日志学习样例的训练监督信息,以所述日志学习样例库为一个训练组对所述患者监测级别确定算法进行分组训练,得到第一监测级别确定子算法和所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,以及第二监测级别确定子算法和所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,包括:
步骤Sc11:对于各个监测级别不确定的日志学习样例,将所述患者监测级别确定算法在第一分组训练中对所述监测级别不确定的日志学习样例的级别倾向值与第二设定值的积确定为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第一分组训练预估的监测级别倾向值,所述第二设定值的取值范围为(0,1)。
步骤Sc12:依据下述公式确定所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的其他分组训练预估的监测级别倾向值:
pm(s)=f*pm-1(s)+e*qm(s),
其中,s为所述监测级别不确定的日志学习样例;m为分组训练的组序号;pm(s)为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第m分组训练预估的监测级别倾向值;pm-1(s)为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第m分组的前一分组训练预估的监测级别倾向值;e为所述第二设定值,f=1-e;qm(s)为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第m分组训练的级别倾向值。
步骤Sc13:将所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的所述M个分组训练的监测级别倾向值,确定为所述第一监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值。
步骤Sc14:将所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的所述N个分组训练的监测级别倾向值,确定为所述第二监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值。
在步骤Sc11中,数据处理***首先识别出那些在第一分组训练中监测级别不确定的日志学习样例。这些样例可能由于包含的信息不完整、模糊或存在矛盾,导致算法无法直接确定它们所属的监测级别。接下来,***对这些不确定的样例进行进一步的处理。具体而言,计算每个不确定样例在第一分组训练中的级别倾向值。这个级别倾向值反映了算法在当前训练阶段对于样例可能属于哪个监测级别的初步预测或倾向。它可能是一个介于0和1之间的数值,表示样例属于某个特定监测级别的概率或程度。
然后,数据处理***引入一个第二设定值,这个值的取值范围在0到1之间(不包括0和1)。这个第二设定值的作用是为了调节或缩放级别倾向值,从而控制其在后续计算中的影响权重。通过乘以这个第二设定值,***能够灵活地调整不确定样例的监测级别倾向值,以适应不同的训练需求或策略。最后,数据处理***将计算得到的乘积(即级别倾向值与第二设定值的积)确定为该不确定样例在第一分组训练中的预估监测级别倾向值。这个预估倾向值综合考虑了样例在当前训练阶段的级别倾向和第二设定值的调节作用,为后续的监测级别确定提供了更加准确和可靠的依据。
举例来说,假设数据处理***在进行第一分组训练时,遇到了一个监测级别不确定的日志学习样例A。经过初步分析,***认为样例A有0.7的概率属于高级别监测(假设级别倾向值为0.7)。然而,考虑到第一分组训练可能存在一定的不确定性或偏差,***决定通过引入第二设定值(假设为0.5)来缩放这个级别倾向值。因此,样例A在第一分组训练中的预估监测级别倾向值将被计算为0.7*0.5=0.35。这个结果表明,在考虑了第一分组训练的初步预测和第二设定值的调节作用后,***认为样例A有0.35的概率属于高级别监测。这个预估倾向值将为后续的患者监测工作提供更加准确和可靠的指导。
在步骤Sc13中,数据处理***将监测级别不确定的日志学习样例在所有M个分组训练中的监测级别倾向值进行综合考量,以确定这些样例的最终预估监测级别倾向值。这个最终预估的监测级别倾向值是通过第一监测级别确定子算法计算得出的,它反映了算法对于这些样例可能属于哪个监测级别的最终预测或判断。
具体来说,***回顾这些不确定样例在每一个分组训练(从第1分组到第M分组)中的监测级别倾向值,这些倾向值是在之前的训练过程中逐步计算并更新得到的。然后,***根据这些分组训练的倾向值,采用特定的方法(如加权平均、投票机制等)来确定样例的最终预估监测级别倾向值。这个最终预估的监测级别倾向值是一个综合了各个分组训练结果的数值,它更加全面和准确地反映了样例的监测级别特性。通过这个值,***可以为后续的监测工作提供更加可靠和有效的指导。
举例来说,假设数据处理***已经完成了对某个监测级别不确定的日志学习样例在所有M个分组训练中的监测级别倾向值的计算。这些倾向值可能分别代表了样例在不同训练阶段、不同数据特征下的监测级别倾向。现在,***需要确定这个样例的最终预估监测级别倾向值。
数据处理***可以采用加权平均的方法,将每个分组训练的监测级别倾向值乘以一个相应的权重系数(这个权重系数可以根据分组训练的重要性、数据质量等因素来确定),然后将所有加权后的倾向值相加,得到最终的预估监测级别倾向值。这个值将作为第一监测级别确定子算法对该样例的监测级别预测结果,为后续的患者监测工作提供指导。
在步骤Sc14中,数据处理***考虑监测级别不确定的日志学习样例在N个分组训练中的表现。这些分组训练可能是基于不同的数据集、特征集或算法参数进行的,旨在从多个角度捕捉样例的监测级别特性。
对于每一个不确定的日志学习样例,数据处理***收集其在N个分组训练中分别得到的监测级别倾向值。这些倾向值反映了在各个不同训练环境下,样例被判断为属于某个特定监测级别的可能性或趋势。
接下来,数据处理***将这些分组训练的监测级别倾向值进行综合处理,以确定样例在第二监测级别确定子算法下的预估监测级别倾向值。这个综合处理的过程可以是简单的平均、加权平均,或者是更复杂的数学模型或机器学习算法的应用,具体取决于***的设计和需求。
举例来说,假设一个监测级别不确定的日志学习样例,在N个分组训练中分别得到了不同的监测级别倾向值,比如[0.6,0.7,0.55,0.65]等。这些值表示在不同训练条件下,该样例被预测为属于某个监测级别的概率或程度。
数据处理***可以采用简单平均的方法,将这些倾向值相加后除以分组训练的数量N,得到该样例在第二监测级别确定子算法下的预估监测级别倾向值。在这个例子中,预估倾向值将是(0.6+0.7+0.55+0.65)/4=0.625。
步骤S2:依据所述第一监测级别确定子算法和所述第二监测级别确定子算法分别针对所述监测级别不确定的日志学习样例库中各个监测级别不确定的日志学习样例预估的监测级别倾向值间的误差计算所述各个监测级别不确定的日志学习样例的未决系数。
步骤S2中,数据处理***回顾第一监测级别确定子算法和第二监测级别确定子算法对监测级别不确定的日志学习样例库中各个样例的预估监测级别倾向值。这些倾向值是之前步骤中通过算法计算得出的,反映了样例可能属于某个监测级别的概率或趋势。接下来,计算这两个子算法针对同一个样例预估的监测级别倾向值之间的误差。误差的大小表明了这两个子算法在判断该样例监测级别上的一致性程度。如果误差较小,说明两个子算法对该样例的监测级别判断较为一致;反之,如果误差较大,则说明两个子算法的判断存在较大分歧。
为了量化这种不确定性,数据处理***计算每个监测级别不确定的日志学***方、误差与其他因素的加权和等形式。
举例来说,假设有一个监测级别不确定的日志学***方、开方等)后作为未决系数。
这个未决系数在后续的患者监测工作中具有重要意义。它可以帮助***识别出那些监测级别判断存在较大不确定性的样例,从而对这些样例进行额外的关注或处理。比如,对于未决系数较大的样例,***可以安排更频繁的监测,或者采用更精确的监测方法来获取更准确的监测结果。
作为一种实施方式,所述步骤S2,依据所述第一监测级别确定子算法和所述第二监测级别确定子算法分别针对所述监测级别不确定的日志学习样例库中各个监测级别不确定的日志学习样例预估的监测级别倾向值之间的误差计算所述各个监测级别不确定的日志学习样例的未决系数,具体可以包括:
步骤S21:确定第一监测级别确定子算法和第二监测级别确定子算法分别对各个监测级别不确定的日志学习样例预估的监测级别倾向值之间的绝对偏差量,确定为各个监测级别不确定的日志学习样例的第一误差;
步骤S22:确定第一监测级别确定子算法和第二监测级别确定子算法分别对各个监测级别不确定的日志学习样例预估的监测级别倾向值之间的绝对和值,确定为各个监测级别不确定的日志学习样例的第二误差;
步骤S23:确定各个监测级别不确定的日志学习样例的未决系数,其中各个监测级别不确定的日志学习样例的未决系数与所述各个监测级别不确定的日志学习样例的第一误差正向关联,且与所述各个监测级别不确定的日志学习样例的第二误差反向关联。
步骤S21中,数据处理***首先计算第一监测级别确定子算法和第二监测级别确定子算法分别对各个监测级别不确定的日志学习样例预估的监测级别倾向值之间的绝对偏差量。这个绝对偏差量是两个倾向值差值的绝对值,反映了两个子算法在判断同一个样例监测级别时的差异程度。例如,如果第一子算法对某个样例的预估倾向值是0.8,而第二子算法的预估倾向值是0.6,那么这两个倾向值之间的绝对偏差量就是|0.8-0.6|= 0.2。这个值越大,说明两个子算法的判断差异越大。步骤S22中,数据处理***计算两个子算法分别对各个样例预估的监测级别倾向值之间的绝对和值。这个绝对和值是两个倾向值和的绝对值,它在一定程度上反映了两个子算法对样例监测级别判断的总体强度或信心。继续上面的例子,两个倾向值的绝对和值就是|0.8+0.6|=1.4。这个值越大,说明两个子算法对样例的监测级别判断越为明确或强烈。
步骤S23中,数据处理***确定各个监测级别不确定的日志学习样例的未决系数。这个未决系数是基于前面计算的第一误差(绝对偏差量)和第二误差(绝对和值)来确定的。它与第一误差正向关联,意味着当两个子算法的判断差异增大时,未决系数也会增大,表示样例的监测级别更加不确定。同时,未决系数与第二误差反向关联,意味着当两个子算法的判断总体强度增大时,未决系数会减小,表示样例的监测级别相对更加确定。具体的计算方法可以根据***的设计和需求来确定,比如可以采用第一误差与第二误差的比值、差值或其他组合形式来计算未决系数。
通过这三个步骤的计算,数据处理***为每个监测级别不确定的日志学习样例分配一个未决系数,这个系数在后续的患者监测工作中将作为重要的参考指标,帮助***更加精准地判断样例的监测级别并采取相应的处理措施。
步骤S3:依据所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值修正所述各个监测级别不确定的日志学习样例的训练监督信息。
步骤S3的目的是利用第一监测级别确定子算法预估的监测级别倾向值,来修正不确定样例的训练监督信息。在机器学习和数据处理的背景下,训练监督信息通常指的是用于指导算法学习的数据标签或标注(如前述步骤S1标注的真例、假例)。然而,在实际应用中,尤其是医疗监测领域,很多时候这些标签或标注可能并不准确或完整,这就给训练有效的模型带来了挑战。
在步骤S3中,数据处理***回顾第一监测级别确定子算法对各个监测级别不确定的日志学习样例的预估结果,这些结果表现为监测级别倾向值,它们反映了样例属于各个可能监测级别的概率或程度。这些倾向值是通过之前步骤中的算法分析和计算得出的。接下来,利用这些倾向值来修正原有的训练监督信息。修正的方式可以是多种多样的,具体取决于***设计和实际需求。例如,如果一个日志学习样例原本被标注为假例,但第一监测级别确定子算法给出了较高的倾向值指向某一特定级别,那么***可以根据这一倾向值来更新该样例的标签,或者为其添加一个新的标注,表示该样例更有可能属于这个特定级别。
举例来说,假设***中有一个日志学习样例,其原始标签为“假例”,但经过第一监测级别确定子算法的分析,该样例对于“高风险”级别的倾向值为0.8(在一个0到1的范围内),显著高于其他级别。在这种情况下,数据处理***可以将该样例的训练监督信息从“假例”修正为“真例”,或者在原有标签的基础上增加一个标注,指明其对“高风险”级别的强烈倾向。通过这一步骤的修正,数据处理***能够更准确地为机器学习模型提供训练数据,进而提高模型在后续患者监测工作中的性能和准确性。这种修正尤其对于那些原始标签不准确或缺失的样例具有重要意义,它有助于模型学习到更贴近实际情况的数据分布和特征关系。
作为一种实施方式,所述步骤S3,依据所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值修正所述各个监测级别不确定的日志学习样例的训练监督信息,具体可以包括:
对于所述监测级别不确定的日志学习样例库中的各个监测级别不确定的日志学习样例,如果所述第一监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值大于真例阈值,将所述监测级别不确定的日志学习样例的训练监督信息修正为真例;如果所述第一监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值不大于所述真例阈值,将所述监测级别不确定的日志学习样例的训练监督信息修正为假例。
在这一实施方式中,数据处理***根据第一监测级别确定子算法对监测级别不确定的日志学习样例预估的监测级别倾向值,来修正这些样例的训练监督信息。这个过程是确保机器学习模型能够从更精确的数据中学习,从而提高其预测和分类的准确性。
具体来说,***首先设定一个真例阈值,这个阈值是一个用于区分真例和假例的界限值。真例在这里指的是那些确实属于某一特定监测级别的样例,而假例则指的是那些不属于该级别的样例。接下来,对于监测级别不确定的日志学习样例库中的每一个样例,***查看第一监测级别确定子算法给出的监测级别倾向值。这个倾向值是一个表示样例属于某个监测级别可能性的数值。
如果某个样例的监测级别倾向值大于设定的真例阈值,这意味着该样例很有可能确实属于那个特定的监测级别。在这种情况下,数据处理***将该样例的训练监督信息修正为真例,即确认该样例为属于该监测级别的有效实例。
相反,如果样例的监测级别倾向值不大于真例阈值(即小于或等于阈值),这表示该样例不太可能属于那个特定的监测级别。在这种情况下,***将该样例的训练监督信息修正为假例,即认为该样例不是属于该监测级别的有效实例。
例如,假设真例阈值设定为0.7,某个日志学习样例经过第一监测级别确定子算法分析后,得到的监测级别倾向值为0.8。由于这个倾向值大于真例阈值0.7,***将该样例的训练监督信息从“假例”修正为“真例”,确认其属于相应的监测级别。通过这种方式,数据处理***能够有效地利用第一监测级别确定子算法的输出结果,对原本监测级别不确定的日志学习样例进行标签修正,从而为后续的机器学习模型提供更准确、更可靠的训练数据。
步骤S4:通过各个监测级别不确定的日志学习样例的未决系数和修正后的训练监督信息,以所述监测级别不确定的日志学习样例库为一个训练组对所述第一监测级别确定子算法进行分组训练,得到训练后的第一监测级别确定子算法。
步骤S4是数据处理***中关于监测级别确定的关键训练步骤,它涉及使用经过修正的训练监督信息和未决系数来进一步提升第一监测级别确定子算法的准确性。步骤S4中,数据处理***首先回顾并整理前面步骤中得到的所有信息,特别是监测级别不确定的日志学习样例的未决系数和经过修正的训练监督信息。这些信息对于接下来的训练过程至关重要,因为它们提供了关于样例监测级别确定性的重要线索和标签。
接下来,***将监测级别不确定的日志学习样例库作为一个整体训练组。这意味着,在训练过程中,***同时考虑这个库中的所有样例,而不是单独处理它们。这种分组训练的方法有助于算法更好地学习和理解不同样例之间的关系和模式。然后,***利用这个训练组对第一监测级别确定子算法进行分组训练。在这个过程中,算法会尝试根据提供的训练监督信息和未决系数来调整其内部的参数和结构,以便更准确地预测和分类日志学习样例的监测级别。未决系数在这里起到了一个权重的作用,它告诉算法哪些样例的监测级别更加确定,哪些样例的监测级别更加不确定,从而帮助算法在训练过程中更好地分配注意力和资源。
例如,如果一个日志学习样例的未决系数很高,说明它的监测级别非常不确定,那么算法在训练时可以更加关注这个样例,尝试从它身上学习到更多的信息。相反,如果一个样例的未决系数很低,说明它的监测级别相对确定,那么算法可以对这个样例给予较少的关注。
最后,通过这个过程,数据处理***得到一个训练后的第一监测级别确定子算法。这个算法在经过大量的学习和调整之后,应该能够更准确地预测和分类新的日志学习样例的监测级别,从而在实际应用中提供更好的性能。
作为一种实施方式,所述步骤S4,通过各个监测级别不确定的日志学习样例的未决系数和修正后的训练监督信息,以所述监测级别不确定的日志学习样例库为一个训练组对所述第一监测级别确定子算法进行分组训练,具体可以包括:
步骤S41:依据各个监测级别不确定的日志学习样例的未决系数确定各个监测级别不确定的日志学习样例的贡献度,所述贡献度与所述未决系数负相关;
步骤S42:通过所述第一监测级别确定子算法确定各个监测级别不确定的日志学习样例的级别倾向值;
步骤S43:依据各个监测级别不确定的日志学习样例的训练监督信息和级别倾向值确定各个监测级别不确定的级别确定误差;
步骤S44:通过各个监测级别不确定的日志学习样例的级别确定误差和贡献度,确定所述监测级别不确定的日志学习样例库的级别确定误差;
步骤S45:依据所述监测级别不确定的日志学习样例库的级别确定误差修正所述第一监测级别确定子算法的算法参数;
如果所述第一监测级别确定子算法达到训练截止条件,则停止训练;如果所述第一监测级别确定子算法未达到训练截止条件,则重复通过所述第一监测级别确定子算法确定各个监测级别不确定的日志学习样例的监测级别,到依据所述监测级别不确定的日志学习样例库的级别确定误差修正所述第一监测级别确定子算法的算法参数的步骤。
在步骤S41中,数据处理***确定各个监测级别不确定的日志学习样例的贡献度。这个贡献度可以理解为影响力权重,它反映了每个样例在训练第一监测级别确定子算法时的重要程度。这个贡献度与样例的未决系数是负相关的。
具体来说,未决系数是一个衡量日志学习样例监测级别不确定性的指标。未决系数越高,表示样例的监测级别越不确定;反之,未决系数越低,表示样例的监测级别相对更确定。由于贡献度与未决系数负相关,这意味着那些监测级别更不确定的样例在训练过程中的贡献度会相对较低,而那些监测级别相对确定的样例的贡献度会相对较高。这样设置是因为监测级别不确定的样例可能包含较多的噪声或模糊信息,如果它们在训练中占据过大的权重,可以导致算法学习到错误或不稳定的模式。相反,监测级别相对确定的样例通常包含更可靠的信息,应该被赋予更大的权重以引导算法的学习。
例如,假设数据处理***正在处理一个包含多个日志学习样例的库,其中有两个样例A和B。样例A的未决系数为0.8(表示其监测级别很不确定),而样例B的未决系数为0.2(表示其监测级别相对确定)。根据步骤S41,***为样例A分配一个较低的贡献度(如0.2),而为样例B分配一个较高的贡献度(如0.8)。这样,在后续的训练过程中,样例B将对算法的调整产生更大的影响,而样例A的影响则相对较小。
通过这种方式,数据处理***能够更有效地利用有限的训练资源,优先关注那些对提升算法性能最有帮助的日志学习样例。
在步骤S42中,数据处理***利用第一监测级别确定子算法来确定各个监测级别不确定的日志学习样例的级别倾向值。这个级别倾向值是一个重要的指标,它反映了算法对于每个样例可能属于的各个监测级别的预测倾向或偏好。
具体来说,第一监测级别确定子算法可能是一个经过训练的机器学习模型,如支持向量机(SVM)、随机森林(Random Forest)或神经网络等。这些模型能够接收日志学习样例作为输入,并输出样例属于各个监测级别的概率或倾向值。在实际操作中,***将每个监测级别不确定的日志学习样例输入到第一监测级别确定子算法中。算法依据其内部逻辑和已学习的知识库对每个样例进行评估,并输出一个或多个级别倾向值。这些倾向值通常以概率或得分的形式表示,用于量化样例属于不同监测级别的可能性。
在步骤S43中,数据处理***的任务是确定各个监测级别不确定的日志学习样例的级别确定误差。这个误差反映了算法预测的监测级别与实际的监测级别之间的差异,是衡量算法性能的重要指标。
为了计算这个误差,***首先参考每个日志学习样例的训练监督信息。训练监督信息是在训练过程中提供的,用于指导算法学习的正确答案或目标值。在监测级别确定的场景中,训练监督信息通常表现为每个样例对应的真实监测级别。接着,***结合第一监测级别确定子算法为每个样例输出的级别倾向值。这个倾向值表示算法对于样例可能属于的各个监测级别的预测偏好或概率分布。
通过比较训练监督信息和级别倾向值,***可以计算出每个样例的级别确定误差。具体来说,这个误差可以是一个分类损失值,如交叉熵损失、均方误差等,用于量化算法预测与真实值之间的不匹配程度。
在步骤S44中,数据处理***确定整个监测级别不确定的日志学习样例库的级别确定误差。首先,***回顾在步骤S43中为每个监测级别不确定的日志学习样例计算出的级别确定误差。这些误差反映了算法对每个样例监测级别的预测准确程度。误差值越大,表示算法的预测与样例的真实监测级别相差越远。
接着,***考虑每个日志学习样例的贡献度。如步骤S41中所述,贡献度是基于样例的未决系数来确定的,它反映了样例在训练过程中的重要性和影响力。未决系数较低的样例(即监测级别相对确定的样例)通常被赋予较高的贡献度,而未决系数较高的样例(即监测级别更不确定的样例)则被赋予较低的贡献度。
有了每个样例的级别确定误差和贡献度,***通过加权平均或其他类似的数学方法来计算整个日志学习样例库的总级别确定误差。在这个过程中,每个样例的误差都会被其贡献度所加权,以确保总误差的计算既考虑了算法预测的准确性,也考虑了不同样例在训练中的重要性。
例如,假设日志学习样例库中有三个样例A、B和C,它们的级别确定误差分别为0.1、0.2和0.3,而它们的贡献度分别为0.3、0.5和0.2。那么,整个日志学习样例库的总级别确定误差就可以通过以下方式计算得出:总误差=(0.1*0.3)+(0.2*0.5)+(0.3*0.2)。
通过步骤S44的执行,数据处理***能够获得一个量化的指标,即监测级别不确定的日志学习样例库的总级别确定误差。这个指标对于评估算法的性能、指导后续的算法优化和调整以及提升整个监测***的准确性都至关重要。
在步骤S45中,数据处理***的主要任务是根据监测级别不确定的日志学习样例库的级别确定误差来修正第一监测级别确定子算法的算法参数,并判断算法是否达到训练截止条件,以决定是否继续训练。
首先,***利用在步骤S44中计算得到的总级别确定误差来调整第一监测级别确定子算法的参数。这个调整过程通常是通过反向传播算法来实现的,在机器学习中被广泛用于训练神经网络和其他类型的模型。具体来说,***计算误差关于算法参数的梯度,然后按照梯度的反方向更新参数,以减小总级别确定误差。这样,算法在下一次迭代中就能更好地预测日志学习样例的监测级别。
例如,如果第一监测级别确定子算法是一个神经网络,那么***可以调整网络中的权重和偏置值,以使得网络在下次迭代时能够更准确地预测样例的监测级别。接下来,***检查第一监测级别确定子算法是否达到了训练截止条件。训练截止条件可以是多种多样的,例如达到预设的最大迭代次数、总级别确定误差收敛到某个阈值以下、或者在验证集上的性能不再显著提升等。如果算法达到了这些条件之一,***就会停止训练,认为算法已经足够成熟,可以应用于实际的监测级别确定任务中。如果算法尚未达到训练截止条件,那么***重复执行步骤S42到步骤S45,继续训练第一监测级别确定子算法。在这个过程中,***不断利用更新后的算法处理日志学习样例,重新计算级别倾向值和级别确定误差,并再次调整算法参数。这个过程一直迭代进行,直到算法满足训练截止条件为止。
通过步骤S45的执行,数据处理***能够逐步优化第一监测级别确定子算法的性能,使其在实际应用中能够更准确地确定日志学习样例的监测级别。
作为一种实施方式,各个监测级别不确定的日志学习样例的未决系数不小于0,所述步骤S41,依据各个监测级别不确定的日志学习样例的未决系数确定各个监测级别不确定的日志学习样例的贡献度,具体可以包括:将各个监测级别不确定的日志学习样例的未决系数除以第一设定值,得到相除结果;将所述相除结果乘以-1,得到相反结果;将所述相反结果作为预设常数的指数,得到各个监测级别不确定的日志学习样例的贡献度。
具体地,***先获取各个监测级别不确定的日志学习样例的未决系数。这些未决系数是非负的,表示样例级别的不确定性。接着,***将每个样例的未决系数除以一个预设的第一设定值。这个第一设定值是一个正数,用于标准化未决系数,使其处于一个合适的数值范围。例如,如果某个日志学习样例的未决系数为0.8,第一设定值为2,则相除结果为0.4。得到相除结果后,***将这些结果乘以-1,以得到相反结果。这一步是为了将原本表示不确定性的正值转换为负值,以便在后续步骤中通过指数函数转换为贡献度。继续上述例子,0.4乘以-1得到-0.4。最后,***使用预设常数(通常是一个正数,如自然对数的底数e)作为底数,将上一步得到的相反结果作为指数,计算各个监测级别不确定的日志学习样例的贡献度。贡献度是通过指数函数来计算的,这样可以使得未决系数较小的样例(即监测级别相对确定的样例)具有较大的贡献度,而未决系数较大的样例(即监测级别更不确定的样例)具有较小的贡献度。使用指数函数可以实现这种非线性的转换关系。
例如,如果设未决系数为u,第一设定值为a,预设常数为b(通常为e),则贡献度C的计算公式为:
C = b-u/a
继续上述例子,如果预设常数为e(自然对数的底数,约等于2.71828),则贡献度为e-0.4,这个值将是一个小于1但大于0的正数,表示该日志学习样例在训练过程中的相对重要性或贡献度。
通过这一系列步骤,数据处理***能够依据各个监测级别不确定的日志学习样例的未决系数,合理地确定它们的贡献度,为后续的训练和优化过程提供重要依据。
作为一种实施方式,所述步骤S44,通过各个监测级别不确定的日志学习样例的级别确定误差和贡献度,确定所述监测级别不确定的日志学习样例库的级别确定误差,具体可以包括:
步骤S441:依据第一样例集中各个监测级别不确定的日志学***均级别确定误差,确定为第一级别确定误差,其中,所述第一样例集包括所述监测级别不确定的日志学习样例库中通过所述第一监测级别确定子算法预估的监测级别倾向值大于所述真例阈值的监测级别不确定的日志学习样例;
步骤S442:依据第二样例集中各个监测级别不确定的日志学***均级别确定误差,确定为第二级别确定误差,其中所述第二样例集包括所述监测级别不确定的日志学习样例库中通过所述第一监测级别确定子算法预估的监测级别倾向值小于假例阈值的监测级别不确定的日志学习样例;
步骤S443:依据第三样例集中各个监测级别不确定的日志学***均级别确定误差,确定为第三级别确定误差,其中所述第三样例集包括所述监测级别不确定的日志学习样例库中通过所述第一监测级别确定子算法预估的监测级别倾向值不大于所述真例阈值且大于等于所述假例阈值的监测级别不确定的日志学习样例;
步骤S444:依据所述第一级别确定误差、所述第二级别确定误差和所述第三级别确定误差的权重平均值,确定得到所述监测级别不确定的日志学习样例库的级别确定误差;
其中,所述真例阈值是所述监测级别不确定的日志学习样例库的监测级别不确定的日志学习样例的监测级别倾向值中,各个代表真例的监测级别倾向值的均值;所述假例阈值为所述监测级别不确定的日志学习样例库的监测级别不确定的日志学习样例的监测级别倾向值中,各个代表假例的监测级别倾向值的均值。
在数据处理***中,步骤S441涉及到计算第一样例集中监测级别不确定的日志学***均级别确定误差,这个误差被确定为第一级别确定误差。第一样例集是由那些通过第一监测级别确定子算法预估的监测级别倾向值大于真例阈值的样例组成的。具体来说,***首先识别出所有监测级别倾向值大于真例阈值的日志学习样例,这些样例构成了第一样例集。真例阈值是一个重要的参考点,它通常是基于样例库中代表真实正例(即确实属于目标监测级别的样例)的样例的监测级别倾向值的均值来设定的。
接下来,***考虑第一样例集中的每个日志学习样例的贡献度和级别确定误差。贡献度反映了样例在训练过程中的重要性,它可能是基于样例的未决系数来计算的,未决系数越大,贡献度可能越小,表示该样例的不确定性较高。级别确定误差则是反映了样例被错误分类的程度,即算法预估的监测级别与样例实际级别之间的差异。
为了计算第一级别确定误差,***对第一样例集中的每个样例的级别确定误差进行加权求和,权重就是每个样例的贡献度。然后,***将这个加权求和的结果除以第一样例集中所有样例的贡献度之和,从而得到平均级别确定误差,即第一级别确定误差。
举例来说:假设有三个样例A、B、C属于第一样例集,它们的监测级别倾向值分别为0.8、0.9和0.75(假设真例阈值为0.7),而它们的实际监测级别都是1(表示正例)。如果第一监测级别确定子算法对这三个样例的预估级别分别是0.6、0.85和0.7,那么样例A、B、C的级别确定误差分别是0.2(即|0.6-1|)、0.15(即|0.85-1|)和0.05(即|0.7-1|)。假设基于未决系数计算得到的样例A、B、C的贡献度分别为0.5、0.3和0.2。
根据这些信息,***计算加权求和的级别确定误差:(0.20.5+0.150.3+0.05*0.2),然后将这个结果除以贡献度的总和(0.5+0.3+0.2),从而得到第一级别确定误差。这个误差值反映了第一样例集中样例在监测级别确定上的平均误差程度,有助于***评估和改进监测级别确定子算法的性能。
步骤S442主要关注那些被第一监测级别确定子算法预估为较不可能属于目标监测级别的日志学习样例,即监测级别倾向值小于假例阈值的样例,它们构成了第二样例集。首先,数据处理***识别出所有监测级别倾向值小于假例阈值的日志学习样例。假例阈值通常基于样例库中代表错误正例(即实际上不属于目标监测级别但被错误分类的样例)的样例的监测级别倾向值的均值来设定。这个阈值有助于***区分那些更可能是误报的样例。
接下来,与步骤S441类似,***考虑第二样例集中的每个日志学习样例的贡献度和级别确定误差。贡献度依然反映了样例在训练过程中的重要性,而级别确定误差则体现了算法预估的监测级别与样例实际级别之间的不匹配程度。
为了得到第二级别确定误差,***对第二样例集中的每个样例的级别确定误差进行加权处理,权重即为每个样例的贡献度。随后,***计算这些加权误差的总和,并除以第二样例集中所有样例的贡献度之和,从而得出平均级别确定误差,即第二级别确定误差。
举个例子,假设第二样例集中包含三个日志学习样例D、E和F。它们的监测级别倾向值分别为0.3、0.25和0.4(假设假例阈值为0.5),而它们的实际监测级别都是0(表示非目标监测级别)。如果第一监测级别确定子算法对这三个样例的预估级别分别是0.6、0.55和0.45,那么样例D、E和F的级别确定误差就分别是0.3(即|0.6-0|)、0.3(即|0.55-0|)和0.05(即|0.45-0|)。同时,基于未决系数,可以得到这三个样例的贡献度,比如分别为0.4、0.35和0.25。
根据这些信息,数据处理***计算加权求和的级别确定误差:(0.3*0.4+0.3*0.35+0.05*0.25),然后将这个结果除以贡献度的总和(0.4+0.35+0.25),从而得到第二级别确定误差。这个误差值反映了第二样例集中样例在监测级别确定上的平均误差程度,有助于***更全面地评估监测级别确定子算法的性能,并针对可能存在的误报情况进行优化。
步骤S443中,第三样例集包含通过第一监测级别确定子算法预估后,其监测级别倾向值位于真例阈值和假例阈值之间的样例,这些样例在分类上具有一定的不确定性。具体来说,***首先识别出所有监测级别倾向值既不大于真例阈值也不小于假例阈值的日志学习样例,它们构成了第三样例集。这些样例的特点是在分类决策时处于模棱两可的状态,既不是明确的正例,也不是明确的反例。
接下来,与步骤S441和S442不同的是,步骤S443在计算平均级别确定误差时,只考虑样例的级别确定误差,而不再涉及样例的贡献度。级别确定误差反映了算法预估的监测级别与样例实际级别之间的偏离程度。
为了得到第三级别确定误差,***简单地将第三样例集中所有样例的级别确定误差求和,然后除以样例的总数,从而计算出平均级别确定误差。这个平均值即代表了第三样例集中样例在监测级别确定上的平均不准确程度。
例如,假设第三样例集中有三个日志学习样例G、H、I,它们的监测级别倾向值分别为0.65、0.6和0.55(假设真例阈值为0.7,假例阈值为0.5)。同时,这三个样例的实际监测级别分别是1、0、1。如果第一监测级别确定子算法对这三个样例的预估级别是0.65、0.4和0.55,则样例G、H、I的级别确定误差分别为0.35(即|0.65-1|)、0.4(即|0.4-0|)和0.45(即|0.55-1|)。
数据处理***将这些级别确定误差求和,即0.35+0.4+0.45,然后除以样例的总数3,得到的结果就是第三级别确定误差。这个误差值反映了当样例的监测级别倾向值位于两个阈值之间时,算法在监测级别确定上的平均误差程度,这对后续优化算法性能、提高分类准确性具有重要的指导意义。
步骤S444综合考虑了前面步骤S441、S442和S443中计算得到的第一级别确定误差、第二级别确定误差和第三级别确定误差,通过权重平均值的方式得出一个综合的误差评估。
数据处理***回顾前三个步骤中计算出的各个级别确定误差。这些误差分别反映了不同监测级别倾向值区间的日志学***均误差。第二级别确定误差代表了那些监测级别倾向值小于假例阈值的样例(即更可能不属于目标监测级别的样例)的平均误差。第三级别确定误差则代表了那些监测级别倾向值位于真例阈值和假例阈值之间的样例(即分类较为模糊的样例)的平均误差。
接下来,***依据预设的权重,对这三个级别确定误差进行加权平均。权重的设定可以根据实际需求和经验进行调整,以反映不同区间样例在整体误差评估中的重要性。例如,如果认为接近真例阈值的样例误差更为重要,可以给予第一级别确定误差更高的权重。
通过计算这三个误差的加权平均值,数据处理***能够得出一个综合的监测级别确定误差。这个综合误差更全面地反映了监测级别不确定的日志学习样例库在监测级别确定上的整体性能,有助于***后续优化和改进。
举例来说,假设第一级别确定误差为0.15,第二级别确定误差为0.2,第三级别确定误差为0.25,并且根据重要性,给它们分别设定权重为0.4、0.3和0.3。那么,通过计算加权平均值:(0.15*0.4+0.2*0.3+0.25*0.3),数据处理***可以确定得到监测级别不确定的日志学习样例库的级别确定误差。
此外,真例阈值和假例阈值的设定是基于样例库中代表真例和假例的样例的监测级别倾向值的均值。这种设定方式能够更客观地反映样例库中不同类别样例的分布情况,从而更准确地指导后续的误差计算和性能评估。
步骤S5:通过所述训练后的第一监测级别确定子算法的算法参数,确定所述患者监测级别确定算法的算法参数。
需要明确的是,第一监测级别确定子算法在前面的步骤中已经经过了训练和验证,其算法参数已经通过优化过程得到了确定。这些参数反映了子算法在处理类似数据时所需的关键配置,包括但不限于决策阈值、权重系数、学习率等。
在步骤S5中,数据处理***提取这些经过训练验证的第一监测级别确定子算法的算法参数。这些参数可能是一组特定的数值,例如,在某个神经网络模型中,算法参数可能包括各层神经元的权重和偏置值。
随后,***利用这些提取出的算法参数来确定患者监测级别确定算法的算法参数。这通常涉及将第一监测级别确定子算法的参数映射或转移到患者监测级别确定算法中。这种映射可能是直接复制参数值,也可能是通过某种转换函数来调整参数以适应新的算法结构。
例如,假设第一监测级别确定子算法是一个支持向量机(SVM),其训练后的参数包括支持向量的集合和对应的拉格朗日乘子。在步骤S5中,如果患者监测级别确定算法也是一个SVM,那么可以直接将这些支持向量和拉格朗日乘子作为新算法的参数。如果患者监测级别确定算法是另一种类型的模型,如随机森林,那么可能需要通过特征重要性评估或其他方法来转换和利用这些参数。
总的来说,步骤S5确保了训练阶段获得的优化参数能够被有效利用于实际的患者监测级别确定算法中,从而提高了算法的准确性和可靠性。通过这种方式,数据处理***能够更有效地利用已有的数据和知识,为患者提供更加精确和及时的监测服务。
作为一种实施方式,所述步骤S5,通过所述训练后的第一监测级别确定子算法的算法参数,确定所述患者监测级别确定算法的算法参数,具体可以包括:将所述训练后的第一监测级别确定子算法的算法参数,确定为所述患者监测级别确定算法的算法参数。
在该实施方式中,将训练后的第一监测级别确定子算法的算法参数直接确定为患者监测级别确定算法的算法参数。具体来说,如果第一监测级别确定子算法经过训练后表现良好,其算法参数已经通过优化达到了较佳状态,那么这些参数可以直接被患者监测级别确定算法所采用。这样做的好处是节省了重新训练和调整患者监测级别确定算法参数的时间和计算资源,同时确保了患者监测级别确定算法能够继承第一监测级别确定子算法的良好性能。
例如,假设第一监测级别确定子算法是一个经过训练的决策树模型,其算法参数包括树的结构(如分支条件和叶节点值)以及相关的决策规则。在步骤S5的这一实施方式中,数据处理***将这个训练好的决策树模型的算法参数直接作为患者监测级别确定算法的算法参数。这意味着患者监测级别确定算法将使用与第一监测级别确定子算法相同的决策树结构和决策规则来进行患者监测级别的确定。通过这种方式,数据处理***能够高效地利用已经训练好的模型参数,提升患者监测级别确定算法的准确性和效率。同时,由于这种参数传递方式的直接性,也降低了算法实施过程中的复杂性和出错的可能性。
或者,作为另一种实施方式,所述步骤S5,通过所述训练后的第一监测级别确定子算法的算法参数,确定所述患者监测级别确定算法的算法参数,具体可以包括:
步骤S51:依据所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值修正所述各个监测级别不确定的日志学习样例的训练监督信息;
步骤S52:通过各个监测级别不确定的日志学习样例的未决系数和修正后的训练监督信息,以所述监测级别不确定的日志学习样例库为一个训练组对所述第二监测级别确定子算法进行分组训练,得到训练后的第二监测级别确定子算法;
步骤S53:对于所述训练后的第一监测级别确定子算法的任一参数,对所述任一参数与所述第二监测级别确定子算法的对应的参数进行平均,将平均值确定为所述患者监测级别确定算法对应的参数。
在该另一实施方式中,通过结合第一监测级别确定子算法和第二监测级别确定子算法的参数来确定患者监测级别确定算法的参数的方法。这一方式综合考虑了两个子算法的信息,以期提升最终患者监测级别确定算法的准确性和鲁棒性。
步骤S51中,数据处理***依据第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值来修正这些样例的训练监督信息。修正的目的是为了反映第二监测级别确定子算法对这些样例的级别判断,从而使得训练监督信息更加准确。例如,如果一个监测级别不确定的日志学习样例原本被标注为“真例”,但第二监测级别确定子算法预估其倾向值为“假例”,那么***可以将这个样例的训练监督信息修正为“假例”。
步骤S52涉及使用修正后的训练监督信息和各个监测级别不确定的日志学习样例的未决系数来对第二监测级别确定子算法进行分组训练。这里的分组训练意味着***将监测级别不确定的日志学习样例库作为一个独立的训练组,利用这个组内的样例来训练第二监测级别确定子算法。未决系数反映了样例的不确定性程度,可以在训练过程中作为权重来调整样例对训练结果的影响。通过这种方式,第二监测级别确定子算法能够更好地学习处理那些监测级别不确定的样例。
步骤S53是参数融合的过程。在这一步,数据处理***对于训练后的第一监测级别确定子算法的任一参数,与第二监测级别确定子算法对应的参数进行平均,并将这个平均值确定为患者监测级别确定算法对应的参数。这种参数平均的方式假设两个子算法在各自擅长的领域(即监测级别确定和监测级别不确定处理)内都有良好的表现,因此它们的参数平均值能够在一定程度上代表一个更全面的、鲁棒性更强的解决方案。
例如,假设第一监测级别确定子算法是一个逻辑回归模型,其参数包括回归系数和截距;第二监测级别确定子算法是一个支持向量机(SVM),其参数包括支持向量和对应的权重。在步骤S53中,***可以对这两个模型的某些对应参数(如回归系数和权重)进行平均,以得到一个融合了两者信息的新的逻辑回归模型或SVM模型,作为患者监测级别确定算法。
通过这种结合两个子算法参数的方式,数据处理***能够充分利用第一监测级别确定子算法和第二监测级别确定子算法的优势,从而提升患者监测级别确定算法的整体性能。
本申请实施例还提供了一种数据处理***,如图2所示,数据处理***100包括:处理器101和存储器103。其中,处理器101和存储器103相连,如通过总线102相连。可选地,数据处理***100还可以包括收发器104。需要说明的是,实际应用中收发器104不限于一个,该数据处理***100的结构并不构成对本申请实施例的限定。
处理器101可以是CPU,通用处理器,GPU,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器101也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线102可包括一通路,在上述组件之间传送信息。总线102可以是PCI总线或EISA总线等。总线102可以分为地址总线、数据总线、控制总线等。为便于表示,图2中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器103用于存储执行本申请方案的应用程序代码,并由处理器101来控制执行。处理器101用于执行存储器103中存储的应用程序代码,以实现前述任一方法实施例所示的内容。
本申请实施例提供了一种数据处理***,本申请实施例中的数据处理***包括:一个或多个处理器;存储器;一个或多个计算机程序,其中一个或多个计算机程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序被处理器执行时,实现上述方法。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当计算机程序在处理器上运行时,使得处理器可以执行前述方法实施例中相应的内容。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (9)

1.一种基于智慧病房呼叫***的数据处理方法,其特征在于,所述方法包括:
获取健康监测日志,所述健康监测日志包括针对目标患者在目标监测周期内获取得到的健康数据和呼叫***触发数据;
调用患者监测级别确定算法对所述健康监测日志进行监测级别确定,得到对应的目标患者的监测级别;所述患者监测级别确定算法通过日志学习样例库训练得到,所述日志学习样例库包括监测级别确定的日志学习样例库和监测级别不确定的日志学习样例库,所述患者监测级别确定算法的训练过程包括:
将各个监测级别确定的日志学习样例的训练监督信息标注为真例,各个监测级别不确定的日志学习样例的训练监督信息标注为假例,通过各个日志学习样例的训练监督信息,以所述日志学习样例库为一个训练组对所述患者监测级别确定算法进行分组训练,得到第一监测级别确定子算法和所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,并得到第二监测级别确定子算法和所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,其中,所述第一监测级别确定子算法为历经M个分组训练获得的,所述第二监测级别确定子算法为历经N个分组训练获得的,所述M不等于N,并在所述分组训练中依据所述日志学习样例库的级别确定误差修正所述患者监测级别确定算法的算法参数;
依据所述第一监测级别确定子算法和所述第二监测级别确定子算法分别针对所述监测级别不确定的日志学习样例库中各个监测级别不确定的日志学习样例预估的监测级别倾向值间的误差计算所述各个监测级别不确定的日志学习样例的未决系数;
依据所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值修正所述各个监测级别不确定的日志学习样例的训练监督信息;
通过各个监测级别不确定的日志学习样例的未决系数和修正后的训练监督信息,以所述监测级别不确定的日志学习样例库为一个训练组对所述第一监测级别确定子算法进行分组训练,得到训练后的第一监测级别确定子算法;
通过所述训练后的第一监测级别确定子算法的算法参数,确定所述患者监测级别确定算法的算法参数;
其中,所述依据所述第一监测级别确定子算法和所述第二监测级别确定子算法分别针对所述监测级别不确定的日志学习样例库中各个监测级别不确定的日志学习样例预估的监测级别倾向值之间的误差计算所述各个监测级别不确定的日志学习样例的未决系数,包括:
确定第一监测级别确定子算法和第二监测级别确定子算法分别对各个监测级别不确定的日志学习样例预估的监测级别倾向值之间的绝对偏差量,确定为各个监测级别不确定的日志学习样例的第一误差;
确定第一监测级别确定子算法和第二监测级别确定子算法分别对各个监测级别不确定的日志学习样例预估的监测级别倾向值之间的绝对和值,确定为各个监测级别不确定的日志学习样例的第二误差;
确定各个监测级别不确定的日志学习样例的未决系数,其中各个监测级别不确定的日志学习样例的未决系数与所述各个监测级别不确定的日志学习样例的第一误差正向关联,且与所述各个监测级别不确定的日志学习样例的第二误差反向关联。
2.如权利要求1所述的方法,其特征在于,所述依据所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值修正所述各个监测级别不确定的日志学习样例的训练监督信息,包括:
对于所述监测级别不确定的日志学习样例库中的各个监测级别不确定的日志学习样例,如果所述第一监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值大于真例阈值,将所述监测级别不确定的日志学习样例的训练监督信息修正为真例;如果所述第一监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值不大于所述真例阈值,将所述监测级别不确定的日志学习样例的训练监督信息修正为假例。
3.如权利要求2所述的方法,其特征在于,所述通过各个监测级别不确定的日志学习样例的未决系数和修正后的训练监督信息,以所述监测级别不确定的日志学习样例库为一个训练组对所述第一监测级别确定子算法进行分组训练,包括:
依据各个监测级别不确定的日志学习样例的未决系数确定各个监测级别不确定的日志学习样例的贡献度,所述贡献度与所述未决系数负相关;
通过所述第一监测级别确定子算法确定各个监测级别不确定的日志学习样例的级别倾向值;
依据各个监测级别不确定的日志学习样例的训练监督信息和级别倾向值确定各个监测级别不确定的级别确定误差;
通过各个监测级别不确定的日志学习样例的级别确定误差和贡献度,确定所述监测级别不确定的日志学习样例库的级别确定误差;
依据所述监测级别不确定的日志学习样例库的级别确定误差修正所述第一监测级别确定子算法的算法参数;
如果所述第一监测级别确定子算法达到训练截止条件,则停止训练;如果所述第一监测级别确定子算法未达到训练截止条件,则重复通过所述第一监测级别确定子算法确定各个监测级别不确定的日志学习样例的监测级别,到依据所述监测级别不确定的日志学习样例库的级别确定误差修正所述第一监测级别确定子算法的算法参数的步骤。
4.如权利要求3所述的方法,其特征在于,各个监测级别不确定的日志学习样例的未决系数不小于0,所述依据各个监测级别不确定的日志学习样例的未决系数确定各个监测级别不确定的日志学习样例的贡献度,包括:
将各个监测级别不确定的日志学习样例的未决系数除以第一设定值,得到相除结果;
将所述相除结果乘以-1,得到相反结果;
将所述相反结果作为预设常数的指数,得到各个监测级别不确定的日志学习样例的贡献度。
5.如权利要求3所述的方法,其特征在于,所述通过各个监测级别不确定的日志学习样例的级别确定误差和贡献度,确定所述监测级别不确定的日志学习样例库的级别确定误差,包括:
依据第一样例集中各个监测级别不确定的日志学***均级别确定误差,确定为第一级别确定误差,其中,所述第一样例集包括所述监测级别不确定的日志学习样例库中通过所述第一监测级别确定子算法预估的监测级别倾向值大于所述真例阈值的监测级别不确定的日志学习样例;
依据第二样例集中各个监测级别不确定的日志学***均级别确定误差,确定为第二级别确定误差,其中所述第二样例集包括所述监测级别不确定的日志学习样例库中通过所述第一监测级别确定子算法预估的监测级别倾向值小于假例阈值的监测级别不确定的日志学习样例;
依据第三样例集中各个监测级别不确定的日志学***均级别确定误差,确定为第三级别确定误差,其中所述第三样例集包括所述监测级别不确定的日志学习样例库中通过所述第一监测级别确定子算法预估的监测级别倾向值不大于所述真例阈值且大于等于所述假例阈值的监测级别不确定的日志学习样例;
依据所述第一级别确定误差、所述第二级别确定误差和所述第三级别确定误差的权重平均值,确定得到所述监测级别不确定的日志学习样例库的级别确定误差;
其中,所述真例阈值是所述监测级别不确定的日志学习样例库的监测级别不确定的日志学习样例的监测级别倾向值中,各个代表真例的监测级别倾向值的均值;所述假例阈值为所述监测级别不确定的日志学习样例库的监测级别不确定的日志学习样例的监测级别倾向值中,各个代表假例的监测级别倾向值的均值。
6.如权利要求1~5任一项所述的方法,其特征在于,所述通过各个日志学习样例的训练监督信息,以所述日志学习样例库为一个训练组对所述患者监测级别确定算法进行分组训练,得到第一监测级别确定子算法和所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,以及第二监测级别确定子算法和所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,包括:
在所述患者监测级别确定算法的所述M个分组训练中,将第M个训练组训练的对各个监测级别不确定的日志学习样例的级别倾向值确定为所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值;
在所述患者监测级别确定算法的所述N个分组训练中,将第N个训练组训练的对各个监测级别不确定的日志学习样例的级别倾向值确定为所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值;
或者;
所述通过各个日志学习样例的训练监督信息,以所述日志学习样例库为一个训练组对所述患者监测级别确定算法进行分组训练,得到第一监测级别确定子算法和所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,以及第二监测级别确定子算法和所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,包括:
基于设定调节权值,确定所述患者监测级别确定算法针对各个监测级别不确定的日志学***均结果,确定为所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值;
基于所述设定调节权值,确定所述患者监测级别确定算法针对各个监测级别不确定的日志学***均结果,确定为所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值;
或者;
所述通过各个日志学习样例的训练监督信息,以所述日志学习样例库为一个训练组对所述患者监测级别确定算法进行分组训练,得到第一监测级别确定子算法和所述第一监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,以及第二监测级别确定子算法和所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值,包括:
对于各个监测级别不确定的日志学习样例,将所述患者监测级别确定算法在第一分组训练中对所述监测级别不确定的日志学习样例的级别倾向值与第二设定值的积确定为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第一分组训练预估的监测级别倾向值,所述第二设定值的取值范围为(0,1);
依据下述公式确定所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的其他分组训练预估的监测级别倾向值:
pm(s)=f*pm-1(s)+e*qm(s),
其中,s为所述监测级别不确定的日志学习样例;m为分组训练的组序号;pm(s)为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第m分组训练预估的监测级别倾向值;pm-1(s)为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第m分组的前一分组训练预估的监测级别倾向值;e为所述第二设定值,f=1-e;qm(s)为所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的第m分组训练的级别倾向值;
将所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的所述M个分组训练的监测级别倾向值,确定为所述第一监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值;
将所述监测级别不确定的日志学习样例在所述患者监测级别确定算法的所述N个分组训练的监测级别倾向值,确定为所述第二监测级别确定子算法对所述监测级别不确定的日志学习样例预估的监测级别倾向值。
7.如权利要求1~5任一项所述的方法,其特征在于,所述通过所述训练后的第一监测级别确定子算法的算法参数,确定所述患者监测级别确定算法的算法参数,包括:
将所述训练后的第一监测级别确定子算法的算法参数,确定为所述患者监测级别确定算法的算法参数。
8.如权利要求1~5任一项所述的方法,其特征在于,所述通过所述训练后的第一监测级别确定子算法的算法参数,确定所述患者监测级别确定算法的算法参数,包括:
依据所述第二监测级别确定子算法针对各个监测级别不确定的日志学习样例预估的监测级别倾向值修正所述各个监测级别不确定的日志学习样例的训练监督信息;
通过各个监测级别不确定的日志学习样例的未决系数和修正后的训练监督信息,以所述监测级别不确定的日志学习样例库为一个训练组对所述第二监测级别确定子算法进行分组训练,得到训练后的第二监测级别确定子算法;
对于所述训练后的第一监测级别确定子算法的任一参数,对所述任一参数与所述第二监测级别确定子算法的对应的参数进行平均,将平均值确定为所述患者监测级别确定算法对应的参数。
9.一种数据处理***,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个计算机程序;其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序被所述处理器执行时,实现如权利要求1~8任一项所述的方法。
CN202410451964.1A 2024-04-16 2024-04-16 基于智慧病房呼叫***的数据处理方法及数据处理*** Active CN118053602B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410451964.1A CN118053602B (zh) 2024-04-16 2024-04-16 基于智慧病房呼叫***的数据处理方法及数据处理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410451964.1A CN118053602B (zh) 2024-04-16 2024-04-16 基于智慧病房呼叫***的数据处理方法及数据处理***

Publications (2)

Publication Number Publication Date
CN118053602A CN118053602A (zh) 2024-05-17
CN118053602B true CN118053602B (zh) 2024-06-25

Family

ID=91050485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410451964.1A Active CN118053602B (zh) 2024-04-16 2024-04-16 基于智慧病房呼叫***的数据处理方法及数据处理***

Country Status (1)

Country Link
CN (1) CN118053602B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113014881A (zh) * 2021-03-08 2021-06-22 南通市第一人民医院 一种神经外科患者日常监护方法及***
CN117711604A (zh) * 2023-12-13 2024-03-15 首都医科大学宣武医院 一种患者监护***

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183577A (zh) * 2020-08-31 2021-01-05 华为技术有限公司 一种半监督学习模型的训练方法、图像处理方法及设备
CN115130366A (zh) * 2021-03-26 2022-09-30 阿里巴巴新加坡控股有限公司 机器学习模型的优化、预测方法、设备及存储介质
CN114822741A (zh) * 2022-04-26 2022-07-29 平安科技(深圳)有限公司 患者分类模型的处理装置、计算机设备及存储介质
CN117877734A (zh) * 2024-02-06 2024-04-12 宁波市鄞州区疾病预防控制中心 一种精神障碍患者危险级别判断***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113014881A (zh) * 2021-03-08 2021-06-22 南通市第一人民医院 一种神经外科患者日常监护方法及***
CN117711604A (zh) * 2023-12-13 2024-03-15 首都医科大学宣武医院 一种患者监护***

Also Published As

Publication number Publication date
CN118053602A (zh) 2024-05-17

Similar Documents

Publication Publication Date Title
Alaa et al. Personalized risk scoring for critical care prognosis using mixtures of gaussian processes
CN108351862B (zh) 利用人工智能和用户输入来确定发育进展的方法和装置
Akter et al. Comprehensive performance assessment of deep learning models in early prediction and risk identification of chronic kidney disease
CN112017789B (zh) 分诊数据处理方法、装置、设备及介质
Sotoodeh et al. Improving length of stay prediction using a hidden Markov model
KR102501525B1 (ko) 시계열 데이터 처리 장치 및 이의 동작 방법
Perumal et al. Early prediction of coronary heart disease from cleveland dataset using machine learning techniques
JP7471471B2 (ja) 透析医療記録における不揃いな時系列に対するロバストな予測システム
CN112988538B (zh) 人工智能开发平台监控告警数据预测方法、装置及介质
Ben Amor et al. AUDIT: anomalous data detection and Isolation approach for mobile healThcare systems
CN111968750B (zh) 一种服务器、数据处理方法、装置及可读存储介质
CN112017742B (zh) 分诊数据处理方法、装置、计算机设备及存储介质
Alharbi et al. Prediction of dental implants using machine learning algorithms
CN110603547A (zh) 医疗不良事件预测、报告和预防
CN113255735A (zh) 患者用药方案的确定方法及确定装置
Kumari et al. An ensemble learning-based model for effective chronic kidney disease prediction
CN118053602B (zh) 基于智慧病房呼叫***的数据处理方法及数据处理***
CN113707336A (zh) 基于数据分析的传染病防治预警方法、装置、设备及介质
Ibrahim et al. Handling missing and outliers values by enhanced algorithms for an accurate diabetic classification system
CN109003193B (zh) 投保风险预测方法、装置、计算机设备和存储介质
US20220406463A1 (en) System and method for providing wellness recommendation
CN115482928A (zh) 基于人工智能的数据预测方法、装置、设备及存储介质
Balasubramaniyan et al. Flock optimization induced deep learning for improved diabetes disease classification
Saraswathi et al. Designing the Prediction Protocol based on Sparrow Search Optimization Algorithm with Vibrational Auto Encoder in E-Healthcare
Girijakumari Sreekantan Nair et al. A precise sensor fault detection technique using statistical techniques for wireless body area networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant