CN117153164A - 基于区块链的远程诊疗数据智能存储方法及*** - Google Patents

基于区块链的远程诊疗数据智能存储方法及*** Download PDF

Info

Publication number
CN117153164A
CN117153164A CN202311402145.XA CN202311402145A CN117153164A CN 117153164 A CN117153164 A CN 117153164A CN 202311402145 A CN202311402145 A CN 202311402145A CN 117153164 A CN117153164 A CN 117153164A
Authority
CN
China
Prior art keywords
voice
doctor
patient
module
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311402145.XA
Other languages
English (en)
Other versions
CN117153164B (zh
Inventor
吴昊
王慎玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Normal University
Original Assignee
Beijing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University filed Critical Beijing Normal University
Priority to CN202311402145.XA priority Critical patent/CN117153164B/zh
Publication of CN117153164A publication Critical patent/CN117153164A/zh
Application granted granted Critical
Publication of CN117153164B publication Critical patent/CN117153164B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于区块链的远程诊疗数据智能存储方法及***,涉及数据处理技术领域。该方法包括:获取患者的病情描述语音信号;对患者身份进行识别;对患者的病情描述语音信号进行识别,在预置的医生数据库中匹配对应的看诊医生;获取看诊医生的语音信号,对看诊医生的身份进行识别;采集看诊医生的语音信息和患者的语音信息,对看诊医生的语音信息和患者的语音信息分别进行识别;将患者身份信息、看诊医生身份信息、就诊时间、看诊医生语音识别结果和患者语音识别结果上传至区块链,实现上链存储。本发明结合多种智能模型,实现精准高效的人员身份、语音内容识别以及图像压缩;并将核心数据上链存储,大大提高了数据安全性。

Description

基于区块链的远程诊疗数据智能存储方法及***
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种基于区块链的远程诊疗数据智能存储方法及***。
背景技术
随着科技的进步,患者不必再亲自前往医院就诊,而是可以通过网络平台实现远程诊疗。远程诊疗不仅可以突破地域限制,让更多的患者享受到优质医疗资源;而且可以节省人力、时间成本,并节省患者的交通等费用。然而,在远程诊疗过程中会出现海量的数据,传统的存储方式往往会消耗巨大的存储资源。随着信息技术的不断更新换代,能够为相关数据的智能存储提供直接支持;同时,区块链技术作为近年来的新兴技术,能够保证存储***的可靠性。因此,提出一种基于区块链的远程诊疗数据智能存储方法及***有非常重要的价值和意义。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明提供一种基于区块链的远程诊疗数据智能存储方法及***,结合基于编码聚类的多重校验式声纹识别模型、基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,实现精准高效的人员身份、语音内容识别;并结合区块链技术将核心数据上链存储,大大提高了数据安全性。
为解决上述技术问题,本发明采用的技术方案为:
第一方面,本发明提供一种基于区块链的远程诊疗数据智能存储方法,包括以下步骤:
获取患者的病情描述语音信号;
利用基于编码聚类的多重校验式声纹识别模型,根据患者的病情描述语音信号对患者身份进行识别,以得到患者身份信息;
利用语音识别模型对患者的病情描述语音信号进行识别,以得到并根据识别结果在预置的医生数据库中匹配对应的看诊医生,并向对应的看诊医生发送提醒信息;
获取看诊医生的语音信号,并利用基于编码聚类的多重校验式声纹识别模型,对看诊医生的身份进行识别,以得到看诊医生身份信息;确认医生身份后,进行就诊,记录就诊时间;
在看诊医生和患者交流过程中,实时采集看诊医生的语音信息和患者的语音信息,并利用基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对看诊医生的语音信息和患者的语音信息分别进行识别,以得到看诊医生语音识别结果和患者语音识别结果;
将患者身份信息、看诊医生身份信息、就诊时间、看诊医生语音识别结果和患者语音识别结果上传至区块链,实现上链存储。
首先,本发明提出了基于编码聚类的多重校验式声纹识别模型,对说话人的身份进行识别;该模型将语音信号等分且编码后实现聚类,在每个聚类簇中均选取一段语音信号进行声纹识别,如果声纹识别结果均一致才能够认定身份识别结果有效,显著地提升了声纹识别的精准度。其次,本发明提出了基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对语音信号进行识别;该模型首先利用多个语音识别模块分别对语音信号进行识别,当识别结果一致时再利用语义检测模块对语音识别结果的语义合理性进行检测,显著地提升了语音信号的识别精准度。最后,本发明利用了区块链技术,将医生及患者的身份信息、就诊时间、医生语音信号识别结果、患者语音信号识别结果进行上链存储,提升了数据安全性。
基于第一方面,进一步地,该基于区块链的远程诊疗数据智能存储方法还包括以下步骤:
获取患者的诊疗图像,利用基于图像精准去噪和压缩结果优选联合应用的智能压缩模型对诊疗图像进行压缩,以得到并将诊疗图像压缩结果上传至区块链。
基于第一方面,进一步地,上述利用基于图像精准去噪和压缩结果优选联合应用的智能压缩模型对诊疗图像进行压缩的方法包括以下步骤:
将多个采用不同图像压缩方法的压缩模块进行并联,各个压缩模块的信号输入端共同连接预置的图像精准去噪模块,各个压缩模块的信号输出端共同连接压缩比检测模块,压缩比检测模块的信号输出端连接失真度检测模块,以得到智能压缩模型;
采用智能压缩模型对诊疗图像进行压缩。
基于第一方面,进一步地,上述图像精准去噪模块用于将图像等分为多个区域,并检测各个区域的峰值信噪比,对低于预置的信噪比阈值的区域进行去噪。
基于第一方面,进一步地,上述采用智能压缩模型对诊疗图像进行压缩的方法包括以下步骤:
将诊疗图像输入到智能压缩模型中,通过图像精准去噪模块对诊疗图像进行去噪,以得到去噪后图像;
将去噪后图像输入到各个压缩模块中进行压缩,以得到多个图像压缩结果;
将多个图像压缩结果输入到压缩比检测模块进行检测,输出压缩比最高的图像压缩结果;
将压缩比最高的图像压缩结果输入到失真度检测模块,以得到失真度检测结果,若该失真度检测结果小于预置的失真度阈值,则将该压缩比最高的图像压缩结果输出为最终的诊疗图像压缩结果。
基于第一方面,进一步地,上述利用基于编码聚类的多重校验式声纹识别模型,根据患者的病情描述语音信号对患者身份进行识别的方法包括以下步骤:
将患者的病情描述语音信号进行多等分处理,以得到多段等分语音信号;
将各段等分语音信号进行编码,并利用聚类算法将多个等分语音信号进行聚类,以得到多个聚类簇;
在每个聚类簇中的任选一段等分语音信号,并利用声纹识别模型对选取的等分语音信号进行识别,以得到多个身份识别结果;
若多个身份识别结果一致,则认定身份识别结果有效并将该身份识别结果输出为最终的患者身份信息。
基于第一方面,进一步地,上述利用基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对看诊医生的语音信息和患者的语音信息分别进行识别的方法包括以下步骤:
将多个采用不同语音识别算法的语音识别网络模块进行并联,各个语音识别网络模块的信号输出端共同连接语音识别结果比对模块,语音识别结果比对模块的信号输出端连接语义检测模块,以组成端到端的语音识别模型;
采用该端到端的语音识别模型对看诊医生的语音信息和患者的语音信息分别进行识别。
第二方面,本发明提供一种基于区块链的远程诊疗数据智能存储***,包括患者语音获取模块、患者身份识别模块、医生匹配模块、医生身份识别模块、就诊识别模块以及数据上链模块,其中:
患者语音获取模块,用于获取患者的病情描述语音信号;
患者身份识别模块,用于利用基于编码聚类的多重校验式声纹识别模型,根据患者的病情描述语音信号对患者身份进行识别,以得到患者身份信息;
医生匹配模块,用于利用语音识别模型对患者的病情描述语音信号进行识别,以得到并根据识别结果在预置的医生数据库中匹配对应的看诊医生,并向对应的看诊医生发送提醒信息;
医生身份识别模块,用于获取看诊医生的语音信号,并利用基于编码聚类的多重校验式声纹识别模型,对看诊医生的身份进行识别,以得到看诊医生身份信息;确认医生身份后,进行就诊,记录就诊时间;
就诊识别模块,用于在看诊医生和患者交流过程中,实时采集看诊医生的语音信息和患者的语音信息,并利用基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对看诊医生的语音信息和患者的语音信息分别进行识别,以得到看诊医生语音识别结果和患者语音识别结果;
数据上链模块,用于将患者身份信息、看诊医生身份信息、就诊时间、看诊医生语音识别结果和患者语音识别结果上传至区块链,实现上链存储。
本***通过患者语音获取模块、患者身份识别模块、医生匹配模块、医生身份识别模块、就诊识别模块以及数据上链模块的配合,结合基于编码聚类的多重校验式声纹识别模型、基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,实现精准高效的人员身份、语音内容识别;并结合区块链技术将核心数据上链存储,大大提高了数据安全性。首先,本发明提出了基于编码聚类的多重校验式声纹识别模型,对说话人的身份进行识别;该模型将语音信号等分且编码后实现聚类,在每个聚类簇中均选取一段语音信号进行声纹识别,如果声纹识别结果均一致才能够认定身份识别结果有效,显著地提升了声纹识别的精准度。其次,本发明提出了基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对语音信号进行识别;该模型首先利用多个语音识别模块分别对语音信号进行识别,当识别结果一致时再利用语义检测模块对语音识别结果的语义合理性进行检测,显著地提升了语音信号的识别精准度。最后,本发明利用了区块链技术,将医生及患者的身份信息、就诊时间、医生语音信号识别结果、患者语音信号识别结果进行上链存储,提升了数据安全性。
第三方面,本申请提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器;当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
本发明至少具有如下优点或有益效果:
1、本发明提出了基于编码聚类的多重校验式声纹识别模型,对说话人的身份进行识别;该模型将语音信号等分且编码后实现聚类,在每个聚类簇中均选取一段语音信号进行声纹识别,如果声纹识别结果均一致才能够认定身份识别结果有效,显著地提升了声纹识别的精准度。
2、本发明提出了基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对语音信号进行识别;该模型首先利用多个语音识别模块分别对语音信号进行识别,当识别结果一致时再利用语义检测模块对语音识别结果的语义合理性进行检测,显著地提升了语音信号的识别精准度。
3、本发明提出了基于图像精准去噪和压缩结果优选联合应用的智能压缩模型,对图像进行压缩;该模型首先对图像进行精准去噪,并在多个压缩结果中优选出符合要求的压缩图像,不仅降低了噪声干扰而且确保了图像的压缩质量。
4、本发明利用了区块链技术,将医生及患者的身份信息、就诊时间、医生语音信号识别结果、患者语音信号识别结果、诊疗图像压缩结果进行上链存储,提升了***的安全性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一种基于区块链的远程诊疗数据智能存储方法的流程图;
图2为本发明实施例一种基于区块链的远程诊疗数据智能存储***的原理框图;
图3为本发明实施例提供的一种电子设备的结构框图。
附图标记说明:100、患者语音获取模块;200、患者身份识别模块;300、医生匹配模块;400、医生身份识别模块;500、就诊识别模块;600、数据上链模块;101、存储器;102、处理器;103、通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明实施例的描述中,“多个”代表至少2个。
实施例
如图1所示,第一方面,本发明提供一种基于区块链的远程诊疗数据智能存储方法,包括以下步骤:
S1、获取患者的病情描述语音信号;某位患者在电脑前简单描述自己的病情,音视频提取设备自动提取语音信号。
S2、利用基于编码聚类的多重校验式声纹识别模型,根据患者的病情描述语音信号对患者身份进行识别,以得到患者身份信息;
进一步地,包括:将患者的病情描述语音信号进行多等分处理,以得到多段等分语音信号;将各段等分语音信号进行编码,并利用聚类算法将多个等分语音信号进行聚类,以得到多个聚类簇;在每个聚类簇中的任选一段等分语音信号,并利用声纹识别模型对选取的等分语音信号进行识别,以得到多个身份识别结果;若多个身份识别结果一致,则认定身份识别结果有效并将该身份识别结果输出为最终的患者身份信息。
在本发明的一些实施例中,利用基于编码聚类的多重校验式声纹识别模型对该患者的身份进行识别,具体包括:对该语音信号进行20等分,并对每段等分后的语音信号进行编码。利用聚类算法(仅利用无预设类别数目的算法)将20段语音信号实现聚类,得到若干个聚类簇。对于某一个聚类簇,任选该簇中的一段语音信号,利用声纹识别模型进行识别,得到说话人身份信息。对于所有簇,都利用上述方法完成说话人身份信息的识别,如果身份信息的识别结果一致,认定身份识别结果有效并最终得到说话人的身份信息。
S3、利用语音识别模型对患者的病情描述语音信号进行识别,以得到并根据识别结果在预置的医生数据库中匹配对应的看诊医生,并向对应的看诊医生发送提醒信息;利用语音识别技术,对该语音信号进行识别,***根据识别结果自动分配一个业务匹配度较高的医生。
S4、获取看诊医生的语音信号,并利用基于编码聚类的多重校验式声纹识别模型,对看诊医生的身份进行识别,以得到看诊医生身份信息;确认医生身份后,进行就诊,记录就诊时间;
在本发明的一些实施例中,医生接到短信提醒后,在电脑前任意说出一段话。音视频提取设备自动提取该语音信号,
利用基于编码聚类的多重校验式声纹识别模型对其身份进行识别,确认看诊医生的身份无误后,该医生开始与患者进行交流。利用基于编码聚类的多重校验式声纹识别模型进行身份识别具体包括:对该语音信号进行20等分,并对每段等分后的语音信号进行编码。利用聚类算法(仅利用无预设类别数目的算法)将20段语音信号实现聚类,得到若干个聚类簇。对于某一个聚类簇,任选该簇中的一段语音信号,利用声纹识别模型进行识别,得到说话人身份信息。对于所有簇,都利用上述方法完成说话人身份信息的识别,如果身份信息的识别结果一致,认定身份识别结果有效并最终得到说话人的身份信息。
S5、在看诊医生和患者交流过程中,实时采集看诊医生的语音信息和患者的语音信息,并利用基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对看诊医生的语音信息和患者的语音信息分别进行识别,以得到看诊医生语音识别结果和患者语音识别结果;
进一步地,包括:将多个采用不同语音识别算法的语音识别网络模块进行并联,各个语音识别网络模块的信号输出端共同连接语音识别结果比对模块,语音识别结果比对模块的信号输出端连接语义检测模块,以组成端到端的语音识别模型;采用该端到端的语音识别模型对看诊医生的语音信息和患者的语音信息分别进行识别。
在本发明的一些实施例中,在医生和患者交流的过程中,音视频设备自动提取医生的语音信号、患者的语音信号。利用基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对医生的语音信号、患者的语音信号分别进行识别,得到医生语音信号识别结果、患者语音信号识别结果。基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型具体包括:将语音识别网络模块A、语音识别网络模块B、语音识别网络模块C进行并联(几个网络模块用到的语音识别算法各不相同),在它们的后端共同连接一个语音识别结果比对模块,在语音识别结果比对模块后面连接一个语义检测模块,上述模块共同组成端到端的语音识别模型。首先,输入语音信号经过音识别网络模块A,得到语音识别结果A;输入语音信号经过语音识别网络模块B,得到语音识别结果B;输入语音信号经过语音识别网络模块C,得到语音识别结果C。接下来,语音识别结果A、语音识别结果B、语音识别结果C共同经过语音识别结果比对模块,三种语音识别结果一致则继续进入语义检测模块,语音识别结果语义合理才将最终的语音识别结果输出。
S6、将患者身份信息、看诊医生身份信息、就诊时间、看诊医生语音识别结果和患者语音识别结果上传至区块链,实现上链存储。
首先,本发明提出了基于编码聚类的多重校验式声纹识别模型,对说话人的身份进行识别;该模型将语音信号等分且编码后实现聚类,在每个聚类簇中均选取一段语音信号进行声纹识别,如果声纹识别结果均一致才能够认定身份识别结果有效,显著地提升了声纹识别的精准度。其次,本发明提出了基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对语音信号进行识别;该模型首先利用多个语音识别模块分别对语音信号进行识别,当识别结果一致时再利用语义检测模块对语音识别结果的语义合理性进行检测,显著地提升了语音信号的识别精准度。最后,本发明利用了区块链技术,将医生及患者的身份信息、就诊时间、医生语音信号识别结果、患者语音信号识别结果进行上链存储,提升了数据安全性。
基于第一方面,进一步地,该基于区块链的远程诊疗数据智能存储方法还包括以下步骤:
获取患者的诊疗图像,利用基于图像精准去噪和压缩结果优选联合应用的智能压缩模型对诊疗图像进行压缩,以得到并将诊疗图像压缩结果上传至区块链。
进一步地,包括:将多个采用不同图像压缩方法的压缩模块进行并联,各个压缩模块的信号输入端共同连接预置的图像精准去噪模块,各个压缩模块的信号输出端共同连接压缩比检测模块,压缩比检测模块的信号输出端连接失真度检测模块,以得到智能压缩模型;采用智能压缩模型对诊疗图像进行压缩。上述图像精准去噪模块用于将图像等分为多个区域,并检测各个区域的峰值信噪比,对低于预置的信噪比阈值的区域进行去噪。
进一步地,包括:将诊疗图像输入到智能压缩模型中,通过图像精准去噪模块对诊疗图像进行去噪,以得到去噪后图像;将去噪后图像输入到各个压缩模块中进行压缩,以得到多个图像压缩结果;将多个图像压缩结果输入到压缩比检测模块进行检测,输出压缩比最高的图像压缩结果;将压缩比最高的图像压缩结果输入到失真度检测模块,以得到失真度检测结果,若该失真度检测结果小于预置的失真度阈值,则将该压缩比最高的图像压缩结果输出为最终的诊疗图像压缩结果。
在本发明的一些实施例中,在医生和患者交流的过程中,若患者上传了近期的诊疗图像供医生参考,则利用基于图像精准去噪和压缩结果优选联合应用的智能压缩模型对图像进行压缩,得到诊疗图像压缩结果。
基于图像精准去噪和压缩结果优选联合应用的智能压缩模型具体包括:将压缩模块A、压缩模块B、压缩模块C进行并联(不同的压缩模块中分别使用不同的有损图像压缩方法),在它们前端共同连接一个图像精准去噪模块(它能够将图像等分为多个区域,并检测每个区域的峰值信噪比,仅对峰值信噪比较低的区域进行去噪),它们末端共同连接一个压缩比检测模块(它能够将不同的图像压缩结果进行比对,并仅将压缩比最高的图像压缩结果输出),压缩比检测模块后端再连接一个失真度检测模块(它能够对图像压缩结果的失真度进行检测,如果没有出现较大失真则将此图像压缩结果进行输出)。具体地,某一幅图像经过图像精准去噪模块,得到去噪后图像。该去噪后图像经过压缩模块A,得到图像压缩结果A;经过压缩模块B,得到图像压缩结果B;经过压缩模块C,得到图像压缩结果C。图像压缩结果A、图像压缩结果B、图像压缩结果C共同经过压缩比检测模块,输出压缩比最高的图像压缩结果。此图像压缩结果再经过失真度检测模块,若经检测后失真度也能满足要求则将此图像压缩结果作为最终的输出。
如图2所示,第二方面,本发明实施例提供一种基于区块链的远程诊疗数据智能存储***,包括患者语音获取模块、患者身份识别模块、医生匹配模块、医生身份识别模块、就诊识别模块以及数据上链模块,其中:
患者语音获取模块,用于获取患者的病情描述语音信号;
患者身份识别模块,用于利用基于编码聚类的多重校验式声纹识别模型,根据患者的病情描述语音信号对患者身份进行识别,以得到患者身份信息;
医生匹配模块,用于利用语音识别模型对患者的病情描述语音信号进行识别,以得到并根据识别结果在预置的医生数据库中匹配对应的看诊医生,并向对应的看诊医生发送提醒信息;
医生身份识别模块,用于获取看诊医生的语音信号,并利用基于编码聚类的多重校验式声纹识别模型,对看诊医生的身份进行识别,以得到看诊医生身份信息;确认医生身份后,进行就诊,记录就诊时间;
就诊识别模块,用于在看诊医生和患者交流过程中,实时采集看诊医生的语音信息和患者的语音信息,并利用基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对看诊医生的语音信息和患者的语音信息分别进行识别,以得到看诊医生语音识别结果和患者语音识别结果;
数据上链模块,用于将患者身份信息、看诊医生身份信息、就诊时间、看诊医生语音识别结果和患者语音识别结果上传至区块链,实现上链存储。
本***通过患者语音获取模块、患者身份识别模块、医生匹配模块、医生身份识别模块、就诊识别模块以及数据上链模块的配合,结合基于编码聚类的多重校验式声纹识别模型、基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,实现精准高效的人员身份、语音内容识别;并结合区块链技术将核心数据上链存储,大大提高了数据安全性。首先,本发明提出了基于编码聚类的多重校验式声纹识别模型,对说话人的身份进行识别;该模型将语音信号等分且编码后实现聚类,在每个聚类簇中均选取一段语音信号进行声纹识别,如果声纹识别结果均一致才能够认定身份识别结果有效,显著地提升了声纹识别的精准度。其次,本发明提出了基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对语音信号进行识别;该模型首先利用多个语音识别模块分别对语音信号进行识别,当识别结果一致时再利用语义检测模块对语音识别结果的语义合理性进行检测,显著地提升了语音信号的识别精准度。最后,本发明利用了区块链技术,将医生及患者的身份信息、就诊时间、医生语音信号识别结果、患者语音信号识别结果进行上链存储,提升了数据安全性。
基于第二方面,进一步地,该基于区块链的远程诊疗数据智能存储***还包括图像压缩模块,用于获取患者的诊疗图像,利用基于图像精准去噪和压缩结果优选联合应用的智能压缩模型对诊疗图像进行压缩,以得到并将诊疗图像压缩结果上传至区块链。
如图3所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及***,也可以通过其它的方式实现。以上所描述的方法及***实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (10)

1.一种基于区块链的远程诊疗数据智能存储方法,其特征在于,包括以下步骤:
获取患者的病情描述语音信号;
利用基于编码聚类的多重校验式声纹识别模型,根据患者的病情描述语音信号对患者身份进行识别,以得到患者身份信息;
利用语音识别模型对患者的病情描述语音信号进行识别,以得到并根据识别结果在预置的医生数据库中匹配对应的看诊医生,并向对应的看诊医生发送提醒信息;
获取看诊医生的语音信号,并利用基于编码聚类的多重校验式声纹识别模型,对看诊医生的身份进行识别,以得到看诊医生身份信息;确认医生身份后,进行就诊,记录就诊时间;
在看诊医生和患者交流过程中,实时采集看诊医生的语音信息和患者的语音信息,并利用基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对看诊医生的语音信息和患者的语音信息分别进行识别,以得到看诊医生语音识别结果和患者语音识别结果;
将患者身份信息、看诊医生身份信息、就诊时间、看诊医生语音识别结果和患者语音识别结果上传至区块链,实现上链存储。
2.根据权利要求1所述的一种基于区块链的远程诊疗数据智能存储方法,其特征在于,还包括以下步骤:
获取患者的诊疗图像,利用基于图像精准去噪和压缩结果优选联合应用的智能压缩模型对诊疗图像进行压缩,以得到并将诊疗图像压缩结果上传至区块链。
3.根据权利要求2所述的一种基于区块链的远程诊疗数据智能存储方法,其特征在于,所述利用基于图像精准去噪和压缩结果优选联合应用的智能压缩模型对诊疗图像进行压缩的方法包括以下步骤:
将多个采用不同图像压缩方法的压缩模块进行并联,各个压缩模块的信号输入端共同连接预置的图像精准去噪模块,各个压缩模块的信号输出端共同连接压缩比检测模块,压缩比检测模块的信号输出端连接失真度检测模块,以得到智能压缩模型;
采用智能压缩模型对诊疗图像进行压缩。
4.根据权利要求3所述的一种基于区块链的远程诊疗数据智能存储方法,其特征在于,所述图像精准去噪模块用于将图像等分为多个区域,并检测各个区域的峰值信噪比,对低于预置的信噪比阈值的区域进行去噪。
5.根据权利要求3所述的一种基于区块链的远程诊疗数据智能存储方法,其特征在于,所述采用智能压缩模型对诊疗图像进行压缩的方法包括以下步骤:
将诊疗图像输入到智能压缩模型中,通过图像精准去噪模块对诊疗图像进行去噪,以得到去噪后图像;
将去噪后图像输入到各个压缩模块中进行压缩,以得到多个图像压缩结果;
将多个图像压缩结果输入到压缩比检测模块进行检测,输出压缩比最高的图像压缩结果;
将压缩比最高的图像压缩结果输入到失真度检测模块,以得到失真度检测结果,若该失真度检测结果小于预置的失真度阈值,则将该压缩比最高的图像压缩结果输出为最终的诊疗图像压缩结果。
6.根据权利要求1所述的一种基于区块链的远程诊疗数据智能存储方法,其特征在于,所述利用基于编码聚类的多重校验式声纹识别模型,根据患者的病情描述语音信号对患者身份进行识别的方法包括以下步骤:
将患者的病情描述语音信号进行多等分处理,以得到多段等分语音信号;
将各段等分语音信号进行编码,并利用聚类算法将多个等分语音信号进行聚类,以得到多个聚类簇;
在每个聚类簇中的任选一段等分语音信号,并利用声纹识别模型对选取的等分语音信号进行识别,以得到多个身份识别结果;
若多个身份识别结果一致,则认定身份识别结果有效并将该身份识别结果输出为最终的患者身份信息。
7.根据权利要求1所述的一种基于区块链的远程诊疗数据智能存储方法,其特征在于,所述利用基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对看诊医生的语音信息和患者的语音信息分别进行识别的方法包括以下步骤:
将多个采用不同语音识别算法的语音识别网络模块进行并联,各个语音识别网络模块的信号输出端共同连接语音识别结果比对模块,语音识别结果比对模块的信号输出端连接语义检测模块,以组成端到端的语音识别模型;
采用该端到端的语音识别模型对看诊医生的语音信息和患者的语音信息分别进行识别。
8.一种基于区块链的远程诊疗数据智能存储***,其特征在于,包括患者语音获取模块、患者身份识别模块、医生匹配模块、医生身份识别模块、就诊识别模块以及数据上链模块,其中:
患者语音获取模块,用于获取患者的病情描述语音信号;
患者身份识别模块,用于利用基于编码聚类的多重校验式声纹识别模型,根据患者的病情描述语音信号对患者身份进行识别,以得到患者身份信息;
医生匹配模块,用于利用语音识别模型对患者的病情描述语音信号进行识别,以得到并根据识别结果在预置的医生数据库中匹配对应的看诊医生,并向对应的看诊医生发送提醒信息;
医生身份识别模块,用于获取看诊医生的语音信号,并利用基于编码聚类的多重校验式声纹识别模型,对看诊医生的身份进行识别,以得到看诊医生身份信息;确认医生身份后,进行就诊,记录就诊时间;
就诊识别模块,用于在看诊医生和患者交流过程中,实时采集看诊医生的语音信息和患者的语音信息,并利用基于多语音识别模块及语义检测模块联合应用的端到端语音识别模型,对看诊医生的语音信息和患者的语音信息分别进行识别,以得到看诊医生语音识别结果和患者语音识别结果;
数据上链模块,用于将患者身份信息、看诊医生身份信息、就诊时间、看诊医生语音识别结果和患者语音识别结果上传至区块链,实现上链存储。
9.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN202311402145.XA 2023-10-27 2023-10-27 基于区块链的远程诊疗数据智能存储方法及*** Active CN117153164B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311402145.XA CN117153164B (zh) 2023-10-27 2023-10-27 基于区块链的远程诊疗数据智能存储方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311402145.XA CN117153164B (zh) 2023-10-27 2023-10-27 基于区块链的远程诊疗数据智能存储方法及***

Publications (2)

Publication Number Publication Date
CN117153164A true CN117153164A (zh) 2023-12-01
CN117153164B CN117153164B (zh) 2024-01-26

Family

ID=88904577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311402145.XA Active CN117153164B (zh) 2023-10-27 2023-10-27 基于区块链的远程诊疗数据智能存储方法及***

Country Status (1)

Country Link
CN (1) CN117153164B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113936762A (zh) * 2021-09-21 2022-01-14 姜昶 基于区块链的智能医疗就诊数据存储方法及平台
JP2023048799A (ja) * 2021-09-28 2023-04-07 株式会社オンラインマスター オンライン診療を含む診療システム
CN116705250A (zh) * 2023-06-07 2023-09-05 北京海上升科技有限公司 一种医疗影像大数据的低耗优化和智能存储方法及***
CN116884428A (zh) * 2023-09-05 2023-10-13 北京赛博日新科技有限公司 基于区块链的线上诊疗及音视频数据智能优化方法和***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113936762A (zh) * 2021-09-21 2022-01-14 姜昶 基于区块链的智能医疗就诊数据存储方法及平台
JP2023048799A (ja) * 2021-09-28 2023-04-07 株式会社オンラインマスター オンライン診療を含む診療システム
CN116705250A (zh) * 2023-06-07 2023-09-05 北京海上升科技有限公司 一种医疗影像大数据的低耗优化和智能存储方法及***
CN116884428A (zh) * 2023-09-05 2023-10-13 北京赛博日新科技有限公司 基于区块链的线上诊疗及音视频数据智能优化方法和***

Also Published As

Publication number Publication date
CN117153164B (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
He et al. Intelligent system for depression scale estimation with facial expressions and case study in industrial intelligence
CN109840280B (zh) 一种文本分类方法、装置及计算机可读存储介质
CN110544275A (zh) 生成配准的带病灶分割标签的多模态mri的方法、***及介质
WO2021159571A1 (zh) 一种有向动态脑功能网络多类情绪识别构建方法及其装置
CN111986793B (zh) 基于人工智能的导诊处理方法、装置、计算机设备及介质
CN116884428A (zh) 基于区块链的线上诊疗及音视频数据智能优化方法和***
Powell et al. Decoding phonation with artificial intelligence (DeP AI): Proof of concept
CN115272295A (zh) 基于时域-空域联合状态的动态脑功能网络分析方法及***
CN114219755A (zh) 基于图像和临床数据的肺结核智能检测方法及***
CN117059092B (zh) 基于区块链的智慧医疗交互式智能分诊方法及***
CN116366927A (zh) 基于区块链的视频直播智能交互和大数据管理方法及***
CN111403025A (zh) 一种基于互联网医疗服务的智能诊疗***
CN116705250B (zh) 一种医疗影像大数据的低耗优化和智能存储方法及***
Alelaiwi Multimodal patient satisfaction recognition for smart healthcare
CN117153164B (zh) 基于区块链的远程诊疗数据智能存储方法及***
CN114048780A (zh) 基于联邦学习的脑电信号分类模型训练方法及装置
CN116631380B (zh) 一种音视频多模态的关键词唤醒方法及装置
CN107085655B (zh) 基于属性的约束概念格的中医数据处理方法及***
CN113506274A (zh) 基于视觉显著性差异图的用于人体认知状况的检测***
CN112216374A (zh) 一种医疗服务监管方法、装置及设备
CN116844711A (zh) 基于深度学习的疾病辅助识别方法及装置
CN113436650B (zh) 婴儿哭声识别方法、装置、电子设备及存储介质
CN112274144A (zh) 近红外脑功能成像数据的处理方法、装置和存储介质
CN109102496B (zh) 基于变分生成对抗模型识别乳腺肿瘤区域的方法及装置
Nguyen et al. Biometric recognition system performance measures for lossy compression on EEG signals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant