CN117251699B - 基于人工智能的医疗大数据分析方法及*** - Google Patents

基于人工智能的医疗大数据分析方法及*** Download PDF

Info

Publication number
CN117251699B
CN117251699B CN202311532775.9A CN202311532775A CN117251699B CN 117251699 B CN117251699 B CN 117251699B CN 202311532775 A CN202311532775 A CN 202311532775A CN 117251699 B CN117251699 B CN 117251699B
Authority
CN
China
Prior art keywords
feature vector
electronic medical
medical record
semantic understanding
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311532775.9A
Other languages
English (en)
Other versions
CN117251699A (zh
Inventor
赵贝尔
袁高明
崔晓茹
何颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wuji Huitong Technology Co ltd
Original Assignee
Beijing Wuji Huitong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wuji Huitong Technology Co ltd filed Critical Beijing Wuji Huitong Technology Co ltd
Priority to CN202311532775.9A priority Critical patent/CN117251699B/zh
Publication of CN117251699A publication Critical patent/CN117251699A/zh
Application granted granted Critical
Publication of CN117251699B publication Critical patent/CN117251699B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • G06F18/295Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明涉及大数据领域,其具体地公开了一种基于人工智能的医疗大数据分析方法及***,其通过采用基于深度学习和人工智能技术,以电子病历等核心医疗数据和国内权威医疗机构专家经验知识为基础,对患者的病情进行分析和评估,从而推荐出最适合患者的检查检验项目和治疗方案。这样可以提高医生的诊断准确性和治疗效果,同时也能够帮助患者更好地理解自己的病情和治疗方案,提高治疗的依从性和效果。

Description

基于人工智能的医疗大数据分析方法及***
技术领域
本发明涉及大数据领域,且更为具体地,涉及一种基于人工智能的医疗大数据分析方法及***。
背景技术
大数据作为互联网发展成熟的表现已经得到越来越多的数据资源和运行的保障,包括医疗和病症的信息。然而,医疗数据无论是电子档病例或手写病例记录积累起来的数量是很大的,这些数据存储到数据库,并没有得到有效利用,患者每一次来都是新一轮的询问、了解病史,而由于时间原因,患者已无法准确说明自己的病情情况,表述模糊,如此会造成医生在诊断时花费较多时间,或者诊断不准确的情况,由于医疗数据库中的医疗数据闲置,无法为医生的诊断建议、患者病情的缓解发挥有效的助力作用。
因此,期待一种基于人工智能的医疗大数据方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于人工智能的医疗大数据分析方法及***,其通过采用基于深度学习和人工智能技术,以电子病历等核心医疗数据和国内权威医疗机构专家经验知识为基础,对患者的病情进行分析和评估,从而推荐出最适合患者的检查检验项目和治疗方案。这样可以提高医生的诊断准确性和治疗效果,同时也能够帮助患者更好地理解自己的病情和治疗方案,提高治疗的依从性和效果。
根据本申请的一个方面,提供了一种基于人工智能的医疗大数据分析方法,其包括:
获取被分析对象的电子病历;
对所述被分析对象的电子病历进行数据清洗和分词处理以得到电子病历内容描述词的序列;
将所述电子病历内容描述词的序列通过词嵌入层以得到电子病历内容描述词嵌入向量的序列;
将所述电子病历内容描述词嵌入向量的序列通过基于转换器模块的第一自然语言处理模型以得到电子病历语义理解特征向量;
使用级联函数来融合所述电子病历语义理解特征向量和专家知识语义理解特征向量以得到分类特征向量,其中,所述专家知识语义理解特征向量通过使用第二自然语言处理模型对专家经验知识进行语义编码得到;
以及将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐的检查项目的标签。
在上述基于人工智能的医疗大数据分析方法中,所述词嵌入层为词袋模型。
在上述基于人工智能的医疗大数据分析方法中,将所述电子病历内容描述词嵌入向量的序列通过基于转换器模块的第一自然语言处理模型以得到电子病历语义理解特征向量,包括:使用所述基于转换器模块的第一自然语言处理模型的转换器对所述电子病历内容描述词嵌入向量的序列进行基于转换器思想的全局上下文语义编码以得到多个全局上下文语义电子病历内容描述特征向量;以及,将所述多个全局上下文语义电子病历内容描述特征向量进行级联以得到所述电子病历语义理解特征向量。
在上述基于人工智能的医疗大数据分析方法中,所述第一自然语言处理模型为基于转换器的Bert模型,所述第二自然语言处理模型为双向长短期记忆神经网络模型。
在上述基于人工智能的医疗大数据分析方法中,使用级联函数来融合所述电子病历语义理解特征向量和所述专家知识语义理解特征向量以得到分类特征向量,包括:使用级联函数以如下级联公式来融合所述电子病历语义理解特征向量和所述专家知识语义理解特征向量以得到所述分类特征向量;其中,所述级联公式为:
其中,和/>均表示对输入进行点卷积、/>为激活函数,[ ]表示拼接操作。
在上述基于人工智能的医疗大数据分析方法中,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐的检查项目的标签,包括:对所述分类特征向量进行特征分布优化以得到优化分类特征向量;使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
在上述基于人工智能的医疗大数据分析方法中,对所述分类特征向量进行特征分布优化以得到优化分类特征向量,包括:对所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行特征插值式融合的目的损失自监督平衡化以获得校正特征向量;将所述校正特征向量与所述分类特征向量进行融合以得到优化分类特征向量。
在上述基于人工智能的医疗大数据分析方法中,对于所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行特征插值式融合的目的损失自监督平衡化以获得校正特征向量,包括:以如下平衡化公式对所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行特征插值式融合的目的损失自监督平衡化以获得所述校正特征向量;
其中,所述平衡化公式为:
其中,表示所述电子病历语义理解特征向量,/>表示所述专家知识语义理解特征向量,/>和/>分别表示所述电子病历语义理解特征向量/>和所述专家知识语义理解特征向量/>的全局均值的倒数,且/>是单位向量,/>表示按位置相加,/>表示按位置相减,/>表示按位置点乘,/>表示所述校正特征向量。
根据本申请的另一方面,提供了一种基于人工智能的医疗大数据分析***,其包括:
信息采集模块,用于获取被分析对象的电子病历;
分词模块,用于对所述被分析对象的电子病历进行数据清洗和分词处理以得到电子病历内容描述词的序列;
词嵌入模块,用于将所述电子病历内容描述词的序列通过词嵌入层以得到电子病历内容描述词嵌入向量的序列;
上下文语义编码模块,用于将所述电子病历内容描述词嵌入向量的序列通过基于转换器模块的第一自然语言处理模型以得到电子病历语义理解特征向量;
级联模块,用于使用级联函数来融合所述电子病历语义理解特征向量和专家知识语义理解特征向量以得到分类特征向量,其中,所述专家知识语义理解特征向量通过对专家经验知识进行语义编码得到;
分类结果生成模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐的检查项目的标签。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于人工智能的医疗大数据分析方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于人工智能的医疗大数据分析方法。
与现有技术相比,本申请提供的一种基于人工智能的医疗大数据分析方法及***,其通过采用基于深度学习和人工智能技术,以电子病历等核心医疗数据和国内权威医疗机构专家经验知识为基础,对患者的病情进行分析和评估,从而推荐出最适合患者的检查检验项目和治疗方案。这样可以提高医生的诊断准确性和治疗效果,同时也能够帮助患者更好地理解自己的病情和治疗方案,提高治疗的依从性和效果。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的基于人工智能的医疗大数据分析方法的流程图;
图2为根据本申请实施例的基于人工智能的医疗大数据分析方法的***架构图;
图3为根据本申请实施例的基于人工智能的医疗大数据分析方法中上下文语义编码的流程图;
图4为根据本申请实施例的基于人工智能的医疗大数据分析***的框图;
图5为根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
图1为根据本申请实施例的基于人工智能的医疗大数据分析方法的流程图。如图1所示,根据本申请实施例的基于人工智能的医疗大数据分析方法,包括步骤:S110,获取被分析对象的电子病历;S120,对所述被分析对象的电子病历进行数据清洗和分词处理以得到电子病历内容描述词的序列;S130,将所述电子病历内容描述词的序列通过词嵌入层以得到电子病历内容描述词嵌入向量的序列;S140,将所述电子病历内容描述词嵌入向量的序列通过基于转换器模块的第一自然语言处理模型以得到电子病历语义理解特征向量;S150,使用级联函数来融合所述电子病历语义理解特征向量和专家知识语义理解特征向量以得到分类特征向量,其中,所述专家知识语义理解特征向量通过使用第二自然语言处理模型对专家经验知识进行语义编码得到;S160,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐的检查项目的标签。
图2为根据本申请实施例的基于人工智能的医疗大数据分析方法的***架构图。如图2所示,该网络结构中,首先,获取被分析对象的电子病历;接着,对所述被分析对象的电子病历进行数据清洗和分词处理以得到电子病历内容描述词的序列;将所述电子病历内容描述词的序列通过词嵌入层以得到电子病历内容描述词嵌入向量的序列;将所述电子病历内容描述词嵌入向量的序列通过基于转换器模块的第一自然语言处理模型以得到电子病历语义理解特征向量;使用级联函数来融合所述电子病历语义理解特征向量和专家知识语义理解特征向量以得到分类特征向量,其中,所述专家知识语义理解特征向量通过使用第二自然语言处理模型对专家经验知识进行语义编码得到;然后,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐的检查项目的标签。
更具体地,在步骤S110中,获取被分析对象的电子病历。应可以理解,智能诊疗决策支持***需要获取被分析对象的电子病历,是因为电子病历中包含了患者的病史、症状、检查结果等重要信息。
更具体地,在步骤S120中,对所述被分析对象的电子病历进行数据清洗和分词处理以得到电子病历内容描述词的序列。也就是,在本申请的技术方案中,对所述被分析对象的电子病历进行数据清洗和分词处理以得到电子病历内容描述词的序列。对被分析对象的电子病历进行数据清洗和分词处理,是为了去除一些无用的信息,如HTML标签、特殊符号等,同时对文本进行分词,将文本切分成一个个有意义的词语,以便后续的处理。具体地,在进行电子病历的数据清洗和分词处理时,可以采用自然语言处理技术,如中文分词、词性标注、命名实体识别等技术,对电子病历中的文本进行处理。特别地,考虑到患者的隐私需要被保护,在进行电子病历的处理和分析时,可以采用数据脱敏、数据加密等技术来保护患者的隐私。具体来说,可以对电子病历中的敏感信息进行脱敏处理,如姓名、身份证号等信息可以进行部分替换或者删除。
更具体地,在步骤S130中,将所述电子病历内容描述词的序列通过词嵌入层以得到电子病历内容描述词嵌入向量的序列。在本申请的技术方案中,将所述电子病历内容描述词的序列通过词嵌入层以得到电子病历内容描述词嵌入向量的序列。考虑到所述电子病历内容描述词是文本数据,无法直接被计算机所处理,因此,需将所述电子病历内容描述词的序列进行向量化处理。具体地,在本申请的技术方案中,将所述电子病历内容描述词的序列通过词嵌入层以得到所述电子病历内容描述词嵌入向量的序列。在一个具体的示例中,所述词嵌入层为词袋模型、Word2Vec模型等。
更具体地,在步骤S140中,将所述电子病历内容描述词嵌入向量的序列通过基于转换器模块的第一自然语言处理模型以得到电子病历语义理解特征向量。也就是,在得到所述电子病历内容描述词嵌入向量的序列后,进一步将其通过基于转换器模块的第一自然语言处理模型进行全局上下文语义编码以得到所述电子病历语义理解特征向量。也就是,使用所述基于转换器模块的第一自然语言处理模型对所述电子病历内容描述词嵌入向量的序列进行基于Transformer机制的上下文语义编码以得到所述电子病历语义理解特征向量,所述电子病历语义理解特征向量用于表示电子病历的语义特征信息。
图3为根据本申请实施例的基于人工智能的医疗大数据分析方法中上下文语义编码的流程图。如图3所示,在所述上下文语义编码的过程中,包括:S210,使用所述基于转换器模块的第一自然语言处理模型的转换器对所述电子病历内容描述词嵌入向量的序列进行基于转换器思想的全局上下文语义编码以得到多个全局上下文语义电子病历内容描述特征向量;以及,S220,将所述多个全局上下文语义电子病历内容描述特征向量进行级联以得到所述电子病历语义理解特征向量。
更具体地,在步骤S150中,使用级联函数来融合所述电子病历语义理解特征向量和专家知识语义理解特征向量以得到分类特征向量,其中,所述专家知识语义理解特征向量通过使用第二自然语言处理模型对专家经验知识进行语义编码得到。也就是,使用级联函数来融合所述电子病历语义理解特征向量和专家知识语义理解特征向量以得到分类特征向量,其中,所述专家知识语义理解特征向量通过对专家经验知识进行语义编码得到。也就是,对所述电子病历的语义信息和专家知识的语义信息表达进行关联编码以得到融合两者语义信息的所述分类特征向量。值得一提的是,在本申请的技术方案中,对所述专家经验知识进行分词处理后通过包含词嵌入层的第二自然语言处理模型以得到专家知识语义理解特征向量,也就是,所述专家知识语义理解特征向量可通过使用不同的自然语言处理模型对所述专家经验知识进行语义编码得到。例如,在本申请一个具体的示例中,所述第二自然语言处理模型为双向长短期记忆神经网络模型,所述第一自然语言处理模型为基于转换器的Bert模型。在本申请的一个具体示例中,使用级联函数来融合所述所述电子病历语义理解特征向量和专家知识语义理解特征向量以得到分类特征向量,其中,所述级联函数使得网络具有一定逻辑推理能力以挖掘所述电子病历语义理解特征向量和专家知识语义理解特征向量之间的关联信息。所述级联函数用公式可表达为:
其中,和/>均表示对输入进行点卷积、/>为激活函数,[ ]表示拼接操作。
更具体地,在步骤S160中,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐的检查项目的标签。也就是,在得到所述分类特征向量后,进一步将其作为分类特征向量通过分类器以获得用于表示用于表示推荐的检查项目的标签的分类结果。
特别地,在本申请的技术方案中,在使用级联函数来融合所述电子病历语义理解特征向量和所述专家知识语义理解特征向量时,由于所述电子病历语义理解特征向量和所述专家知识语义理解特征向量分别表达所述电子病历的语义特征表达和所述专家经验知识的语义信息表达,所述级联函数的点卷积操作会分别相对于所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行不同方向的拟合,例如过拟合和欠拟合,从而导致所述电子病历语义理解特征向量和所述专家知识语义理解特征向量的拟合差异,从而影响所述分类特征向量对所述电子病历语义理解特征向量和所述专家知识语义理解特征向量的融合效果。另一方面,所述电子病历语义理解特征向量和所述专家知识语义理解特征向量的不同源文本语义强度,在通过级联函数来融合所述电子病历语义理解特征向量和所述专家知识语义理解特征向量时,可能导致所述分类特征向量的表达不均衡,影响所述分类特征向量的表达效果。
基于此,优选地,对于所述电子病历语义理解特征向量,例如记为和所述专家知识语义理解特征向量,例如记为/>进行特征插值式融合的目的损失自监督平衡化,以获得校正特征向量,例如记为/>
在本申请的一个具体示例中,对所述分类特征向量进行特征分布优化以得到优化分类特征向量,包括:对所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行特征插值式融合的目的损失自监督平衡化以获得校正特征向量;将所述校正特征向量与所述分类特征向量进行融合以得到优化分类特征向量。
在本申请的一个具体示例中,对于所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行特征插值式融合的目的损失自监督平衡化以获得校正特征向量,包括:以如下平衡化公式对所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行特征插值式融合的目的损失自监督平衡化以获得所述校正特征向量;其中,所述平衡化公式为:
其中,表示所述电子病历语义理解特征向量,/>表示所述专家知识语义理解特征向量,/>和/>分别表示所述电子病历语义理解特征向量/>和所述专家知识语义理解特征向量/>的全局均值的倒数,且/>是单位向量,/>表示按位置相加,/>表示按位置相减,/>表示按位置点乘,/>表示所述校正特征向量。
也就是,在考虑到基于语义级特征交互的文本语义特征融合的情况下,如果将待融合的所述电子病历语义理解特征向量视为所述专家知识语义理解特征向量/>的强特征增强输入,则可能损失所述专家知识语义理解特征向量/>的目标特征流形在类空间内的目标分布信息,导致类回归目的损失,因此通过对特征分布相对于彼此的离群分布(outlier distribution)进行交叉惩罚的方式,可以在特征插值式融合时实现特征增强和回归鲁棒的自监督式平衡,以提升所述电子病历语义理解特征向量/>和所述专家知识语义理解特征向量/>的特征融合效果。这样,再将所述校正特征向量/>与所述分类特征向量融合,就可以提升所述分类特征向量的表达效果,以提升其通过分类器得到的分类结果的准确性。
可选的,在本申请的一个具体示例中,以计算按位置点乘的方式将所述校正特征向量与所述分类特征向量进行融合以得到优化分类特征向量。
进一步地,所述分类器包括多个全连接层和与所述多个全连接层最后一个全连接层级联的Softmax层。其中,在所述分类器的分类处理中,使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;进而,将所述编码分类特征向量输入所述分类器的Softmax层,即,使用所述Softmax分类函数对所述编码分类特征向量进行分类处理以得到分类标签。在本申请的一个具体示例中,所述分类器来确定所述分类特征向量所属的类概率标签,所述类概率标签为推荐的检查项目的标签。这样,以电子病历等核心医疗数据和国内权威医疗机构专家经验知识为基础,采用人工智能、机器学习等大数据关键技术,以智能推荐需要做的检查检验项目。
应可以理解,在利用上述神经网络模型之前,需要对所述基于转换器模块的第一自然语言处理模型、所述第二自然语言处理模型和所述分类器进行训练。也就是说,在本申请实施例的,基于人工智能的医疗大数据分析方法中,还包括:对所述基于转换器模块的第一自然语言处理模型、所述第二自然语言处理模型和所述分类器进行训练的训练步骤。
在本申请的一个具体示例中,所述训练步骤,包括:获取训练被分析对象的训练电子病历;对所述训练被分析对象的训练电子病历进行数据清洗和分词处理以得到训练电子病历内容描述词的序列;将训练所述电子病历内容描述词的序列通过所述词嵌入层以得到训练电子病历内容描述词嵌入向量的序列;将所述训练电子病历内容描述词嵌入向量的序列通过所述基于转换器模块的第一自然语言处理模型以得到训练电子病历语义理解特征向量;使用级联函数来融合所述训练电子病历语义理解特征向量和训练专家知识语义理解特征向量以得到训练分类特征向量,其中,所述训练专家知识语义理解特征向量通过使用所述第二自然语言处理模型对训练专家经验知识进行语义编码得到;将所述训练分类特征向量通过所述分类器以得到分类损失函数值;计算所述训练电子病历语义理解特征向量和训练专家知识语义理解特征向量的共有流形隐式相似性因数损失函数值;以及,以所述分类损失函数值和所述共有流形隐式相似性因数损失函数值的加权和作为损失函数值对所述基于转换器模块的第一自然语言处理模型、所述第二自然语言处理模型和所述分类器进行训练。
特别地,在本申请的技术方案中,在使用级联函数来融合所述训练电子病历语义理解特征向量和所述训练专家知识语义理解特征向量时,由于所述训练电子病历语义理解特征向量和所述训练专家知识语义理解特征向量分别表达所述电子病历的语义特征表达和所述专家经验知识的语义信息表达,所述级联函数的点卷积操作会分别相对于所述训练电子病历语义理解特征向量和所述训练专家知识语义理解特征向量进行不同方向的拟合,例如过拟合和欠拟合,从而导致所述训练电子病历语义理解特征向量和所述训练专家知识语义理解特征向量的拟合差异,从而影响所述训练分类特征向量对所述训练电子病历语义理解特征向量和所述训练专家知识语义理解特征向量的融合效果。基于此,本申请针对所述训练电子病历语义理解特征向量,例如记为和所述训练专家知识语义理解特征向量,例如记为/>,引入共有流形隐式相似性因数作为损失函数。
在本申请的一个具体示例中,计算所述训练电子病历语义理解特征向量和训练专家知识语义理解特征向量的共有流形隐式相似性因数损失函数值,包括:以如下隐式相似性计算公式来计算所述训练电子病历语义理解特征向量和训练专家知识语义理解特征向量的共有流形隐式相似性因数损失函数值;
其中,所述隐式相似性公式为:
其中,表示所述训练电子病历语义理解特征向量,/>表示所述训练专家知识语义理解特征向量,/>表示向量的二范数,且/>表示矩阵的Frobenius范数的平方根,所述训练电子病历语义理解特征向量和训练专家知识语义理解特征向量均为列向量形式,/>表示向量相乘,/>表示向量的按位置点乘,/>、/>、/>和/>为权重超参数,/>为第一损失函数值,/>为第二损失函数值,/>为共有流形隐式相似性因数损失函数值。
这里,所述共有流形隐式相似性因数可以以所述训练电子病历语义理解特征向量和所述训练专家知识语义理解特征向量/>间的结构化关联来表示各自特征流形在交叉维度下的共有流形,并以相同因数化权重来共享所述电子病历语义理解特征向量/>和所述专家知识语义理解特征向量/>的差异性、对应性、关联性等流形结构性因素的共同约束,从而对依赖共有流形的几何衍生结构表示的分布相似性进行度量,以实现跨模态特征分布间的融合特征的非线性几何单调性,提升所述训练分类特征向量的高维特征流形表达的几何单调性,从而改进其通过分类器的分类回归的收敛效果,即,提升训练速度和训练结果的准确性。
综上,根据本申请实施例的基于人工智能的医疗大数据分析方法被阐明,其通过采用基于深度学习和人工智能技术,以电子病历等核心医疗数据和国内权威医疗机构专家经验知识为基础,对患者的病情进行分析和评估,从而推荐出最适合患者的检查检验项目和治疗方案。这样可以提高医生的诊断准确性和治疗效果,同时也能够帮助患者更好地理解自己的病情和治疗方案,提高治疗的依从性和效果。
图4为根据本申请实施例的基于人工智能的医疗大数据分析***的框图。如图4所示,根据本申请实施例的基于人工智能的医疗大数据分析***300,包括:信息采集模块310;分词模块320;词嵌入模块330;上下文语义编码模块340;级联模块350;以及,分类结果生成模块360。
其中,所述信息采集模块310,用于获取被分析对象的电子病历;所述分词模块320,用于对所述被分析对象的电子病历进行数据清洗和分词处理以得到电子病历内容描述词的序列;所述词嵌入模块330,用于将所述电子病历内容描述词的序列通过词嵌入层以得到电子病历内容描述词嵌入向量的序列;所述上下文语义编码模块340,用于将所述电子病历内容描述词嵌入向量的序列通过基于转换器模块的第一自然语言处理模型以得到电子病历语义理解特征向量;所述级联模块350,用于使用级联函数来融合所述电子病历语义理解特征向量和专家知识语义理解特征向量以得到分类特征向量,其中,所述专家知识语义理解特征向量通过对专家经验知识进行语义编码得到;以及,所述分类结果生成模块360,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐的检查项目的标签。
在一个示例中,所述基于人工智能的医疗大数据分析***300还包括:用于对所述基于转换器模块的第一自然语言处理模型、所述第二自然语言处理模型和所述分类器进行训练的训练模块。所述训练模块,包括:训练数据采集模块,用于获取训练被分析对象的训练电子病历;训练分词单元,用于对所述训练被分析对象的训练电子病历进行数据清洗和分词处理以得到训练电子病历内容描述词的序列;训练词嵌入单元,用于将训练所述电子病历内容描述词的序列通过所述词嵌入层以得到训练电子病历内容描述词嵌入向量的序列;训练上下文语义编码单元,用于将所述训练电子病历内容描述词嵌入向量的序列通过所述基于转换器模块的第一自然语言处理模型以得到训练电子病历语义理解特征向量;训练级联单元,用于使用级联函数来融合所述训练电子病历语义理解特征向量和训练专家知识语义理解特征向量以得到训练分类特征向量,其中,所述训练专家知识语义理解特征向量通过使用所述第二自然语言处理模型对训练专家经验知识进行语义编码得到;分类损失函数值计算单元,用于将所述训练分类特征向量通过所述分类器以得到分类损失函数值;相似性因数计算单元,用于计算所述训练电子病历语义理解特征向量和训练专家知识语义理解特征向量的共有流形隐式相似性因数损失函数值;以及,加权训练单元,用于以所述分类损失函数值和所述共有流形隐式相似性因数损失函数值的加权和作为损失函数值对所述基于转换器模块的第一自然语言处理模型、所述第二自然语言处理模型和所述分类器进行训练。
综上,根据本申请实施例的基于人工智能的医疗大数据分析***300被阐明,其通过采用基于深度学习和人工智能技术,以电子病历等核心医疗数据和国内权威医疗机构专家经验知识为基础,对患者的病情进行分析和评估,从而推荐出最适合患者的检查检验项目和治疗方案。这样可以提高医生的诊断准确性和治疗效果,同时也能够帮助患者更好地理解自己的病情和治疗方案,提高治疗的依从性和效果。
如上所述,根据本申请实施例的基于人工智能的医疗大数据分析***可以实现在各种终端设备中。在一个示例中,根据本申请实施例的基于人工智能的医疗大数据分析***300可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于人工智能的医疗大数据分析***300可以是该终端设备的操作***中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于人工智能的医疗大数据分析***300同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于人工智能的医疗大数据分析***300与该终端设备也可以是分立的设备,并且该基于人工智能的医疗大数据分析***300可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性电子设备
下面,参考图5来描述根据本申请实施例的电子设备。
图5图示了根据本申请实施例的电子设备的框图。
如图5所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于人工智能的医疗大数据分析方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如分类特征向量等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线***和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于人工智能的医疗大数据分析方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于人工智能的医疗大数据分析方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

Claims (6)

1.一种基于人工智能的医疗大数据分析方法,其特征在于,包括:
获取被分析对象的电子病历;
对所述被分析对象的电子病历进行数据清洗和分词处理以得到电子病历内容描述词的序列;
将所述电子病历内容描述词的序列通过词嵌入层以得到电子病历内容描述词嵌入向量的序列;
将所述电子病历内容描述词嵌入向量的序列通过基于转换器模块的第一自然语言处理模型以得到电子病历语义理解特征向量;
使用级联函数来融合所述电子病历语义理解特征向量和专家知识语义理解特征向量以得到分类特征向量,其中,所述专家知识语义理解特征向量通过使用第二自然语言处理模型对专家经验知识进行语义编码得到;
以及将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐的检查项目的标签;
将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐的检查项目的标签,包括:
对所述分类特征向量进行特征分布优化以得到优化分类特征向量;
使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;
以及将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果;
对所述分类特征向量进行特征分布优化以得到优化分类特征向量,包括:
对所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行特征插值式融合的目的损失自监督平衡化以获得校正特征向量;
将所述校正特征向量与所述分类特征向量进行融合以得到优化分类特征向量;
对于所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行特征插值式融合的目的损失自监督平衡化以获得校正特征向量,包括:以如下平衡化公式对所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行特征插值式融合的目的损失自监督平衡化以获得所述校正特征向量;
其中,所述平衡化公式为:
其中,/>表示所述电子病历语义理解特征向量,/>表示所述专家知识语义理解特征向量,/>和/>分别表示所述电子病历语义理解特征向量/>和所述专家知识语义理解特征向量/>的全局均值的倒数,且/>是单位向量,/>表示按位置相加,/>表示按位置相减,/>表示按位置点乘,/>表示所述校正特征向量。
2.根据权利要求1所述的基于人工智能的医疗大数据分析方法,其特征在于,所述词嵌入层为词袋模型。
3.根据权利要求2所述的基于人工智能的医疗大数据分析方法,其特征在于,将所述电子病历内容描述词嵌入向量的序列通过基于转换器模块的第一自然语言处理模型以得到电子病历语义理解特征向量,包括:
使用所述基于转换器模块的第一自然语言处理模型的转换器对所述电子病历内容描述词嵌入向量的序列进行基于转换器思想的全局上下文语义编码以得到多个全局上下文语义电子病历内容描述特征向量;
以及将所述多个全局上下文语义电子病历内容描述特征向量进行级联以得到所述电子病历语义理解特征向量。
4.根据权利要求3所述的基于人工智能的医疗大数据分析方法,其特征在于,所述第一自然语言处理模型为基于转换器的Bert模型,所述第二自然语言处理模型为双向长短期记忆神经网络模型。
5.根据权利要求4所述的基于人工智能的医疗大数据分析方法,其特征在于,使用级联函数来融合所述电子病历语义理解特征向量和所述专家知识语义理解特征向量以得到分类特征向量,包括:使用级联函数以如下级联公式来融合所述电子病历语义理解特征向量和所述专家知识语义理解特征向量以得到所述分类特征向量;
其中,所述级联公式为:其中,/>和/>均表示对输入进行点卷积、/>为激活函数,[ ]表示拼接操作。
6.一种基于人工智能的医疗大数据分析***,其特征在于,包括:
信息采集模块,用于获取被分析对象的电子病历;
分词模块,用于对所述被分析对象的电子病历进行数据清洗和分词处理以得到电子病历内容描述词的序列;
词嵌入模块,用于将所述电子病历内容描述词的序列通过词嵌入层以得到电子病历内容描述词嵌入向量的序列;
上下文语义编码模块,用于将所述电子病历内容描述词嵌入向量的序列通过基于转换器模块的第一自然语言处理模型以得到电子病历语义理解特征向量;
级联模块,用于使用级联函数来融合所述电子病历语义理解特征向量和专家知识语义理解特征向量以得到分类特征向量,其中,所述专家知识语义理解特征向量通过对专家经验知识进行语义编码得到;
以及分类结果生成模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐的检查项目的标签;
所述分类结果生成模块,具体用于:
对所述分类特征向量进行特征分布优化以得到优化分类特征向量;
使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;
以及将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果;
所述分类结果生成模块,具体用于:
对所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行特征插值式融合的目的损失自监督平衡化以获得校正特征向量;
将所述校正特征向量与所述分类特征向量进行融合以得到优化分类特征向量;
以如下平衡化公式对所述电子病历语义理解特征向量和所述专家知识语义理解特征向量进行特征插值式融合的目的损失自监督平衡化以获得所述校正特征向量;
其中,所述平衡化公式为:其中,/>表示所述电子病历语义理解特征向量,/>表示所述专家知识语义理解特征向量,/>和/>分别表示所述电子病历语义理解特征向量/>和所述专家知识语义理解特征向量/>的全局均值的倒数,且/>是单位向量,/>表示按位置相加,/>表示按位置相减,/>表示按位置点乘,/>表示所述校正特征向量。
CN202311532775.9A 2023-11-17 2023-11-17 基于人工智能的医疗大数据分析方法及*** Active CN117251699B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311532775.9A CN117251699B (zh) 2023-11-17 2023-11-17 基于人工智能的医疗大数据分析方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311532775.9A CN117251699B (zh) 2023-11-17 2023-11-17 基于人工智能的医疗大数据分析方法及***

Publications (2)

Publication Number Publication Date
CN117251699A CN117251699A (zh) 2023-12-19
CN117251699B true CN117251699B (zh) 2024-02-02

Family

ID=89131725

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311532775.9A Active CN117251699B (zh) 2023-11-17 2023-11-17 基于人工智能的医疗大数据分析方法及***

Country Status (1)

Country Link
CN (1) CN117251699B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117457229B (zh) * 2023-12-26 2024-03-08 吉林大学 基于人工智能的麻醉深度监测***及方法
CN117524400B (zh) * 2024-01-05 2024-03-22 吉林大学 患者数据可视化管理***及方法
CN117649943B (zh) * 2024-01-30 2024-04-30 吉林大学 基于机器学习的整形数据智能分析***及方法
CN117727467A (zh) * 2024-02-07 2024-03-19 吉林大学 基于大数据的护理临床决策支持***及方法
CN118098482B (zh) * 2024-04-22 2024-06-28 吉林大学 基于5g技术的智慧医疗管理***及方法
CN118266854B (zh) * 2024-05-30 2024-07-23 美视康健(吉林)医疗设备有限公司 一种立体视检测控制***和方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205337A (zh) * 2015-10-15 2015-12-30 上海楚腾信息技术有限公司 基于自然语言词汇分析的辅助生殖专家治疗方案推荐***
CN107247881A (zh) * 2017-06-20 2017-10-13 北京大数医达科技有限公司 一种多模态智能分析方法及***
WO2019238976A1 (en) * 2018-06-15 2019-12-19 Université de Liège Image classification using neural networks
CN115983874A (zh) * 2023-02-17 2023-04-18 江苏秀圆果信息科技有限公司 酒类防伪溯源方法及其***
CN116580849A (zh) * 2023-05-30 2023-08-11 杭州医初科技有限公司 医疗数据的采集分析***及其方法
CN116629275A (zh) * 2023-07-21 2023-08-22 北京无极慧通科技有限公司 一种基于大数据的智能决策支持***及方法
CN116682541A (zh) * 2023-06-14 2023-09-01 杭州医初科技有限公司 医疗就诊的推荐***及其方法
CN116895377A (zh) * 2023-07-12 2023-10-17 三诺生物传感股份有限公司 一种检查项目推荐方法及***

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205337A (zh) * 2015-10-15 2015-12-30 上海楚腾信息技术有限公司 基于自然语言词汇分析的辅助生殖专家治疗方案推荐***
CN107247881A (zh) * 2017-06-20 2017-10-13 北京大数医达科技有限公司 一种多模态智能分析方法及***
WO2019238976A1 (en) * 2018-06-15 2019-12-19 Université de Liège Image classification using neural networks
CN115983874A (zh) * 2023-02-17 2023-04-18 江苏秀圆果信息科技有限公司 酒类防伪溯源方法及其***
CN116580849A (zh) * 2023-05-30 2023-08-11 杭州医初科技有限公司 医疗数据的采集分析***及其方法
CN116682541A (zh) * 2023-06-14 2023-09-01 杭州医初科技有限公司 医疗就诊的推荐***及其方法
CN116895377A (zh) * 2023-07-12 2023-10-17 三诺生物传感股份有限公司 一种检查项目推荐方法及***
CN116629275A (zh) * 2023-07-21 2023-08-22 北京无极慧通科技有限公司 一种基于大数据的智能决策支持***及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向真实世界的知识挖掘与知识图谱补全研究(二):非结构化电子病历信息抽取方法及进展;阎思宇 等;《医学新知》;全文 *

Also Published As

Publication number Publication date
CN117251699A (zh) 2023-12-19

Similar Documents

Publication Publication Date Title
CN117251699B (zh) 基于人工智能的医疗大数据分析方法及***
Fan et al. Adverse drug event detection and extraction from open data: A deep learning approach
Sarhan et al. Open-cykg: An open cyber threat intelligence knowledge graph
CN108959482B (zh) 基于深度学习的单轮对话数据分类方法、装置和电子设备
Farkas et al. Automatic construction of rule-based ICD-9-CM coding systems
Hoang et al. Patchnet: Hierarchical deep learning-based stable patch identification for the linux kernel
CN111914097A (zh) 基于注意力机制和多层级特征融合的实体抽取方法与装置
CN116580849B (zh) 医疗数据的采集分析***及其方法
CN111881398B (zh) 页面类型确定方法、装置和设备及计算机存储介质
US11481722B2 (en) Automated extraction, inference and normalization of structured attributes for product data
CN116257406A (zh) 用于智慧城市的网关数据管理方法及其***
Shreda et al. Identifying non-functional requirements from unconstrained documents using natural language processing and machine learning approaches
Xiao et al. User preference mining based on fine-grained sentiment analysis
Drozdov et al. Unsupervised labeled parsing with deep inside-outside recursive autoencoders
Zhang et al. Transfer correlation between textual content to images for sentiment analysis
CN116759053A (zh) 基于物联网***的医疗体系防控方法及***
Zhang et al. Disease prediction and early intervention system based on symptom similarity analysis
Zhang et al. Variational graph author topic modeling
Feng et al. Ontology semantic integration based on convolutional neural network
Dai et al. Double embedding and bidirectional sentiment dependence detector for aspect sentiment triplet extraction
Ahmed et al. Graph attention-based curriculum learning for mental healthcare classification
CN117316462A (zh) 一种医疗数据管理方法
EP4049141A1 (en) Automated exception featurization and search
Viji et al. A hybrid approach of Poisson distribution LDA with deep Siamese Bi-LSTM and GRU model for semantic similarity prediction for text data
Gao et al. Citation entity recognition method using multi‐feature semantic fusion based on deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant