CN111241817A - 一种基于文本的抑郁症识别方法 - Google Patents

一种基于文本的抑郁症识别方法 Download PDF

Info

Publication number
CN111241817A
CN111241817A CN202010065096.5A CN202010065096A CN111241817A CN 111241817 A CN111241817 A CN 111241817A CN 202010065096 A CN202010065096 A CN 202010065096A CN 111241817 A CN111241817 A CN 111241817A
Authority
CN
China
Prior art keywords
text
depression
information
target keyword
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010065096.5A
Other languages
English (en)
Inventor
王迎雪
张宇锋
刘弋锋
邹博超
谢海永
丰雷
王刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capital Medical University
Beijing Anding Hospital
Electronic Science Research Institute of CTEC
Original Assignee
Capital Medical University
Beijing Anding Hospital
Electronic Science Research Institute of CTEC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capital Medical University, Beijing Anding Hospital, Electronic Science Research Institute of CTEC filed Critical Capital Medical University
Priority to CN202010065096.5A priority Critical patent/CN111241817A/zh
Publication of CN111241817A publication Critical patent/CN111241817A/zh
Priority to PCT/CN2020/117579 priority patent/WO2021147363A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Machine Translation (AREA)

Abstract

本发明提出了一种基于文本的抑郁症识别方法,用以提高抑郁症识别精度。基于文本的抑郁症识别方法,包括:获取被测用户的语音信息并转换为文本信息;将所述文本信息转换为文本嵌入向量;基于所述文本嵌入向量,利用抑郁症预测模型进行预测得到预测结果,所述抑郁症预测模型为利用长短时记忆模型LSTM对文本嵌入向量样本进行训练得到的,所述文本向量样本中包括抑郁症文本向量样本和非抑郁症文本向量样本;确定所述文本信息中包含的目标关键词;根据所述预测结果及其对应的权重值和所述目标关键词及其对应的权重值的加权结果,确定所述被测用户是否属于抑郁症用户。

Description

一种基于文本的抑郁症识别方法
技术领域
本发明涉及机器学习技术领域,尤其涉及一种基于文本的抑郁症识别方法。
背景技术
抑郁症(Major Depressive Disorder,MDD)全球患病率高达5%-12%,其中15%的患者***身亡。我国抑郁症的患病率为6.1%,据中国疾病预防控制中心估计,2020年抑郁症在我国疾病总负担的比例将增至7.3%。抑郁症已经成为一个重大的公共卫生问题,具有迫切的临床研究需求。
当前,抑郁症的识别方法包括基于视频信息的抑郁症识别方法、基于音频特征的抑郁症识别方法以及其他方法。以上方法仅仅通过语音特征或者视频特征等单个模态的特征来识别抑郁症,其包含的判别信息并不够,从而降低了抑郁症识别的识别精度。
发明内容
本发明实施例提供一种基于文本的抑郁症识别方法,用以提高抑郁症识别精度。
第一方面,提供一种基于文本的抑郁症识别方法,包括:
获取被测用户的语音信息并转换为文本信息;
将所述文本信息转换为文本嵌入向量;
基于所述文本嵌入向量,利用抑郁症预测模型进行预测得到预测结果,所述抑郁症预测模型为利用长短时记忆模型LSTM对文本嵌入向量样本进行训练得到的,所述文本嵌入向量样本中包括抑郁症文本嵌入向量样本和非抑郁症文本嵌入向量样本;
确定所述文本信息中包含的目标关键词;
根据所述预测结果及其对应的权重值和所述目标关键词及其对应的权重值的加权结果,确定所述被测用户是否属于抑郁症用户。
在一种实施方式中,所述文本信息由按照时间顺序排列的若干个句子组成;以及将所述文本信息转换为文本嵌入向量,具体包括:
基于Bert(Bidirectional Encoder Representations from Transformers)模型,将按照时间顺序排列的若干个句子分别转换为文本嵌入模型,得到按照时间顺序排列的若干个文本嵌入向量。
在一种实施方式中,确定所述文本信息中包含的目标关键词,具体包括:
从所述文本信息中搜索预设的候选关键词;
针对搜索出的候选关键词,判断所述候选关键词所在的句子中是否包含否定词;
确定所在句子中不包含否定词的候选关键词为所述目标关键词。
在一种实施方式中,所述目标关键词包括多个类别,其中,每一类别的目标关键词对应的权重值不同。
第二方面,提供一种基于文本的抑郁症识别装置,包括:
文本转换单元,用于获取被测用户的语音信息并转换为文本信息;
向量转换单元,用于将所述文本信息转换为文本嵌入向量;
预测单元,用于基于所述文本嵌入向量,利用抑郁症预测模型进行预测得到预测结果,所述抑郁症预测模型为利用长短时记忆模型LSTM对文本嵌入向量样本进行训练得到的,所述文本嵌入向量样本中包括抑郁症文本嵌入向量样本和非抑郁症文本嵌入向量样本;
第一确定单元,用于确定所述文本信息中包含的目标关键词;
第二确定单元,用于根据所述预测结果及其对应的权重值和所述目标关键词及其对应的权重值的加权结果,确定所述被测用户是否属于抑郁症用户。
在一种实施方式中,所述文本信息由按照时间顺序排列的若干个句子组成;
所述向量转换单元,具体用于基于Bert模型,将按照时间顺序排列的若干个句子分别转换为文本嵌入模型,得到按照时间顺序排列的若干个文本嵌入向量。
在一种实施方式中,所述第一确定单元,具体用于从所述文本信息中搜索预设的候选关键词;针对搜索出的候选关键词,判断所述候选关键词所在的句子中是否包含否定词;确定所在句子中不包含否定词的候选关键词为所述目标关键词。
在一种实施方式中,所述目标关键词包括多个类别,其中,每一类别的目标关键词对应的权重值不同。
第三方面,提供一种计算装置,所述计算装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任一方法所述的步骤。
第四方面,提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法所述的步骤。
采用上述技术方案,本发明至少具有下列优点:
本发明所述的基于文本的抑郁症识别方法,通过将语音信息转换为文本信息,进而利用Bert模型将文本信息转换成文本嵌入向量,同时使用LSTM神经网络对文本嵌入向量进行建模,从而能够更好地表达了文本信息上下文的相关性,挖掘更深层次的文本特征,从而提高抑郁症的识别精度。
附图说明
图1为根据本发明实施方式的基于文本的抑郁症识别方法处理步骤示意框图;
图2为根据本发明实施方式的基于文本的抑郁症识别方法的流程示意图;
图3为根据本发明实施方式的基于Bert模型的句子级别文本嵌入处理流程示意图;
图4为根据本发明实施方式的四类关键词在抑郁症/非抑郁症患者中出现的频率示意图;
图5为根据本发明实施方式的抑郁症预测模型的预测结果和从文本信息中确定出的关键词融合流程示意图;
图6为根据本发明实施方式的基于文本的抑郁症识别装置的结构示意图;
图7为根据本发明实施方式的计算装置的结构示意图。
具体实施方式
为更进一步阐述本发明为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明进行详细说明如后。
首先,对本发明实施例中涉及的部分用语进行说明,以便于本领域技术人员理解。
Bert(Bidirectional Encoder Representations from Transformers)模型:是一种通用预训练语言表示模型,其基于转换器的双向编码器表征,即在处理一个词的时候,能考虑到该词前面和后面单词信息,从而获取上下文的语义。
需要说明的是,本发明实施例中的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。
在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
抑郁症又称抑郁障碍,以显著而持久的心境低落为主要临床特征,是心境障碍的主要类型。目前,抑郁症已经成为了人类第一大心理疾病负担,是造成人们失去行动力的主要原因。而且伴随着抑郁症患者经常会出现幻觉、妄想等精神病性症状,甚至有***企图或行为,抑郁症已经对患者个人、家庭乃至社会造成了很大的影响。世界卫生组织报道,截止到2017年,世界上约有3亿人患有抑郁症。在中国,抑郁症的发病率约为6.1%,目前已确诊的抑郁症患者为3000万人左右。这3000万抑郁症患者只有不到10%得到专业的救助和治疗,同时,还有相当多的患者根本没有意识到自己患有抑郁。而且很多医院对抑郁症的识别率不高,导致患者经常被漏诊。抑郁症如果得不到及时治疗,将会导致抑郁症慢性化,或者发展成为较难治性病症,严重者还会出现残疾,甚至***。因此,对抑郁症的精准识别是亟需解决的医学问题之一。
当前主流的抑郁症临床自评量表之一是PHQ-9(抑郁症自我评估量表)问卷,包含一些特定问题,例如,睡眠如何、有没有感到沮丧、曾经是否有过***行为等问题,针对每一道问题的回答给出相应的得分,最终计算求和得到PHQ-9总得分。PHQ-9得分只是作为判断是否为抑郁症的一个重要参考指标,最终的确诊与否依然是根据专业医生长期的观察、问询中得到。这种方法有两个缺陷,其一是PHQ-9自评表完全由被测用户决定,例如被测用户不愿意透露某些事情,比较典型的就是很多人不愿意分享自己曾经的***经历,诸如此类,这样会对PHQ-9得分产生一定影响。第二个弊端就是,专业医生医疗资源有限,且即使是专业医生对抑郁症的判断,也会难免出现误诊、漏诊等现象,甚至出现不同的医生对同一被测用户得出不同的诊断结果,抑郁症诊断识别难以客观量化。
为了克服上述弊端,出现了基于视频信息、基于音频特征等单模态信息的抑郁症检测方法。对于音频数据而言,通过提取音频数据的梅尔频谱系数等特征进行识别,其最佳准确性达到74.3%。对于视频数据而言,通过OpenFace提取人脸上的68个点的3D特征进行识别,其准确性达到73.7%。这种方法虽然是通过机器学习自动识别,然而识别精度并不是很高。仅仅通过音频特征或者视频特征来识别,其包含的判别信息并不够,识别精度也没有能够达到临床要求。
鉴于此,本发明实施例中,结合传统临床诊断方法和现代机器学习方法,提出一种基于文本的抑郁症识别方法。该方法首先通过专业医生和被测用户进行对话,其对话内容是针对抑郁症设计的特定的问题,然后将获取到的语音信息转换为文本信息。基于转换后的文本信息,采用基于Bert-Lstm的文本情感识别和关键词识别相融合的方法进行判别。基于Bert-Lstm的文本情感识别方法主要基于Bert将文本信息转换成文本嵌入向量,然后采用LSTM对文本嵌入向量进行建模,最后利用训练好的Bert-Lstm模型对文本进行分类。关键词识别的目标是对对话中敏感的关键词进行判别,找出正常人与抑郁症患者有着显著差异的词汇。之后将两种方法得到的结果在决策层级别进行融合,通过实验反复训练给予适当的权重。相比于基于视频、音频数据的方法,这种方法采用文本所带来的信息更加准确、直观,并且能够切中要领,其识别准确度也相对较高。本发明实施例提供的方法可以在PC(个人计算机)、移动客户端等部署,具有简便、高效、快捷的特点,可以辅助抑郁症的诊断识别。
参见图1,本发明实施例提供的基于文本的抑郁症识别方法可以由以下5部分组成,分别为:数据采集预处理、文本转换、文本嵌入建模、关键词识别、决策级融合。其中,在数据采集预处理流程中,本发明实施例中,通过麦克风收集被测用户的语音信息,同时删去了医生或者机器提问的语音,避免外界语音噪声过大。在文本转换流程中,本发明实施例采用语音-文本转换技术,或者是请专业人员进行翻译,避免了口音、语速等个人混淆因素。在文本嵌入建模流程中,本发明实施例采用Bert句子级嵌入,之后采用LSTM(长短时记忆模型)网络对文本信息中的句子进行建模。在关键词识别流程中,本发明对有关抑郁症的敏感词进行筛选,然后从文本信息的语义中识别这些目标关键词,进行加权得分判别。在决策级融合流程中,融合了文本嵌入建模和关键词识别两个流程的判别结果,然后给出最终结果。
具体地,如图2所示,其为本发明实施例提供的基于文本的抑郁症识别方法的实施流程示意图,包括以下步骤:
S21、获取被测用户的语音信息并转换为文本信息。
本步骤中,可以采用问答访谈的形式,其问题包含一些和抑郁症相关的问题,例如最近三个月睡眠如何、有没有食欲不振或者暴饮暴食的现象、是否感觉到沮丧、难以集中精力做某件事等等。提问语音,可以是机器语音,来询问一些固定的问题,也可以是专业医生转换后的语音。
采集到问答语音信息后,可以对采集的语音信息进行预处理,删除与被测用户回答无关的语音,主要包括提问语音和对话间隙空白,这样可以保证输入到模型中的数据只包含被测用户的数据。
具体实施时,可以按照以下任一方式进行预处理:
方法一、分别记录下问答的起始、结束时间,根据时间区间进行删除;
方法二、根据语音特征进行筛选剔除。
在另外一种实施方式中,还可以在记录语音的时候,只记录被测用户的语音,这样最方便快捷。另外,对于被测用户发出的语气词,或者是出现抽泣,大笑等语音要予以保留,这些往往包含着非常关键的信息,有时能从这些语义数据中提取到一些深层特征。
具体实施时,可以采取以下任一方式获取被测用户的语音信息:其一是开发成手机APP(应用程序)或者电脑软件,这样被测用户可以自助或在家人的帮助下进行诊断,方便快捷;其二是被测用户在线上或者医院与医生直接对话,将回答记录下来,这样的问答比较灵活,医生可以根据患者的自身或者回答情况进行进一步问询,做出更准确的诊断。
在获取了被测用户的语音信息之后,将语音信息转换为文本信息。这样,首先可以避免口音、语速、语调等因个体不同而产生的混淆因素。其次,如果直接用语音信息进行判别,往往只是从频谱特征,或者是振幅、相位特征进行判别,从而忽略了语义特征,这样识别的精度不会很高。
本发明实施例中,语音信息转换成文本信息的方法主要有两种,其一是利用成熟的语音-文本转换算法模型进行转换,这样省时省力,方便快捷,其二是进行专业人工翻译,这样虽然比较耗时,但是转换的精准度比前者要高。
S22、将获得的文本信息转换为文本嵌入向量。
具体实施时,根据被测用户的语音信息转换得到的文本信息由按照时间顺序排列的若干个句子组成。基于此,可以基于Bert模型,将按照时间顺序排列的若干个句子分别转换为文本嵌入模型,得到按照时间顺序排列的若干个文本嵌入向量。
具体地,如图3所示,本发明实施例采用了基于Bert模型的句子级别768维度文本嵌入,将被测用户的每句话中每个单词转换为768维的向量,例如可以将“i can’t sleep”转换为3个768维的向量,这即是单词级别文本嵌入。相比于经典的Word2Vec嵌入,Bert级别嵌入是上下文相关的,例如“I work in a bank”(我在银行工作)、“river bank”(河边),这两个“bank”所转换嵌入的向量是不一样的。
需要说明的是,本发明实施例可以采用基于中文文本的Bert预训练模型处理中文文本信息。本发明实施例采用句子级别文本嵌入,可以将转换后的3个768维度的向量求平均,得到1个768维度的向量,这便是该句“i can’t sleep”的句子级向量表达。对于一个被测用户而言,会有很多的回答语句,具体实施时,可以将被测用户的每一句话,都转换成这样的768维度的向量,这样就得到了以时间顺序排列的多个768维的文本嵌入向量,其数量为该被测用户所回答的总句子数。
S23、基于得到的文本嵌入向量,利用抑郁症预测模型进行预测得到预测结果。其中,所述抑郁症预测模型为利用长短时记忆模型LSTM对文本嵌入向量样本进行训练得到的,所述文本嵌入向量样本中包括抑郁症文本嵌入向量样本和非抑郁症文本嵌入向量样本。通过Bert建模,可以得到具有时序特性的多维句子向量,且维度均为768。LSTM模型可以学习到时序特征中一些深层的信息,适用于处理时序问题,而且在解决传统循环神经网络梯度消失或***问题上具有独特的优势。本发明实施例中,将768维向量看成是特征数,其步长为该被测用户的总句子数,根据每句话的时间先后顺序进行循环。由于每个被测用户的总句子数不一样,这里采用双向变长LSTM模型,也就是最大步长为最多的句子数,每个被测用户都有一个变量为其有效长度。当LSTM网络隐藏层循环到其有效长度时,便停止循环,向输出层输出结果。在一个实施例中,损失函数可以采用交叉熵损失函数,学习速率为0.01,神经元节点均为64。
S24、确定所述文本信息中包含的目标关键词。如表1所示,其为常见的抑郁症相关的关键词。
表1
Figure BDA0002375729130000091
如图4所示,基于英文DAIC(Distress Analysis Interview Corpus,抑郁分析访谈语料库)数据集中,关于四类关键词的抑郁症患者和非抑郁症出现的频率,第一列2.48表示在非抑郁症患者中,平均每一万个单词中会含有2.48个一类关键词,由图4可知,这四类关键词在抑郁症患者和非抑郁症出现的频率有着显著不同的。其中,目标关键词包括多个类别,每一类别的目标关键词对应的权重值不同。
在一个实施例中,可以将抑郁症相关的关键词分为四类,第一类为与抑郁症相关性很高的关键词,例如“suicidal”、“kill myself”、“depression”、“mental illness”,有***倾向是抑郁症的一个显著特征,另外很多抑郁症患者也清楚自己患有抑郁症,或者是精神疾病,因此和***、抑郁症相关的词为高度相关的关键词。第二类为与睡眠相关的关键词,例如“not sleep”、“difficult sleeping”、“insomnia”、“nightmares”、“toss andturn”,抑郁症患者通常伴随着长期失眠和食欲不振等的症状,这里将有关失眠的关键词单独提取出来作为一类。第三类为通常抑郁症患者的表现,主要为感到沮丧、焦虑、无助,例如“depressed”、“upset”、“hopelessness”、“helpless”等,这一类说明了抑郁症的典型症状,正常人偶尔会发生失落的心理,但抑郁症患者会长期处于沮丧、不兴奋的状态。据统计,90%的抑郁症患者在持续的狂躁后进入抑郁状态,60%的患者经历持续的抑郁状态后又表现出狂躁的症状,因此,第四类主要为易怒、孤独,这一类相关性比较小的,因为正常人也会出现狂躁、易怒、感到孤独等现象,只是抑郁症患者出现频率较高的,这样的关键词例如“irritable”、“uncontrollable”、“seclusive”、“loner”等。
具体实施时,可以在被测用户的文本信息中找出这四类关键词,对于每一类关键词训练出恰当的权重。
实验结果显示,记录关键词是否出现比记录出现次数得到的识别精度更好。基于此,在一种实施方式中,如果一个关键词出现多次,只计算一次的权重得分,不累计计数。
另外,如果在含有该关键词中的句子中同时识别出有否定意义的否定词,例如“not”、“no”、“without”、“never”、“hardly”、“none”、“neither”、“litter”、“few”等词,则该关键词无效,比如“i don’t want to suicide”,该关键词“suicide”不计入得分,最终计算出该被测用户的关键词总得分,例如,四类得分分别为10,5,3,1。
基于此,本发明实施中,可以按照以下流程确定文本信息中包含的目标关键词:从所述文本信息中搜索预设的候选关键词;针对搜索出的候选关键词,判断所述候选关键词所在的句子中是否包含否定词;确定所在句子中不包含否定词的候选关键词为所述目标关键词。
S25、根据预测结果及其对应的权重值和目标关键词及其对应的权重值的加权结果,确定被测用户是否属于抑郁症用户。
本步骤中,将步骤S23的预测结果和关键词识别的得分进行决策融合。具体地,可以将预测结果和目标关键字各自对应的权重值进行加权计算得到总得分。
例如,具体实施时,可以按照以下公式确定被测用户的总得分:R*α+K*β,其中,R表示根据抑郁症预测模型输出的预测结果对应的得分,K表示目标关键字对应的得分,其中,命中多个关键字时,K可以以各个关键字对应的得分之和累加计算,α和β分别表示R和K对应的权重值,α+β=1。
其中,R可以根据经验值或者实验结果来设定,本发明实施例对此不进行限定。例如,可以设定为如果抑郁症预测模型输出的预测结果为“是”时,R=22,如果抑郁症预测模型输出的预测结果为“否”时,R=0。
具体实施时,各类关键字对应的得分可以根据经验值或者实验结果进行设定,每一类关键字对应的得分可以不同,本发明实施例对此不进行限定。例如,根据经验值或者实验结果可以设定第一类关键字对应的得分为10,确定第二类关键字对应的得分为7分,设定第三类关键字对应的得分为5,设定第四类关键字对应的得分为3分。K初始值为0,每命中一个不同的关键字,则根据命中的关键字的类别累加相应的得分;命中同一个关键词多次,只计算一次的权重得分,不累计计数。例如,当第一次命中第二类关键字时,在当前关键字得分的基础上加7,由此可以得到K的值,如果再次命中第二类关键字则不再累计加分。
为了便于理解,以抑郁症预测模型输出的预测结果是抑郁症,目标关键词命中2个第一类关键词,1个第二类关键词为例,由此可以确定,R=22,K=17被测用户对应的总得分为:22*α+17*β。进一步地,判断被测用户对应的总得分是否大于预先设定的最佳阈值,如果大于,则确定被测用户为抑郁症,如果不大于,则确定被测用户不是抑郁症。
需要说明的是,具体实施时,α和β的具体数值可以根据经验值或者实验结果进行设定,本发明实施例对此不进行限定。
如图5所示,其为步骤S23和步骤S24进行融合的流程示意图。
本发明实施例中,通过麦克风阵列得到语音信号并将其转换为文本信息,进而利用基于文本的特征进行识别。该方法不需要采集患者面部视频,有助于保护受试者的隐私。传统的方法基于PHQ-9问卷进行试验,主观性较大,本发明实施例得出的结果较为量化、客观。在英文DAIC数据集上,本发明的平均识别准确度为80%,相比目前基于视频、音频的机器学习方法,识别准确度有所提高。
相比现有技术,本发明可以在大部分场合下使用,比如在被测用户家中等,不一定局限于正规医院中,不受使用场所的限定,更加快捷、高效,也更能保护患者的隐私等情况。另外,本发明采用深度LSTM神经网络使用循环层对文本信息进行建模,更好地表达了文本信息的上下文相关性,可以通过优化模型、增加模型复杂度等方法,挖掘更深层次的文本特征,从而大幅地提高抑郁症的识别率。
本发明实施例还提供了一种基于文本的抑郁症识别装置,如图6所示,包括:
文本转换单元61,用于获取被测用户的语音信息并转换为文本信息;
向量转换单元62,用于将所述文本信息转换为文本嵌入向量;
预测单元63,用于基于所述文本嵌入向量,利用抑郁症预测模型进行预测得到预测结果,所述抑郁症预测模型为利用长短时记忆模型LSTM对文本嵌入向量样本进行训练得到的,所述文本嵌入向量样本中包括抑郁症文本嵌入向量样本和非抑郁症文本嵌入向量样本;
第一确定单元64,用于确定所述文本信息中包含的目标关键词;
第二确定单元65,用于根据所述预测结果及其对应的权重值和所述目标关键词及其对应的权重值的加权结果,确定所述被测用户是否属于抑郁症用户。
在一种实施方式中,所述文本信息由按照时间顺序排列的若干个句子组成;
所述向量转换单元62,具体用于基于Bert模型,将按照时间顺序排列的若干个句子分别转换为文本嵌入模型,得到按照时间顺序排列的若干个文本嵌入向量。
在一种实施方式中,所述第一确定单元64,具体用于从所述文本信息中搜索预设的候选关键词;针对搜索出的候选关键词,判断所述候选关键词所在的句子中是否包含否定词;确定所在句子中不包含否定词的候选关键词为所述目标关键词。
在一种实施方式中,所述目标关键词包括多个类别,其中,每一类别的目标关键词对应的权重值不同。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本发明时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
在介绍了本发明示例性实施方式的基于文本的抑郁症识别方法和装置之后,接下来,介绍根据本发明的另一示例性实施方式的计算装置。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为***、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
在一些可能的实施方式中,根据本发明的计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行本说明书上述描述的根据本发明各种示例性实施方式的基于文本的抑郁症识别方法中的步骤。例如,所述处理器可以执行如图2中所示的步骤S21、获获取被测用户的语音信息并转换为文本信息,和步骤S22、将获得的文本信息转换为文本嵌入向量;以及步骤S23、基于得到的文本嵌入向量,利用抑郁症预测模型进行预测得到预测结果;步骤S24、确定所述文本信息中包含的目标关键词;步骤S25、根据预测结果及其对应的权重值和目标关键词及其对应的权重值的加权结果,确定被测用户是否属于抑郁症用户。
下面参照图7来描述根据本发明的这种实施方式的计算装置70。图7显示的计算装置70仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算装置70以通用计算设备的形式表现。计算装置70的组件可以包括但不限于:上述至少一个处理器71、上述至少一个存储器72、连接不同***组件(包括存储器72和处理器71)的总线73。
总线73表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、***总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器72可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)721和/或高速缓存存储器722,还可以进一步包括只读存储器(ROM)723。
存储器72还可以包括具有一组(至少一个)程序模块724的程序/实用工具725,这样的程序模块724包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置70也可以与一个或多个外部设备74(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与计算装置70交互的设备通信,和/或与使得该计算装置70能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口75进行。并且,计算装置70还可以通过网络适配器76与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器76通过总线73与用于计算装置70的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置70使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
在一些可能的实施方式中,本发明提供的基于文本的抑郁症识别方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本发明各种示例性实施方式的基于文本的抑郁症识别方法中的步骤,例如,所述计算机设备可以执行如图2中所示的步骤S21、获获取被测用户的语音信息并转换为文本信息,和步骤S22、将获得的文本信息转换为文本嵌入向量;以及步骤S23、基于得到的文本嵌入向量,利用抑郁症预测模型进行预测得到预测结果;步骤S24、确定所述文本信息中包含的目标关键词;步骤S25、根据预测结果及其对应的权重值和目标关键词及其对应的权重值的加权结果,确定被测用户是否属于抑郁症用户。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本发明的实施方式的用于基于文本的抑郁症识别的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
通过具体实施方式的说明,应当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图示用于提供参考与说明,并非用来对本发明加以限制。

Claims (10)

1.一种基于文本的抑郁症识别方法,其特征在于,包括:
获取被测用户的语音信息并转换为文本信息;
将所述文本信息转换为文本嵌入向量;
基于所述文本嵌入向量,利用抑郁症预测模型进行预测得到预测结果,所述抑郁症预测模型为利用长短时记忆模型LSTM对文本嵌入向量样本进行训练得到的,所述文本嵌入向量样本中包括抑郁症文本嵌入向量样本和非抑郁症文本嵌入向量样本;
确定所述文本信息中包含的目标关键词;
根据所述预测结果及其对应的权重值和所述目标关键词及其对应的权重值的加权结果,确定所述被测用户是否属于抑郁症用户。
2.根据权利要求1所述的方法,其特征在于,所述文本信息由按照时间顺序排列的若干个句子组成;以及将所述文本信息转换为文本嵌入向量,具体包括:
基于Bert模型,将按照时间顺序排列的若干个句子分别转换为文本嵌入模型,得到按照时间顺序排列的若干个文本嵌入向量。
3.根据权利要求2所述的方法,其特征在于,确定所述文本信息中包含的目标关键词,具体包括:
从所述文本信息中搜索预设的候选关键词;
针对搜索出的候选关键词,判断所述候选关键词所在的句子中是否包含否定词;
确定所在句子中不包含否定词的候选关键词为所述目标关键词。
4.根据权利要求1所述的方法,其特征在于,所述目标关键词包括多个类别,其中,每一类别的目标关键词对应的权重值不同。
5.一种基于文本的抑郁症识别装置,其特征在于,包括:
文本转换单元,用于获取被测用户的语音信息并转换为文本信息;
向量转换单元,用于将所述文本信息转换为文本嵌入向量;
预测单元,用于基于所述文本嵌入向量,利用抑郁症预测模型进行预测得到预测结果,所述抑郁症预测模型为利用长短时记忆模型LSTM对文本嵌入向量样本进行训练得到的,所述文本嵌入向量样本中包括抑郁症文本嵌入向量样本和非抑郁症文本嵌入向量样本;
第一确定单元,用于确定所述文本信息中包含的目标关键词;
第二确定单元,用于根据所述预测结果及其对应的权重值和所述目标关键词及其对应的权重值的加权结果,确定所述被测用户是否属于抑郁症用户。
6.根据权利要求5所述的装置,其特征在于,所述文本信息由按照时间顺序排列的若干个句子组成;
所述向量转换单元,具体用于基于Bert模型,将按照时间顺序排列的若干个句子分别转换为文本嵌入模型,得到按照时间顺序排列的若干个文本嵌入向量。
7.根据权利要求6所述的装置,其特征在于,
所述第一确定单元,具体用于从所述文本信息中搜索预设的候选关键词;针对搜索出的候选关键词,判断所述候选关键词所在的句子中是否包含否定词;确定所在句子中不包含否定词的候选关键词为所述目标关键词。
8.根据权利要求5所述的装置,其特征在于,所述目标关键词包括多个类别,其中,每一类别的目标关键词对应的权重值不同。
9.一种计算装置,其特征在于,所述计算装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的方法的步骤。
10.一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述方法的步骤。
CN202010065096.5A 2020-01-20 2020-01-20 一种基于文本的抑郁症识别方法 Pending CN111241817A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010065096.5A CN111241817A (zh) 2020-01-20 2020-01-20 一种基于文本的抑郁症识别方法
PCT/CN2020/117579 WO2021147363A1 (zh) 2020-01-20 2020-09-25 一种基于文本的抑郁症识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010065096.5A CN111241817A (zh) 2020-01-20 2020-01-20 一种基于文本的抑郁症识别方法

Publications (1)

Publication Number Publication Date
CN111241817A true CN111241817A (zh) 2020-06-05

Family

ID=70865650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010065096.5A Pending CN111241817A (zh) 2020-01-20 2020-01-20 一种基于文本的抑郁症识别方法

Country Status (2)

Country Link
CN (1) CN111241817A (zh)
WO (1) WO2021147363A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111883252A (zh) * 2020-07-29 2020-11-03 济南浪潮高新科技投资发展有限公司 一种婴儿自闭症辅助诊断方法、装置、设备和存储介质
CN112582061A (zh) * 2020-12-14 2021-03-30 首都医科大学 基于文本问答的抑郁症辅助筛查方法、***及存储介质
CN112768070A (zh) * 2021-01-06 2021-05-07 万佳安智慧生活技术(深圳)有限公司 一种基于对话交流的精神健康评测方法和***
CN112927781A (zh) * 2021-02-10 2021-06-08 杭州医典智能科技有限公司 一种基于自然语言处理和时序卷积网络的抑郁症检测方法
WO2021147363A1 (zh) * 2020-01-20 2021-07-29 中国电子科技集团公司电子科学研究院 一种基于文本的抑郁症识别方法
CN114298012A (zh) * 2021-12-31 2022-04-08 中国电子科技集团公司电子科学研究院 生成长文本科技情报模型的优化方法
CN115631772A (zh) * 2022-10-27 2023-01-20 四川大学华西医院 自伤***危险性评估方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284387A (zh) * 2018-10-19 2019-01-29 昆山杜克大学 刻板特异用语检测***、方法、计算机设备和存储介质
CN110147445A (zh) * 2019-04-09 2019-08-20 平安科技(深圳)有限公司 基于文本分类的意图识别方法、装置、设备及存储介质
CN110222827A (zh) * 2019-06-11 2019-09-10 苏州思必驰信息科技有限公司 基于文本的抑郁判定网络模型的训练方法
CN110532387A (zh) * 2019-08-14 2019-12-03 成都中科云集信息技术有限公司 一种基于开放性问答文本的抑郁症辅助检测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106782602B (zh) * 2016-12-01 2020-03-17 南京邮电大学 基于深度神经网络的语音情感识别方法
CN110110330B (zh) * 2019-04-30 2023-08-11 腾讯科技(深圳)有限公司 基于文本的关键词提取方法和计算机设备
CN110413788B (zh) * 2019-07-30 2023-01-31 携程计算机技术(上海)有限公司 会话文本的场景类别的预测方法、***、设备和存储介质
CN111241817A (zh) * 2020-01-20 2020-06-05 首都医科大学 一种基于文本的抑郁症识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284387A (zh) * 2018-10-19 2019-01-29 昆山杜克大学 刻板特异用语检测***、方法、计算机设备和存储介质
CN110147445A (zh) * 2019-04-09 2019-08-20 平安科技(深圳)有限公司 基于文本分类的意图识别方法、装置、设备及存储介质
CN110222827A (zh) * 2019-06-11 2019-09-10 苏州思必驰信息科技有限公司 基于文本的抑郁判定网络模型的训练方法
CN110532387A (zh) * 2019-08-14 2019-12-03 成都中科云集信息技术有限公司 一种基于开放性问答文本的抑郁症辅助检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
L. YANG等: "《"Hybrid depression classifification and estimation from audio video and text information》", 《PROCEEDINGS OF THE 7TH ANNUAL WORKSHOP ON AUDIO/VISUAL EMOTION CHALLENGE》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021147363A1 (zh) * 2020-01-20 2021-07-29 中国电子科技集团公司电子科学研究院 一种基于文本的抑郁症识别方法
CN111883252A (zh) * 2020-07-29 2020-11-03 济南浪潮高新科技投资发展有限公司 一种婴儿自闭症辅助诊断方法、装置、设备和存储介质
CN112582061A (zh) * 2020-12-14 2021-03-30 首都医科大学 基于文本问答的抑郁症辅助筛查方法、***及存储介质
CN112768070A (zh) * 2021-01-06 2021-05-07 万佳安智慧生活技术(深圳)有限公司 一种基于对话交流的精神健康评测方法和***
CN112927781A (zh) * 2021-02-10 2021-06-08 杭州医典智能科技有限公司 一种基于自然语言处理和时序卷积网络的抑郁症检测方法
CN114298012A (zh) * 2021-12-31 2022-04-08 中国电子科技集团公司电子科学研究院 生成长文本科技情报模型的优化方法
CN115631772A (zh) * 2022-10-27 2023-01-20 四川大学华西医院 自伤***危险性评估方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2021147363A1 (zh) 2021-07-29

Similar Documents

Publication Publication Date Title
CN111241817A (zh) 一种基于文本的抑郁症识别方法
De la Fuente Garcia et al. Artificial intelligence, speech, and language processing approaches to monitoring Alzheimer’s disease: a systematic review
Haider et al. An assessment of paralinguistic acoustic features for detection of Alzheimer's dementia in spontaneous speech
Mirheidari et al. Dementia detection using automatic analysis of conversations
Luz et al. A method for analysis of patient speech in dialogue for dementia detection
Khodabakhsh et al. Evaluation of linguistic and prosodic features for detection of Alzheimer’s disease in Turkish conversational speech
Weiner et al. Manual and Automatic Transcriptions in Dementia Detection from Speech.
Bertini et al. An automatic Alzheimer’s disease classifier based on spontaneous spoken English
Li et al. An automated assessment framework for atypical prosody and stereotyped idiosyncratic phrases related to autism spectrum disorder
Pan et al. Automatic hierarchical attention neural network for detecting AD
CN111329494B (zh) 抑郁症参考数据的获取方法及装置
Rohanian et al. Alzheimer's dementia recognition using acoustic, lexical, disfluency and speech pause features robust to noisy inputs
Mirheidari et al. An avatar-based system for identifying individuals likely to develop dementia
Martinc et al. Temporal integration of text transcripts and acoustic features for Alzheimer's diagnosis based on spontaneous speech
Themistocleous et al. Automatic subtyping of individuals with primary progressive aphasia
Verde et al. A methodology for voice classification based on the personalized fundamental frequency estimation
Nasreen et al. Alzheimer’s dementia recognition from spontaneous speech using disfluency and interactional features
CN111145903A (zh) 获取眩晕症问诊文本的方法、装置、电子设备及问诊***
Fu et al. Predicting mini-mental status examination scores through paralinguistic acoustic features of spontaneous speech
Tseng et al. Approaching Human Performance in Behavior Estimation in Couples Therapy Using Deep Sentence Embeddings.
Danner et al. Advancing mental health diagnostics: GPT-based method for depression detection
Li et al. Improvement on speech depression recognition based on deep networks
Wang et al. Automatic Detection of Putative Mild Cognitive Impairment from Speech Acoustic Features in Mandarin-Speaking Elders
Roshanzamir et al. Transformer-based deep neural network language models for Alzheimer’s disease detection from targeted speech
CN112599119A (zh) 大数据背景下运动性构音障碍语音库的建立及分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200605

RJ01 Rejection of invention patent application after publication