CN116795986A

CN116795986A - 基于句子补全测验的意念智能化测评方法及

Info

Publication number: CN116795986A
Application number: CN202310752586.6A
Authority: CN
Inventors: 田雪涛; 骆方; 王欣夷
Original assignee: Beijing Normal University
Current assignee: Beijing Normal University
Priority date: 2023-06-25
Filing date: 2023-06-25
Publication date: 2023-09-22

Abstract

本发明涉及一种基于句子补全测验的***意念智能化测评方法及***，属于心理测量学和人工智能交叉技术领域，该方法基于***经典理论模型设计得到待补全句子，从而使得待测评人员可以根据每个待补全句子，输入补全信息，将补全信息输入到预先构建的***意念测评模型中，进行***意念测评结果，判断该待测人员是否存在***意念，及早进行干预。其中，预先构建的***意念测评模型通过设置包括预训练语言模型和无监督主题模型，从而根据补全信息的类别和主题特征对补全信息进行分类，提高预测准确性。由于设置了待补全句子，待测评人员可以直接根据待补全句子进行补全，避免了因社会期许性导致的采集数据不准确的问题；同时，无需面对面访谈，减少限制。

Description

基于句子补全测验的***意念智能化测评方法及***

技术领域

本发明涉及心理测量学和人工智能交叉技术领域，具体涉及一种基于句子补全测验的***意念智能化测评方法及***。

背景技术

***是全球性的公共健康问题。尤其令人担忧的是青少年***问题，数据显示***是10至24岁年轻人的第二大死亡原因。相较于儿童时期，青少年在***时的***意念和行为显著增加，因此***是有效预防和干预***的关键时期。***意念是预测***死亡的第三大强预测因素，在***意念发展为具体行为之前更好地识别和管理***意念可以有效减少随后的***企图和***死亡。但相较于明显可见的***行为，***意念更加短暂和不稳定。因此，如何准确识别***意念是一个很关键的问题，早期发现和评估***意念可以有效预防***。

在传统技术中，主要依赖于自我报告式的自陈量表和面对面访谈来评估青少年的***意念，例如，《哥伦比亚***严重程度评估量表》、《***态度问卷》、《贝克***意念量表》、《***风险评估量表》、《综合性国际诊断访谈》等。但是，自陈量表和面对面访谈存在以下问题：(1)自我报告式工具具有社会期许性这一通性问题，***意念患者可能因担心如实报告后可能的负面结果(如住院)等问题而隐瞒信息；(2)面对面访谈与自陈量表相比，还受到时间、成本和调查规模的限制；面试花费的时间更多，对医护人员的专业水平要求更高，因此它无法适用与大规模筛查场景；此外，面试官的态度、质量和经验会对面试结果产生特别的影响。

因此，传统技术在进行青少年的***意向时，存在数据采集不准确、限制较多的技术问题。面向主动大规模施测场景，例如中小学群体，尚不存在自陈量表外的其它有效手段。

发明内容

有鉴于此，本发明的目的在于提供一种基于句子补全测验的***意念智能化测评方法及***，以克服目前数据采集不准确、限制较多，导致***意念测评不准确的问题。

为实现以上目的，本发明采用如下技术方案：

一方面，一种基于句子补全测验的***意念智能化测评方法，包括：

基于待补全句子，获取所述待补全句子的补全信息；其中，所述待补全句子为根据***经典理论模型得到；

将所述补全信息输入到***意念测评模型中，得到与所述补全信息相对应的***意念测评结果；

其中，所述***意念测评模型为基于补全信息样本和预先确定的***意念标签进行训练后得到，所述***意念标签与所述补全信息样本一一对应；

所述***意念测评模型包括预训练语言模型和无监督主题模型，以及分别与所述预训练语言模型和无监督主题模型的输出端相连的连接层；所述预训练语言模型，用于获取所述补全信息的类别；所述无监督主题模型，用于获取所述补全信息的主题特征；所述连接层，用于连接所述类别和所述主题模型，预测得到所述补全信息的***意念评价结果。

可选的，所述将所述补全信息输入到***意念测评模型中，得到与所述补全信息相对应的***意念测评结果，包括：

通过所述预训练语言模型，对所述待补全句子和对应的补全信息进行编码，得到所述补全信息的类别；

通过所述无监督主题模型，对所述待补全句子和对应的补全信息进行特征提取，得到所述补全信息的主题特征；

通过所述连接层，对所述补全信息和类别和主题特征进行连接，预测所述补全信息的***意念评价结果。

可选的，所述通过所述预训练语言模型，对所述待补全句子和对应的补全信息进行编码，得到所述补全信息的类别，包括：

基于所述预训练语言模型，提取每个所述待补全句子和对应的补全信息的深度表征特征；

根据所述深度表征特征，编码预测所述补全信息的类别。

可选的，所述***意念测评模型的训练方法，包括：

获取待补全句子样本、对应补全信息样本及对应的***意念标签；其中，所述***意念标签为预先标注；

基于待补全句子样本、对应补全信息样本及对应的***意念标签，对初始语言模型进行迭代训练；以及，基于待补全句子样本、对应补全信息样本及对应的***意念标签，对初始无监督主题模型进行迭代训练；

将所述初始语言模型和所述初始无监督主题模型连接所述连接层，输出所述补全信息的***意念评价结果，训练得到所述预训练语言模型和所述无监督主题模型。

可选的，在所述初始语言模型的迭代训练过程中，采用如下交叉熵损失函数：

其中，C_i表示人工编码的类别信息，C_i ^pred表示模型预测的类别信息。

可选的，在所述初始语言模型的迭代训练过程中，对同一编码的补全信息和不同编码的补全信息应用对比学习损失函数：

f_PLM(A_i)＝H_i

其中，A_i表示待补全句子样本的对应补全信息样本，H_i为由预训练语言模型得到的深度向量表示；对于每一个表示H_i，将与其相同编码的表示记作H_i ⁺，不同的记作H_i-；通过定义距离函数f_d，对比学习损失函数使得相同编码的作答的深度向量表示更相近。

可选的，所述基于待补全句子样本、对应补全信息样本及对应的***意念标签，对初始主题模型进行迭代训练，包括：

利用以下公式，将所述补全信息进行低纬度向量表示，得到所述补全信息的表征结果：

f_topic(A)＝T

其中，T表示通过无监督主题模型获取的主题维度的表示，即一个长度为t的向量。

将所述类别和所述主题特征输入至所述连接层，进行***意念的二分类预测，得到***意念评价结果；

其中，得到***意念评价结果过程采用Focal损失函数进行预测：

其中，y表示个体真实的***意念，由专业量表测得，y^表示模型由编码特征C和主题特征T预测的结果，γ表示Focal损失函数的温度系数，可根据数据分布情况进行设置。

可选的，所述基于待补全句子，获取所述待补全句子的补全信息，包括：

显示所述待补全句子，获取用户对每个所述待补全句子的输入信息，作为补全信息；或，

语音播报所述待补全句子，获取用户对每个所述待补全句子的输入信息，作为补全信息。

又一方面，一种基于句子补全测验的***意念智能化测评***，包括处理器和存储器，所述处理器与存储器相连：

其中，所述处理器，用于调用并执行所述存储器中存储的程序；

所述存储器，用于存储所述程序，所述程序至少用于上述任一项所述的基于句子补全测验的***意念智能化测评方法。

本发明提供的技术方案，至少具备如下有益效果：

基于***经典理论模型设计得到待补全句子，从而使得待测评人员可以根据每个待补全句子，输入补全信息，将补全信息输入到预先构建的***意念测评模型中，进行***意念测评结果，判断该待测人员是否存在***意念，及早进行干预。其中，预先构建的***意念测评模型通过设置包括预训练语言模型和无监督主题模型，从而根据补全信息的类别和主题特征对补全信息进行分类，提高预测准确性。由于设置了待补全句子，待测评人员可以直接根据待补全句子进行补全，避免了因社会期许性导致的采集数据不准确的问题；同时，无需面对面访谈，减少限制。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的一种基于句子补全测验的***意念智能化测评方法的流程示意图；

图2为本发明一实施例提供的一种预训练语言模型的编码示意图；

图3为本发明一实施例提供的一种无监督主题模型的工作示意图；

图4为本发明一实施例提供的一种***意念测评模型的工作示意图；

图5为本发明一实施例提供的一种***意念测评模型的训练示意图；

图6是本发明一实施例提供的一种基于句子补全测验的***意念智能化测评***的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将对本发明的技术方案进行详细的描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式，都属于本发明所保护的范围。

如背景技术记载，自陈量表和面对面访谈存在以下问题：(1)自我报告式工具具有社会期许性这一通性问题，***意念患者可能因担心如实报告后可能的负面结果(如住院)等问题而隐瞒信息；(2)面对面访谈与自陈量表相比，还受到时间、成本和调查规模的限制；面试花费的时间更多，对医护人员的专业水平要求更高，因此它无法适用与大规模筛查场景；此外，面试官的态度、质量和经验会对面试结果产生特别的影响；(3)受限于***意念的不稳定性等因素，传统工具获取的***意念相关数据通常来自单个机构或地区，难以获取大量样本并阻碍了基于大规模人口统计的子集分析，从而限制了研究结果的普遍性。

已有研究者尝试探索了基于社交媒体数据对用户***意念水平进行评估，使用机器学习方法自动化分析论坛上用户发布的文本评论数据。但研究无法揭示用户发表评论的背后意图或动机，并且用户的心理特征、离线行为和历史等信息可能不会被提及。此外，并非所有具有***意念的患者选择在社区这类论坛上发布评论和寻求帮助，难以覆盖大规模的关键人群。

基于此，本发明实施例提供一种基于句子补全测验的***意念智能化测评方法及***，可以应用于主动大规模测试场景，测试青少年的***意念，例如，中小学群体。

图1为本发明一实施例提供的一种基于句子补全测验的***意念智能化测评方法的流程示意图，请参阅图1，本实施例可以包括以下步骤：

步骤S11、基于待补全句子，获取所述待补全句子的补全信息；其中，所述待补全句子为根据***经典理论模型得到；

步骤S12、将所述补全信息输入到***意念测评模型中，得到与所述补全信息相对应的***意念测评结果；

可以对中小学群体应用本申请提供的基于句子补全测验的***意念智能化测评方法进行***意念测评。值得说明的是，本申请的基于句子补全测验的***意念智能化测评方法可以集成在软件中，通过各终端下载该软件后，使得各待测评人员使用。

例如，终端可以提示每个待补全句子，待测评人员对该待补全句子进行补全，补全信息输入到***意念测评模型中，得到与所述补全信息相对应的***意念测评结果。其中，***意念测评结果可以为具有***意念，或，无***意念。

值得说明的是，其中，待补全句子可以为12个，根据***经典理论模型获得，具体的获取方式可以为：(1)首先根据心理学里的***经典理论，出一系列的题目，采集至少1000中小学生的作答，并且通过既有的其它工具获得这些人的***意念水平(也就是标签)；(2)对1000多人的数据进行处理：(2.1)通过专家对作答的标注，确定哪些题目是有效的，然后选择了12个，(2.2)通过这12道题的作答和标签，用该1000多人的数据构建***意念测评模型。

测评时，每个待测评人员针对12个待补全句子，输入12个补全信息，然后把补全信息输入到预先构建好的***意念测评模型，就会得到该待测评人员的***意念的识别结果。

在一些实施例中，所述基于待补全句子，获取所述待补全句子的补全信息，包括：

例如，可以在屏幕显示待补全句子，待测评人员通过输入补全信息进行补全；也可以语音播报待补全句子，待测评人员进行语音回复，终端采集语音回复，并进行声音识别，将识别后的内容作为补全信息。

可以理解的是，本实施例的技术方案中，基于***经典理论模型设计得到待补全句子，从而使得待测评人员可以根据每个待补全句子，输入补全信息，将补全信息输入到预先构建的***意念测评模型中，进行***意念测评结果，判断该待测人员是否存在***意念，及早进行干预。其中，预先构建的***意念测评模型通过设置包括预训练语言模型和无监督主题模型，从而根据补全信息的类别和主题特征对补全信息进行分类，提高预测准确性。由于设置了待补全句子，待测评人员可以直接根据待补全句子进行补全，避免了因社会期许性导致的采集数据不准确的问题；同时，无需面对面访谈，减少限制。

在一些实施例中，所述将所述补全信息输入到***意念测评模型中，得到与所述补全信息相对应的***意念测评结果，包括：

具体的，***意念测评模型对补全信息的处理过程可以为：通过所述预训练语言模型，对所述待补全句子和对应的补全信息进行编码，得到所述补全信息的类别；例如，待补全句子可以为“过去一周我(学习上不认真)”，括号内为对应的补全信息；可以编码为“学习输入”类别，“过去一周我(都很快乐)”可以编码为“正向情绪”等。

通过所述无监督主题模型，对所述待补全句子和对应的补全信息进行特征提取，得到所述补全信息的主题特征；通过所述连接层，对所述补全信息和类别和主题特征进行连接，预测所述补全信息的***意念评价结果。其中，连接层可以为线性回归层。

可以理解的是，采用本实施例提供的技术方案，通过设置预训练语言模型和无监督主题模型、连接层，从而实现对补全信息特征的多维度提取，提升预测准确性。

在一些实施例中，所述通过所述预训练语言模型，对所述待补全句子和对应的补全信息进行编码，得到所述补全信息的类别，包括：

根据所述深度表征特征，编码预测所述补全信息的类别。

可以理解的是，采用本实施例的技术方案，通过提取补全信息的深度表征特征和类别，提升预测准确性。

其中，每个待补全文本可以为问题，每个补全信息可以为作答。以问题和作答为例，对本实施例的技术方案进行进一步说明。具体的，图2为本发明一实施例提供的一种预训练语言模型的编码示意图，参阅图2，每个问题对应一个作答，通过预训练语言模型提取每个问题和作答的向量，对每道题目进行独立编码，每个编码对应一个类别，通过有监督的预测模型对编码进行预测。

图3为本发明一实施例提供的一种无监督主题模型的工作示意图，参阅图3，对每个问题和作答，可以通过无监督主题模型来提取主题特征，来表征作答文本。

图4为本发明一实施例提供的一种***意念测评模型的工作示意图，参阅图4，对一个作答者的多个题目作答内容的类别和主题特征进行连接，得到***意念评价结果。

在一些实施例中，所述***意念测评模型的训练方法，包括：

基于待补全句子样本、对应补全信息样本及对应的***意念标签，对初始语言模型进行迭代训练；以及，基于待补全句子样本、对应补全信息样本及对应的***意念标签，对初始主题模型进行迭代训练；

例如，可以将上述12道题目作为待补全句子样本，将对应的作答作为补全信息样本，并对每个补全信息样本进行标注，例如，标注是否存在***意念。在准备好这些样本信息后，对初始语言模型进行迭代训练，以及，对初始主题模型进行迭代训练；经过初始语言训练模型编码得到类别，经过初始主题模型得到主题特征，类别和主题特征均进入连接层，根据标记好的***意念评价结果，从而训练得到最终所述预训练语言模型和所述无监督主题模型。

具体的，图5为本发明一实施例提供的一种***意念测评模型的训练示意图，参阅图5，初始语言模型提取问题和作答中的深度表征之后，通过人工编码，不断对比学习，进行迭代训练。

模型的输入为n个问题题目及对应的句子补全作答内容，记作：

Q＝{Q₁，Q₂，...，Q_n}，

A＝{A₁，A₂，...，A_n}，

其中，Q_n为第n个问题；A_n为与第n个问题相对应的作答。

为了实现对个体作答结果的表征，基于两个假设：(1)测验中的每一个题目中，被测者的作答可能涉及不同的反应模式，(2)同一个被测者可能在不同题目中表达相似的内容，在同一个模型中使用了两种文本表征技术：

一方面，通过人工对文本进行编码，例如“过去一周我(学习上不认真)”可以编码为“学习输入”类别，“过去一周我(都很快乐)”可以编码为“正向情绪”。使用BERT预训练语言模型(PLM)和线性回归层对文本的编码表示，即：

其中，预训练语言模型中的参数可以根据数据进行微调，线性回归层需要根据数据进行学习，为了实现编码的准确预测，模型训练中引入编码结果的交叉熵损失函数，即：在所述初始语言模型的迭代训练过程中，采用如下交叉熵损失函数：

在一些实施例中，在所述初始语言模型的迭代训练过程中，对同一编码的补全信息和不同编码的补全信息应用对比学习损失函数：

f_PLM(A_i)＝H_i

其中，A_i表示补全信息样本，H_i为由预训练语言模型得到的深度向量表示。对于每一个表示H_i，将与其相同编码的表示记作H_i ⁺，不同的记作H_i ^-。通过定义距离函数f_d，对比学习损失函数使得相同编码的作答的深度向量表示更相近。

另一方面，使用LDA主题模型，对文本进行低维向量的表示，即，所述基于待补全句子样本、对应补全信息样本及对应的***意念标签，对初始主题模型进行迭代训练，包括：

f_topic(A)＝T

基于输入数据的表征结果，将编码和主题的数值统一输入到线性回归层，进行***意念的二分类预测。基于构建的数据集，***意念层面也采用交叉熵损失函数，即，所述将所述预训练语言模型和所述无监督主题模型连接所述连接层，输出所述补全信息的***意念评价结果，包括：

可以理解的是，针对***意念的自动化评分问题，本***在句子补全测验收集的文本数据基础上，通过编码和主题的两类文本表征方法，实现了基于文本数据的自动化评分模型。实验表明，该模型能够实现超过40％的***意念个体的识别。

本发明实施例提供了一个针对中小学生群体、青少年群体***意念的大规模自动化评估***，该方法的最大价值在于能够避免传统评估工具具有的社会期许性问题，并且无需专家评分可以对目标群体进行快速地大规模施测评估。传统自我报告式工具难以避免患者隐瞒信息的问题，尤其访谈法还受限于访谈者专业水平，无法实现大规模的施测。而基于社交媒体的文本数据研究无法解释用户评论的背后动机，且获取到的数据仅是部分目标群体的。与现有解决方案相比，本***使用的句子补全测验的开放式问题可以反应患者更深层次的内心反应和想法，并且与机器学***的限制，最终实现针对青少年这一特定群体的大规模施测。

基于一个总的发明构思，本发明实施例还提供一种基于句子补全测验的***意念智能化测评***，用于实现上述方法实施例。

图6是本发明一实施例提供的一种基于句子补全测验的***意念智能化测评***的结构示意图，参阅图6，本实施例的基于句子补全测验的***意念智能化测评***包括处理器61和存储器62，处理器61与存储器62相连。其中，处理器61用于调用并执行所述存储器62中存储的程序；存储器62用于存储所述程序，所述程序至少用于执行以上实施例中的基于句子补全测验的***意念智能化测评方法。

本申请实施例提供的基于句子补全测验的***意念智能化测评***的具体实施方案可以参考以上任意实施例的基于句子补全测验的***意念智能化测评方法的实施方式，此处不再赘述。

可以理解的是，上述各实施例中相同或相似部分可以相互参考，在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种基于句子补全测验的***意念智能化测评方法，其特征在于，包括：

所述***意念测评模型包括预训练语言模型和无监督主题模型，以及分别与所述预训练语言模型和无监督主题模型的输出端相连的连接层；所述预训练语言模型，用于获取所述补全信息的类别；所述无监督主题模型，用于获取所述补全信息的主题特征；所述连接层，用于连接所述类别和所述主题特征，并预测得到所述补全信息的***意念评价结果。

2.根据权利要求1所述的方法，其特征在于，所述将所述补全信息输入到***意念测评模型中，得到与所述补全信息相对应的***意念测评结果，包括：

3.根据权利要求2所述的方法，其特征在于，所述通过所述预训练语言模型，对所述待补全句子和对应的补全信息进行编码，得到所述补全信息的类别，包括：

根据所述深度表征特征，编码预测所述补全信息的类别。

4.根据权利要求1所述的方法，其特征在于，所述***意念测评模型的训练方法，包括：

5.根据权利要求4所述的方法，其特征在于，在所述初始语言模型的迭代训练过程中，采用如下交叉熵损失函数：

6.根据权利要求5所述的方法，其特征在于，在所述初始语言模型的迭代训练过程中，对同一编码的补全信息和不同编码的补全信息应用对比学习损失函数：

f_PLM(A_i)＝H_i

7.根据权利要求6所述的方法，其特征在于，所述基于待补全句子样本、对应补全信息样本及对应的***意念标签，对初始主题模型进行迭代训练，包括：

f_topic(A)＝T

8.根据权利要求7所述的方法，其特征在于，所述将所述补全信息输入到***意念测评模型中，得到与所述补全信息相对应的***意念测评结果，包括：

9.根据权利要求1所述的方法，其特征在于，所述基于待补全句子，获取所述待补全句子的补全信息，包括：

10.一种基于句子补全测验的***意念智能化测评***，其特征在于，包括处理器和存储器，所述处理器与存储器相连：

所述存储器，用于存储所述程序，所述程序至少用于执行权利要求1-9任一项所述的基于句子补全测验的***意念智能化测评方法。