CN117131152B

CN117131152B - 信息存储方法、装置、电子设备和计算机可读介质

Info

Publication number: CN117131152B
Application number: CN202311395722.7A
Authority: CN
Inventors: 姚晓艳; 李哲; 武彩云; 王海鹏; 李浩浩; 刘忠平
Original assignee: Haiyi Technology Beijing Co ltd
Current assignee: Haiyi Technology Beijing Co ltd
Priority date: 2023-10-26
Filing date: 2023-10-26
Publication date: 2024-02-02
Anticipated expiration: 2043-10-26
Also published as: CN117131152A

Abstract

本公开的实施例公开了信息存储方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括：接收各个教师评价文件；对各个教师评价文件进行解析处理，得到评价文本集合和评价选项信息组集合；根据评价选项信息组集合，生成教师评价信息；对评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合；根据分词序列组集合，确定评价指标关键词集合；根据评价指标关键词集合、分词序列组集合和评价文本情感分类模型，生成各个评价文本情感信息；根据各个评价文本情感信息，对教师评价信息进行更新以及将更新后的教师评价信息存储至教师评价知识图谱。该实施方式可以减少教师评价信息中的冗余文本信息，减少存储资源的浪费。

Description

信息存储方法、装置、电子设备和计算机可读介质

技术领域

本公开的实施例涉及计算机技术领域，具体涉及信息存储方法、装置、电子设备和计算机可读介质。

背景技术

随着义务教育普及下教师团队的不断扩大和办公智能化趋势的推进，教师评价成为了教师考核中的重要组成部分。教师评价是指从各个维度（例如教学能力、管理能力）对教师能力进行评价的一种方法。通常采用的方式为：各个评价教师填写针对目标教师的评价文件以确定评价分数，然后将评价分数和各个评价文件中包含的评价文本信息直接作为教师评价信息进行存储。

然而，当采用上述方式生成和存储评价信息时，经常会存在如下技术问题：

第一，直接将评价文件包含的文本信息作为教师评价信息进行存储，由于评价文本中存在较多冗余文本数据，导致存储资源的浪费。

第二，使用常规的神经网络模型进行评价文本关键词提取时，为了提高所提取出的关键词表征能力，需要不断增加模型深度，导致所需算力大幅提升且时间开销大幅增加。

第三，以评价文本为单位进行情感分类时，由于评价文本中包含较多冗余文本数据，导致文本语义特征提取的复杂度增加，进而导致算力资源的浪费和时间开销的增加。

发明内容

本公开的内容部分用于以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。

本公开的一些实施例提出了信息存储方法、装置、电子设备和计算机可读介质，来解决以上背景技术部分提到的技术问题中的一项或多项。

第一方面，本公开的一些实施例提供了一种信息存储方法，该方法包括：接收各个教师评价文件，其中，上述各个教师评价文件为各个评价教师针对目标教师进行评价填写后的文件；对所接收的各个教师评价文件进行解析处理，得到评价文本集合和评价选项信息组集合；根据上述评价选项信息组集合，生成教师评价信息；对上述评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合，其中，上述分词序列组集合中的分词序列组对应上述评价文本集合中的评价文本；根据上述分词序列组集合，确定评价指标关键词集合；根据上述评价指标关键词集合、上述分词序列组集合和预先训练好的评价文本情感分类模型，生成各个评价文本情感信息；根据上述各个评价文本情感信息，对上述教师评价信息进行更新以及将更新后的教师评价信息存储至预先构建的教师评价知识图谱。

第二方面，本公开的一些实施例提供了一种信息存储装置，该装置包括：接收单元，被配置成接收各个教师评价文件，其中，上述各个教师评价文件为各个评价教师针对目标教师进行评价填写后的文件；解析单元，被配置成对所接收的各个教师评价文件进行解析处理，得到评价文本集合和评价选项信息组集合；第一生成单元，被配置成根据上述评价选项信息组集合，生成教师评价信息；拆分单元，被配置成对上述评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合，其中，上述分词序列组集合中的分词序列组对应上述评价文本集合中的评价文本；确定单元，被配置成根据上述分词序列组集合，确定评价指标关键词集合；第二生成单元，被配置成根据上述评价指标关键词集合、上述分词序列组集合和预先训练好的评价文本情感分类模型，生成各个评价文本情感信息；存储单元，被配置成根据上述各个评价文本情感信息，对上述教师评价信息进行更新以及将更新后的教师评价信息存储至预先构建的教师评价知识图谱。

第三方面，本公开的一些实施例提供了一种电子设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。

第四方面，本公开的一些实施例提供了一种计算机可读介质，其上存储有计算机程序，其中，程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。

本公开的上述各个实施例中具有如下有益效果：通过本公开的一些实施例的信息存储方法可以使用各个评价文本关键词表征评价文本主要含义，以减少教师评价信息中冗余的文本数据，从而可以减少存储资源浪费。具体来说，造成存储资源浪费的原因在于：直接将评价文件包含的文本信息作为教师评价信息进行存储，由于评价文本中存在较多冗余文本数据，导致存储资源的浪费。基于此，本公开的一些实施例的信息存储方法，首先，接收各个教师评价文件。其中，上述各个教师评价文件为各个评价教师针对目标教师进行评价填写后的文件。然后，对所接收的各个教师评价文件进行解析处理，得到评价文本集合和评价选项信息组集合。由此，可以得到上述不同评价教师对目标教师的评价文本和表征各个评价维度的评价选项信息组集合。之后，根据上述评价选项信息组集合，生成教师评价信息。由此，可以将上述不同评价教师从上述评价选项信息组集合所表征的各个评价维度确定对上述目标教师的各个评价分数作为教师评价信息。接着，对上述评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合。其中，上述分词序列组集合中的分词序列组对应上述评价文本集合中的评价文本。由此，可以对上述评价文本集合中的每个评价文本进行拆分，得到表征上述评价文本中各个语句的各个分词序列。其次，根据上述分词序列组集合，确定评价指标关键词集合。由此，可以以语句为单位进行评价文本中的关键词提取。接着，根据上述评价指标关键词集合、上述分词序列组集合和预先训练好的评价文本情感分类模型，生成各个评价文本情感信息。由此，可以以语句为单位进行评价文本的情感分类得到评价文本情感信息。最后，根据上述各个评价文本情感信息，对上述教师评价信息进行更新以及将更新后的教师评价信息存储至预先构建的教师评价知识图谱。由此，可以通过上述评价文本情感信息对上述教师评价信息进行更新，以提高上述教师评价信息的准确度。并采用知识图谱的形式对教师评价信息进行结构化存储，进一步减少更新后的教师评价信息中的碎片化数据。也因为采用了以各个评价文本关键词表征评价文本主要含义和结构化存储的方式，可以减少教师评价信息中冗余的文本数据，从而可以减少存储资源浪费。

附图说明

结合附图并参考以下具体实施方式，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中，相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的，元件和元素不一定按照比例绘制。

图1是根据本公开的信息存储方法的一些实施例的流程图；

图2是根据本公开的评价文本关键词提取模型的网络结构示意图；

图3是根据本公开的信息存储装置的一些实施例的结构示意图；

图4是适于用来实现本公开的一些实施例的电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例。相反，提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。

需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。

下面将参考附图并结合实施例来详细说明本公开。

参考图1，示出了根据本公开的信息存储方法的一些实施例的流程100。该信息存储方法，包括以下步骤：

步骤101，接收各个教师评价文件。

在一些实施例中，信息存储方法的执行主体可以接收各个教师评价文件。其中，上述各个教师评价文件可以为各个评价教师针对目标教师进行评价填写后的文件。上述执行主体可以为发起对上述目标教师进行评价的教师的教师账号所登录的终端。上述教师评价文件可以为CSV格式或Excel格式的文件。上述教师评价文件包含评价教师对上述目标教师的进行评价的文本信息和在各个评价指标下给出的评价分数。

可选地，在接收各个教师评价文件之前，上述执行主体还可以执行以下步骤：

第一步，获取目标教师身份信息。其中，上述目标教师身份信息可以包括目标教师职位信息和目标教师标识信息。上述目标教师职位信息可以为表征上述目标教师职位的文本标签。上述目标教师标识信息可以为表征上述目标教师的字符串。

第二步，根据上述目标教师标识信息，从预先构建的教师身份信息树中选择第一预设数量的教师身份信息作为各个评价教师身份信息。其中，上述预先构建的教师身份信息树中的每个教师身份信息可以包括教师职位信息、教师标识信息和教师账号。上述教师身份信息树可以表征上述目标教师所在机构中各个教师职位的隶属关系或上下级关系。实践中，上述执行主体可以对上述教师身份信息树中的各个教师身份信息进行层次遍历。然后，上述执行主体可以通过上述目标教师标识信息确定上述目标教师身份信息在上述教师身份信息树中的节点位置。最后，可以从上述教师身份信息树中随机选择与上述目标教师身份信息对应的第一预设子数量的上级教师身份信息（各个父节点对应的各个教师身份信息）、第二预设子数量的同级教师身份信息（即各个兄弟节点对应的各个教师身份信息）和第三预设子数量的下级教师身份信息作为各个评价教师身份信息（即各个子节点对应的各个教师身份信息）。需要说明的是上述第一预设子数量、第二预设子数量和第三预设子数量的和与上述第一预设数量相等。

第三步，基于上述各个评价教师身份信息中的每个评价教师身份信息，执行以下步骤：

第一子步骤，根据上述评价教师身份信息包括的评价教师职位信息和上述目标教师职位信息，从预设的指标关键词集合中选择满足指标选取条件的各个指标关键词作为各个评价文件关键词。其中，上述各个评价文件关键词的数量可以为第二预设数量。上述指标关键词集合中的每个指标关键词可以表征对教师进行评价的一个维度。例如，上述指标关键词为“教学能力”，可以表征从教学能力上对上述目标教师进行评价。上述指标关键词集合中的每个指标关键词对应有指标关键词语义向量。实践中，上述执行主体可以通过预先训练好的语义嵌入模型生成与上述评价教师职位信息、上述目标教师职位信息分别对应的两个语义向量。然后，可以确定上述两个语义向量的平均语义向量。之后，可以通过相似度算法确定上述平均语义向量与上述指标关键词集合中的每个指标关键词对应的指标关键词语义向量之间的语义相似度，并对所确定的各个语义相似度由高到低进行排序，得到语义相似度序列。最后，可以从上述语义相似度序列中选择第二预设数量的语义相似度对应的各个指标关键词作为各个评价文件关键词。上述指标选取条件可以是指标关键词对应的指标关键词语义向量与上述平均语义向量之间的语义相似度在上述语义相似度序列的前第二预设数量位。

作为示例，上述语义嵌入模型可以为用于自然语言处理任务的Word2Vec模型、词袋模型或GloVe（Global Vectors）模型。上述相似度算法可以为余弦相似度算法。

第二子步骤，向目标终端发送评价文件生成请求。其中，上述评价文件生成请求可以包括上述各个评价文件关键词。上述目标终端为已登录上述评价教师身份信息包括的评价教师账号的终端。上述评价文件生成请求可以为用于生成评价文件的请求。

步骤102，对所接收的各个教师评价文件进行解析处理，得到评价文本集合和评价选项信息组集合。

在一些实施例中，上述执行主体可以对所接收的各个教师评价文件进行解析处理，得到评价文本集合和评价选项信息组集合。实践中，首先，对于上述各个教师评价文件中的每个教师评价文件，上述执行主体可以执行以下步骤：第一步，对上述教师评价文件进行读取。第二步，可以通过预设的评价文件模版对填充至上述评价文件中的各个指标关键词、评价教师针对上述各个指标关键词给出的各个评价分数和评价文本进行提取。第三，可以将所提取出的各个指标关键词中的每个指标关键词和对应的评价分数以二元组的形式确定为评价选项信息，得到评价选项信息组。例如，上述评价选项信息可以为（“教学能力”，9）。最后，上述执行主体可以将所提取的各个评价文本确定为评价文本集合以及将所确定的各个评价选项信息组确定为评价选项信息组集合。

步骤103，根据评价选项信息组集合，生成教师评价信息。

在一些实施例中，上述执行主体可以根据评价选项信息组集合，生成教师评价信息。实践中，上述执行主体可以将评价选项信息组集合中包含的指标关键词相同的评价选项信息划分到同一组内，以更新上述评价选项信息组集合。然后，对于上述评价选项信息组集合中的每个选项评价信息组，上述执行主体可以确定上述选项评价信息组中的各个评价分数的平均值。最后，上述执行主体可以将各个评价分数平均值和对应的各个指标关键词确定为教师评价信息。例如，上述教师评价信息可以为（“教学能力”：8.5，“工作态度”：9.3，…，“师生关系”：6.5）。

步骤104，对评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合。

在一些实施例中，上述执行主体可以对评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合。其中，上述分词序列组集合中的分词序列组对应上述评价文本集合中的评价文本。上述分词序列组集合中的分词序列可以表征对应的评价文本中的一个语句。

在一些实施例的可选的实现方式中，上述执行主体可以通过以下步骤对评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合：

第一步，对于上述评价文本集合中的每个评价文本，执行以下处理步骤：

第一子步骤，根据预设标点字符集，对上述评价文本进行分割处理，得到各个评价文本语句。上述预设标点字符集可以包括但不限于以下标点字符：分号（；）、句号（。）和冒号（：）。

第二子步骤，对于上述各个评价文本语句中的每个评价文本语句，对上述评价文本语句进行分词处理，得到分词序列。实践中，上述执行主体可以通过自然语言处理工具对每个评价文本语句进行分词处理，得到分词序列。例如，上述评价文本语句可以为“老师讲解清晰，耐心教学。”，对上述评价语句进行分词处理后得到的分词序列可以为（老师/讲解/清晰/耐心/教学）。其中，上述“/”仅表示示意性的分割。

作为示例，上述自然语言处理工具可以为Jieba工具或Yaha工具。

第三子步骤，将所得到的各个分词序列确定为对应上述评价文本的分词序列组。

第二步，将所确定的各个分词序列组确定为分词序列组集合。由此，通过对各个评价文本进行拆分，可以实现以评价文本为单位到以文本语句为单位的转换，以提高评价文本关键词提取和评价文本情感分类的准确性。

步骤105，根据分词序列组集合，确定评价指标关键词集合。

在一些实施例中，上述执行主体可以根据分词序列组集合，确定评价指标关键词集合。

在一些实施例的可选的实现方式中，上述执行主体可以通过以下步骤根据分词序列组集合，确定评价指标关键词集合：

第一步，根据上述分词序列组集合和预先训练好的评价文本关键词提取模型，生成评价文本关键词集合。实践中，上述评价文本关键词模型可以是以上述分词序列组集合中各个分词序列为输入，以关键词信息序列为输出的自然语言处理模型。

第二步，对上述评价文本关键词集合中的各个评价文本关键词进行聚类处理，得到评价文本关键词簇集合。实践中，上述执行主体可以通过上述语义嵌入模型生成上述评价文本关键词集合中的各个评价文本关键词对应的各个评价文本关键词语义向量。然后，可以通过聚类算法对上述各个评价文本关键词语义向量进行聚类，以实现对各个评价文本关键词的聚类。

作为示例，上述聚类算法可以为K-means算法、层次聚类算法或密度聚类算法。

第三步，对于上述评价文本关键词簇集合中的每个评价文本关键词簇，执行以下步骤：

第一子步骤，根据上述评价文本关键词簇，生成平均语义向量。实践中，上述执行主体可以对上述评价文本关键词簇中各个评价文本关键词对应的各个评价文本关键词语义向量求平均，以生成平均语义向量。

第二子步骤，根据上述平均语义向量，将上述各个评价文件关键词中满足语义相似度条件的评价文件关键词确定为与上述评价文本关键词簇对应的评价指标关键词。上述语义相似度条件可以为上述平均语义向量与评价文件关键词对应评价文件关键词语义向量之间的语义相似度大于等于预设语义相似度阈值。

第四步，将所确定的各个评价指标关键词确定为评价指标关键词集合。由此，可以将上述评价文本集合中各个评价文本包括的各个评价文本关键词与各个评价指标关键词所表征的各个评价维度进行对应。

在一些实施例的可选的实现方式中，上述执行主体可以通过以下步骤根据分词序列组集合和预先训练好的评价文本关键词提取模型，生成评价文本关键词集合：

第一步，对于上述分词序列组集合中的每个分词序列组，执行以下处理步骤：

第一子步骤，对于上述分词序列组中的每个分词序列，执行以下关键词提取步骤：

子步骤一，对上述分词序列进行词性标注处理，得到词性标签序列。其中，上述分词序列中的分词对应上述词性标签序列中的词性标签。实践中，上述执行主体可以通过上述自然语言处理工具（例如，jieba工具）对上述分词序列进行词性标注处理，得到词性标注序列。例如，上述分词序列可以为（老师/讲解/清晰/耐心/教学），对应的词性标签序列可以为（NN/VB/RB/RB/VB）。上述NN、VB和RB为进行词性标注后的词性标签，分别表征对应的分词词性为名词、动词和副词。

子步骤二，将上述分词序列和上述词性标签序列输入至上述评价文本关键词提取模型包括的拼接层，以生成候选词序列。其中，上述评价文本关键词提取模型包括上述拼接层、语义嵌入模型、语义强化网络和关键词提取层。

如图2所示，上述评价文本关键词提取模型可以包括上述语义嵌入模型201、拼接层202、语义强化网络203和关键词提取层204。其中，上述语义嵌入模型201可以生成输入的分词序列中的各个分词对应的分词语义向量，得到分词语义向量序列。上述拼接层202首先，可以通过预设的词性拼接规则和词性标签序列中的各个词性标签对输入的分次序列中的各个分词进行拼接，得到候选词序列。然后，上述拼接层202可以对通过拼接函数（例如，concat拼接函数）对输入的分词语义向量序列中的各个分词语义向量按照对应的候选词序列进行拼接并填充至同一维度，得到候选词语义向量序列。例如，上述分词序列可以为（老师/讲解/清晰/耐心/教学），对应的分词语义向量可以为（e1，e2，e3，e4，e5），拼接后得到候选词序列可以为（老师/讲解清晰/耐心教学），对应的候选词语义向量序列可以为（E1，E2，E3）。上述E1、E2和E3维度相同。上述E1可以由e1填充后得到。上述E2可以由上述e2、e3拼接后填充得到。上述E3可以由上述e4、e5拼接后填充得到。上述语义强化网络203可以由第三预设数量的语义强化层2031组成。作为示例，上述第三预设数量可以为4。图2仅作示意性的展示语义强化2031层的内部结构和各个语义强化层之连接方式，并不表征上述语义强化网络203中实际的语义强化层的层数。上述语义强化层2031可以包括多头自注意力层20311、多粒度注意力层20312、残差单元20313和归一化单元20314。上述语义强化层2031可以以分词语义向量序列、候选词语义向量序列为输入，以分词强化语义向量序列和候选词强化语义向量序列为输出。上述多头自注意力层20311可以接收上述语义嵌入模型201输出的分词语义向量序列，并通过多头自注意力机制实现分词语义向量序列对自身特征的学习，以优化各个分词语义向量的表征能力以更新上述分词语义向量序列。与上述多头自注意力层20311连接的残差单元20313可以对更新后的分词语义向量进行残差信息补充，以补充语义优化过程中所丢失的细节语义信息。与上述多头自注意力层20311连接的归一化层可以对进行残差信息补充后的分词语义向量序列中的各个分词语义向量进行标准化，以减少算力资源浪费。上述多粒度注意力层20312可以接收上述语义嵌入模型201输出的分词语义向量序列和拼接层202输出的候选词语义向量序列。上述多粒度注意力层20312可以将上述候选词语义向量序列作为粗粒度语义特征以及将分词语义向量序列作为细粒度语义特征，通过注意力机制实现粗粒度语义特征对细粒度语义特征的特征学习，优化上述候选词语义向量序列中各个候选词语义向量的表征能力以更新上述候选词语义向量序列。与上述多粒度注意力层20312连接的残差单元20313可以对更新后的候选词语义向量进行残差信息补充，以补充语义优化过程中所丢失的细节语义信息。与上述多粒度自注意力层20312连接的归一化层可以对进行残差信息补充后的候选词语义向量序列中的各个候选词语义向量进行标准化，以减少算力资源浪费。上述关键词提取层204可以以上述语义强化网络203输出的候选词强化语义向量序列和分词强化语义向量序列为输入，以关键词信息序列为输出。上述关键词信息序列中的关键词信息可以为关键词和对应的关键词概率。上述关键词提取层204可以由多粒度注意力层、线性层和softmax层组成。上述关键词提取层204包括的多粒度注意力层可以通过注意力机制生成分词强化语义向量序列对候选词强化语义向量序列的注意力矩阵。由此，可以通过分词强化语义向量序列中各个分词强化语义向量对候选词强化语义向量序列中各个候选词强化语义向量的关注程度，表示对应的各个候选词对语句评价文本的表征能力。最后，关键词提取层204可以将所生成的注意力矩阵依次输入至线性层和softmax层，得到关键词信息序列。

子步骤三，将上述分词序列输入至上述语义嵌入模型，得到分词语义向量序列。

子步骤四，将上述分词语义向量序列和上述候选词序列输入至上述拼接层，以生成候选词语义向量序列。

子步骤五，将上述分词语义向量序列和上述候选词语义向量序列输入至上述语义强化网络，得到候选词强化语义向量序列和分词强化语义向量序列。

子步骤六，将上述候选词强化语义向量序列和上述分词强化语义向量序列输入至上述关键词提取层，得到关键词信息序列。

子步骤七，根据上述关键词信息序列，确定各个评价文本关键词。实践中，上述执行主体可以将关键词信息序列中概率值大于等于预设关键词阈值的各个关键词确定为各个评价文本关键词。

第二步，将所确定的各个评价文本关键词确定为评价文本关键词集合。

上述第一步和第二步作为本公开的实施例的一个发明点，可以解决背景技术提及的技术问题二“使用常规的神经网络模型进行评价文本关键词提取时，为了提高所提取出的关键词表征能力，需要不断增加模型深度，导致所需算力大幅提升且时间开销大幅增加”。导致所需算力大幅提升且时间开销的大幅增加的因素往往如下：使用常规的神经网络模型进行评价文本关键词提取时，为了提高所提取出的关键词表征能力，需要不断增加模型深度，导致所需算力大幅提升且时间开销大幅增加加。如果解决了上述因素，就能达到减少算力资源浪费和减少时间开销增加的效果。为了达到这一效果，本公开引入了上述评价文本关键词人体取模型。首先，可以通过上述评价文本关键词人体取模型包括的拼接层和语义嵌入模型分别得到表征粗粒度文本语义特征的候选词语义向量序列和表征细粒度文本语义特征的分词语义向量序列。然后，可以通过细粒度文本语义特征对自身特征的学习和粗粒度文本语义特征对细粒度文本语义特征的学习两种方式提高所提取出的关键词表征能力，在提高关键词准确性的同时降低模型整体深度，从而减少因模型层数不断加深而导致的模型所需算力大幅提升和时间开销的大幅增加。

步骤106，根据评价指标关键词集合、分词序列组集合和预先训练好的评价文本情感分类模型，生成各个评价文本情感信息。

在一些实施例中，上述执行主体可以根据评价指标关键词集合、分词序列组集合和预先训练好的评价文本情感分类模型，生成各个评价文本情感信息。上述评价文本情感信息可以表征对应的评价文本中包含的情感倾向。

在一些实施例的可选的实现方式中，上述执行主体可以通过以下步骤根据评价指标关键词集合、分词序列组集合和预先训练好的评价文本情感分类模型，生成各个评价文本情感信息：

第一步，根据上述评价文本关键词簇集合和序列筛选条件，对上述分词序列组集合中的各个分词序列进行筛选处理，以更新上述分词序列组集合。上述序列筛选条件可以为分词序列中存在上述评价文本关键词簇集合中的评价文本关键词。

第二步，根据上述评价指标关键词集合，对所更新的分词序列组集合中的各个分词序列进行重分类处理，以对所更新的分词序列组集合进行更新。其中，更新后的分词序列组集合中的分词序列组对应上述评价指标关键词集合中的评价指标关键词。上述评价文本关键词簇集合中的评价文本关键词簇对应上述评价指标关键词集合中的评价指标关键词。实践中，上述执行主体可以按照分词序列中存在的评价文本关键词所对应的评价文本关键词簇，对上述分词序列组集合中的各个分词序列进行重分类，使对应同一评价文本关键词簇中的各个分词序列划分至同一组内，以对分词序列组集合进行更新。

第三步，对于更新后的分词序列组集合中的每个分词序列组，执行以下步骤：

第一子步骤，对于上述分词序列组中每个分词序列，将上述分词序列输入至上述评价文本情感分类模型，以生成语句情感信息。上述评价文本情感分类模型可以是以分词序列为输入，以语句情感信息为输出且可以用于情感分类任务的神经网络模型或机器学习模型。上述语句情感信息可以为表征情感倾向的文本标签。例如，一个分词序列对应的评价指标关键词可以为“教学能力”，上述分词序列输入至上述评价文本情感分类模型后得到语句情感信息可以为“积极”，表征评价教师在“教学能力”这一评价维度对上述目标教师的情感倾向是积极的。

作为示例，上述评价文本情感分类模型可以是长短期记忆模型、循环神经网络模型或朴素贝叶斯模型。

第二子步骤，根据所生成的各个语句情感信息，生成对应上述评价指标关键词的评价文本情感信息。实践中，各个语句情感信息对应有各个情感分值和各个评分加权系数。上述执行主体可以对各个语句情感信息对应的各个情感分值进行求和，并通过情感分值总和确定各个评价教师在上述分词序列组对应的评价指标关键词所表征的评价维度上的整体情感倾向，以作为评价文本情感信息。例如，语句情感信息对应的分值可以为（“消极”：-5，“相对消极”，-2，“中立”：0，“相对积极”：2，“积极”：4）一个分词序列组中包括三个分词序列，与分词序列组对应的评价指标关键词为“教学能力”。第一个分词序列，对应的语句情感信息为“积极”，对应的情感分值为4。第二个分词序列，对应的语句情感信息为“中立”，对应的情感分值为0。第一个分词序列，对应的语句情感信息为“消极”，对应的情感分值为-5。所确定的情感分值总和为-1。上述情感分值总和大于等于-2小于0，所确定的评价文本感情信息可以为（“教学能力”：“相对消极”）。

上述第一步至第三步作为本公开的实施例的一个发明点，可以解决背景技术提及的技术问题三“以评价文本为单位进行情感分类时，由于评价文本中包含较多冗余文本数据，导致文本语义特征提取的复杂度增加，进而导致算力资源的浪费和时间开销的增加”。导致算力资源的浪费和时间开销的增加的因素往往如下：以评价文本为单位进行情感分类时，由于评价文本中包含较多冗余文本数据，导致文本语义特征提取的复杂度增加，进而导致算力资源的浪费和时间开销的增加。如果解决了上述因素，就能达到减少算力资源浪费和减少时间开销增加的效果。为了达到这一效果，首先，根据上述评价文本关键词簇集合和序列筛选条件，对上述分词序列组集合中的各个分词序列进行筛选处理，以更新上述分词序列组集合。实践中，存在关键词的语句中往往存在对应的情感倾向，不包含关键词的语句往往是不带有实际情感倾向的口语化表达。由此，可以通过各个评价文本关键词对表征各个语句的分词序列组集合进行更新，减少冗余文本信息。然后，根据上述评价指标关键词集合，对所更新的分词序列组集合中的各个分词序列进行重分类处理，以对所更新的分词序列组集合进行更新。其中，更新后的分词序列组集合中的分词序列组对应上述评价指标关键词集合中的评价指标关键词。由此，可以将不同评价文本中对应相同评价指标关键词的语句划分到同一组内。之后，对于更新后的分词序列组集合中的每个分词序列组，执行以下步骤：第一，对于上述分词序列组中每个分词序列，将上述分词序列输入至上述评价文本情感分类模型，以生成语句情感信息。由此，可以以表征语句的分词序列为单位进行感情分类，以降低特征提取复杂度。最后，根据所生成的各个语句情感信息，生成对应上述评价指标关键词的评价文本情感信息。由此，可以通过各个语句情感信息确定评价文本情感信息，以避免对评价文本整体直接进行情感分类所带来的特征提取复杂度较高的问题。也因为采用了减少评价文本中的冗余文本信息和以语句为单位进行情感分类的方式，从而可以降低文本语义特征提取的复杂度，进而减少算力资源的浪费和时间开销的增加。

步骤107，根据各个评价文本情感信息，对教师评价信息进行更新以及将更新后的教师评价信息存储至预先构建的教师评价知识图谱。

在一些实施例中，上述执行主体可以根据各个评价文本情感信息，对教师评价信息进行更新以及将更新后的教师评价信息存储至预先构建的教师评价知识图谱。实践中，首先，上述执行主体可以通过每个评价文本情感信息对上述教师评价信息中对应的指标关键词的评价分数进行更新，即将评分加权系数与评价分数的乘积作为更新后的评价分数。然后，对于上述教师评价信息中的每个指标关键词，上述执行主体可以将上述目标教师标识信息作为第一实体，将上述指标关键词作为第二实体，将评价分数作为实体关系存储至预先构建的教师评价知识图谱。

可选地，上述执行主体还可以执行以下步骤：

第一步，响应于检测到评价文件生成请求，从上述评价文件生成请求中提取各个评价文件关键词作为各个评价关键词。

需要说明的是，发起评价的教师也可以作为对其他目标教师进行评价的评价教师。由此，上述执行主体也可以作为目标终端响应于检测到相异终端发送的评价文件生成请求，通过提取Json属性的方式从上述评价文件生成请求中提取各个评价文件关键词作为各个评价关键词。其中，上述相异终端可以为已登录其他发起评价教师的教师账号的终端。

第二步，根据上述各个评价关键词和预设的评价文件模版，生成教师评价文件。实践中，上述执行主体可以将上述各个评价关键词按照随机顺序填充至上述预设的评价文件模版中，以生成教师评价文件。

进一步参考图3，作为对上述各图所示方法的实现，本公开提供了一种信息存储装置的一些实施例，这些装置实施例与图1所示的那些方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图3所示，一些实施例的信息存储装置300包括：接收单元301、解析单元303、第一生成单元303、拆分单元304、确定单元305、第二生成单元306和存储单元307。其中，接收单元301被配置成接收各个教师评价文件，其中，上述各个教师评价文件为各个评价教师针对目标教师进行评价填写后的文件；解析单元302被配置成对所接收的各个教师评价文件进行解析处理，得到评价文本集合和评价选项信息组集合；第一生成单元303被配置成根据上述评价选项信息组集合，生成教师评价信息；拆分单元304被配置成对上述评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合，其中，上述分词序列组集合中的分词序列组对应上述评价文本集合中的评价文本；确定单元305被配置成根据上述分词序列组集合，确定评价指标关键词集合；第二生成单元306被配置成根据上述评价指标关键词集合、上述分词序列组集合和预先训练好的评价文本情感分类模型，生成各个评价文本情感信息；存储单元307被配置成根据上述各个评价文本情感信息，对上述教师评价信息进行更新以及将更新后的教师评价信息存储至预先构建的教师评价知识图谱。

可以理解的是，该装置300中记载的诸单元与参考图1描述的方法中的各个步骤相对应。由此，上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置300及其中包含的单元，在此不再赘述。

下面参考图4，其示出了适于用来实现本公开的一些实施例的电子设备400的结构示意图。图4示出的电子设备仅仅是一个示例，不应对本公开的实施例的功能和使用范围带来任何限制。

如图4所示，电子设备400可以包括处理装置（例如中央处理器、图形处理器等）401，其可以根据存储在只读存储器（ROM）402中的程序或者从存储装置408加载到随机访问存储器（RAM）403中的程序而执行各种适当的动作和处理。在RAM 403中，还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出（I/O）接口405也连接至总线404。

通常，以下装置可以连接至I/O接口405：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置403；包括例如液晶显示器（LCD）、扬声器、振动器等的输出装置407；包括例如磁带、硬盘等的存储装置408；以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备400，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图4中示出的每个方框可以代表一个装置，也可以根据需要代表多个装置。

特别地，根据本公开的一些实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的一些实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中，该计算机程序可以通过通信装置409从网络上被下载和安装，或者从存储装置408被安装，或者从ROM 402被安装。在该计算机程序被处理装置401执行时，执行本公开的一些实施例的方法中限定的上述功能。

需要说明的是，本公开的一些实施例中记载的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑磁盘只读存储器（CD-ROM）、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF（射频）等等，或者上述的任意合适的组合。

在一些实施方式中，客户端、服务器可以利用诸如HTTP（HyperText TransferProtocol，超文本传输协议）之类的任何当前已知或未来研发的网络协议进行通信，并且可以与任意形式或介质的数字数据通信（例如，通信网络）互连。通信网络的示例包括局域网（“LAN”），广域网（“WAN”），网际网（例如，互联网）以及端对端网络（例如，ad hoc端对端网络），以及任何当前已知或未来研发的网络。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：接收各个教师评价文件，其中，上述各个教师评价文件为各个评价教师针对目标教师进行评价填写后的文件；对所接收的各个教师评价文件进行解析处理，得到评价文本集合和评价选项信息组集合；根据上述评价选项信息组集合，生成教师评价信息；对上述评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合，其中，上述分词序列组集合中的分词序列组对应上述评价文本集合中的评价文本；根据上述分词序列组集合，确定评价指标关键词集合；根据上述评价指标关键词集合、上述分词序列组集合和预先训练好的评价文本情感分类模型，生成各个评价文本情感信息；根据上述各个评价文本情感信息，对上述教师评价信息进行更新以及将更新后的教师评价信息存储至预先构建的教师评价知识图谱。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网（LAN）或广域网（WAN）——连接到用户计算机，或者，可以连接到外部计算机（例如利用因特网服务提供商来通过因特网连接）。

附图中的流程图和框图，图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开的一些实施例中的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括接收单元、解析单元、第一生成单元、拆分单元、确定单元、第二生成单元和存储单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，接收单元还可以被描述为“接收各个教师评价文件的单元”。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列（FPGA）、专用集成电路（ASIC）、专用标准产品（ASSP）、片上***（SOC）、复杂可编程逻辑设备（CPLD）等等。

以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开的实施例中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的（但不限于）具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种信息存储方法，包括：

获取目标教师身份信息，其中，所述目标教师身份信息包括目标教师职位信息和目标教师标识信息；

根据所述目标教师标识信息，从预先构建的教师身份信息树中选择第一预设数量的教师身份信息作为各个评价教师身份信息，其中，所述各个评价教师身份信息中的每个评价教师身份信息包括评价教师职位信息、评价教师标识信息和评价教师账号；

基于所述各个评价教师身份信息中的每个评价教师身份信息，执行以下步骤：

根据所述评价教师身份信息包括的评价教师职位信息和所述目标教师职位信息，从预设的指标关键词集合中选择满足指标选取条件的各个指标关键词作为各个评价文件关键词，其中，所述各个评价文件关键词的数量为第二预设数量；

向目标终端发送评价文件生成请求，其中，所述评价文件生成请求包括所述各个评价文件关键词，所述目标终端为已登录所述评价教师身份信息包括的评价教师账号的终端；

接收各个教师评价文件，其中，所述各个教师评价文件为各个评价教师针对目标教师进行评价填写后的文件；

对所接收的各个教师评价文件进行解析处理，得到评价文本集合和评价选项信息组集合；

根据所述评价选项信息组集合，生成教师评价信息；

对所述评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合，其中，所述分词序列组集合中的分词序列组对应所述评价文本集合中的评价文本；

根据所述分词序列组集合，确定评价指标关键词集合，其中，所述根据所述分词序列组集合，确定评价指标关键词集合，包括：

根据所述分词序列组集合和预先训练好的评价文本关键词提取模型，生成评价文本关键词集合；

对所述评价文本关键词集合中的各个评价文本关键词进行聚类处理，得到评价文本关键词簇集合；

对于所述评价文本关键词簇集合中的每个评价文本关键词簇，执行以下步骤：

根据所述评价文本关键词簇，生成平均语义向量；

根据所述平均语义向量，将所述各个评价文件关键词中满足语义相似度条件的评价文件关键词确定为与所述评价文本关键词簇对应的评价指标关键词；

将所确定的各个评价指标关键词确定为评价指标关键词集合；

根据所述评价指标关键词集合、所述分词序列组集合和预先训练好的评价文本情感分类模型，生成各个评价文本情感信息；

根据所述各个评价文本情感信息，对所述教师评价信息进行更新以及将更新后的教师评价信息存储至预先构建的教师评价知识图谱。

2.根据权利要求1所述的方法，其中，所述对所述评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合，包括：

对于所述评价文本集合中的每个评价文本，执行以下处理步骤：

根据预设标点字符集，对所述评价文本进行分割处理，得到各个评价文本语句；

对于所述各个评价文本语句中的每个评价文本语句，对所述评价文本语句进行分词处理，得到分词序列；

将所得到的各个分词序列确定为对应所述评价文本的分词序列组；

将所确定的各个分词序列组确定为分词序列组集合。

3.根据权利要求2所述的方法，其中，所述方法还包括：

响应于检测到评价文件生成请求，从所述评价文件生成请求中提取各个评价文件关键词作为各个评价关键词；

根据所述各个评价关键词和预设的评价文件模版，生成教师评价文件。

4.一种信息存储装置，包括：

获取单元，被配置成获取目标教师身份信息，其中，所述目标教师身份信息包括目标教师职位信息和目标教师标识信息；

选择单元，被配置成根据所述目标教师标识信息，从预先构建的教师身份信息树中选择第一预设数量的教师身份信息作为各个评价教师身份信息，其中，所述各个评价教师身份信息中的每个评价教师身份信息包括评价教师职位信息、评价教师标识信息和评价教师账号；

执行单元，被配置成基于所述各个评价教师身份信息中的每个评价教师身份信息，执行以下步骤：根据所述评价教师身份信息包括的评价教师职位信息和所述目标教师职位信息，从预设的指标关键词集合中选择满足指标选取条件的各个指标关键词作为各个评价文件关键词，其中，所述各个评价文件关键词的数量为第二预设数量；向目标终端发送评价文件生成请求，其中，所述评价文件生成请求包括所述各个评价文件关键词，所述目标终端为已登录所述评价教师身份信息包括的评价教师账号的终端；

接收单元，被配置成接收各个教师评价文件，其中，所述各个教师评价文件为各个评价教师针对目标教师进行评价填写后的文件；

解析单元，被配置成对所接收的各个教师评价文件进行解析处理，得到评价文本集合和评价选项信息组集合；

第一生成单元，被配置成根据所述评价选项信息组集合，生成教师评价信息；

拆分单元，被配置成对所述评价文本集合中的各个评价文本进行文本拆分处理，得到分词序列组集合，其中，所述分词序列组集合中的分词序列组对应所述评价文本集合中的评价文本；

确定单元，被配置成根据所述分词序列组集合，确定评价指标关键词集合，其中，所述根据所述分词序列组集合，确定评价指标关键词集合，包括：根据所述分词序列组集合和预先训练好的评价文本关键词提取模型，生成评价文本关键词集合；对所述评价文本关键词集合中的各个评价文本关键词进行聚类处理，得到评价文本关键词簇集合；对于所述评价文本关键词簇集合中的每个评价文本关键词簇，执行以下步骤：根据所述评价文本关键词簇，生成平均语义向量；根据所述平均语义向量，将所述各个评价文件关键词中满足语义相似度条件的评价文件关键词确定为与所述评价文本关键词簇对应的评价指标关键词；将所确定的各个评价指标关键词确定为评价指标关键词集合；

第二生成单元，被配置成根据所述评价指标关键词集合、所述分词序列组集合和预先训练好的评价文本情感分类模型，生成各个评价文本情感信息；

存储单元，被配置成根据所述各个评价文本情感信息，对所述教师评价信息进行更新以及将更新后的教师评价信息存储至预先构建的教师评价知识图谱。

5.一种电子设备，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1至3中任一所述的方法。

6.一种计算机可读介质，其上存储有计算机程序，其中，所述程序被处理器执行时实现如权利要求1至3中任一所述的方法。