CN109960725B - 基于情感的文本分类处理方法、装置和计算机设备 - Google Patents

基于情感的文本分类处理方法、装置和计算机设备 Download PDF

Info

Publication number
CN109960725B
CN109960725B CN201910042837.5A CN201910042837A CN109960725B CN 109960725 B CN109960725 B CN 109960725B CN 201910042837 A CN201910042837 A CN 201910042837A CN 109960725 B CN109960725 B CN 109960725B
Authority
CN
China
Prior art keywords
emotion
question
text
model
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910042837.5A
Other languages
English (en)
Other versions
CN109960725A (zh
Inventor
金戈
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910042837.5A priority Critical patent/CN109960725B/zh
Publication of CN109960725A publication Critical patent/CN109960725A/zh
Priority to PCT/CN2019/117161 priority patent/WO2020147395A1/zh
Application granted granted Critical
Publication of CN109960725B publication Critical patent/CN109960725B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及一种基于情感的文本分类处理方法、装置和计算机设备。所述方法包括:获取情感分类任务,所述情感分类任务中包括待分类文本标识;根据所述待分类文本标识获取对应的待分类文本,所述待分类文本包括多个问题以及对应的问题答复;根据所述情感分类任务调用对应的情感分类模型,所述情感分类模型包括多个子模型;将所述问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出所述问题对应的情感分值;根据多个问题对应的情感分值识别所述待分类文本对应的情感类型。采用本方法能够有效的提高对文本进行情感分类的准确性。

Description

基于情感的文本分类处理方法、装置和计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于情感的文本分类处理方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,计算机技术逐渐被应用到对文本的情感分类处理中。例如,在AI(Artificial Intelligence,人工智能)面试中,通过对面试者的回答进行情感分类处理,得到面试者的情感态度,以便企业根据需求对面试者进行筛选。再例如,在问卷调查中,对被调查者的回答进行情感分类处理,以了解被调查者的情感倾向。
在传统方式中,通常是对采集到的所有文本统一进行情感分类。然而,在很多情况下,文本内容对应有不同的问题,不同的问题对情感的反映程度可能是不同的。对所有文本内容统一进行情感分类不能准确反映不同问题下的情感表达,从而导致情感分类结果出现不准确的情况。因此,如何提高情感分类的准确性成为目前需要解决的一个技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高情感分类准确性的基于情感的文本分类处理方法、装置、计算机设备和存储介质。
一种基于情感的文本分类处理方法,所述方法包括:
获取情感分类任务,所述情感分类任务中包括待分类文本标识;
根据所述待分类文本标识获取对应的待分类文本,所述待分类文本包括多个问题以及对应的问题答复;
根据所述情感分类任务调用对应的情感分类模型,所述情感分类模型包括多个子模型;
将所述问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出所述问题对应的情感分值;
根据多个问题对应的情感分值识别所述待分类文本对应的情感类型。
在其中一个实施例中,所述将所述问题以及对应的问题答复输入至对应的子模型,通过子模型运算,包括:
将所述问题答复进行分词,得到多个词语;
根据所述问题调用对应的子模型;
利用所述子模型对所述词语进行情感分类,得到所述问题对应的情感分值。
在其中一个实施例中,在所述根据多个问题对应的情感分值识别所述待分类文本对应的情感类型之后,所述方法还包括:
获取情感需求类型;
将分类后的情感类型与所述情感需求类型进行匹配,得到对应的第一匹配度;
根据所述第一匹配度筛选出符合预设条件的情感类型;
提取所述情感类型对应的主体信息。
在其中一个实施例中,在所述根据多个问题对应的情感分值识别所述待分类文本对应的情感类型之后,所述方法还包括:
获取多种产品信息,所述产品信息包括产品类型;
将所述产品类型与分类后的情感类型进行匹配,得到对应的第二匹配度;
当所述第二匹配度大于预定值时,将所述产品类型对应的产品信息标记为目标产品信息;
提取所述情感类型对应的终端标识,将所述目标产品信息推送至所述终端标识对应的终端。
在其中一个实施例中,所述根据多个问题对应的情感分值识别所述待分类文本对应的情感类型,包括:
获取每个问题对应的权重;
根据所述权重和对应的情感分值进行计算,得到修改后的分值;
将多个问题对应的修改后的分值进行累加,得到情感总分值;
根据所述情感总分值识别所述待分类文本对应的情感类型。
一种基于情感的文本分类处理装置,所述装置包括:
任务获取模块,用于获取情感分类任务,所述情感分类任务中包括待分类文本标识;
文本获取模块,用于根据所述待分类文本标识获取对应的待分类文本,所述待分类文本包括多个问题以及对应的问题答复;
模型调用模块,用于根据所述情感分类任务调用对应的情感分类模型,所述情感分类模型包括多个子模型;将所述问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出所述问题对应的情感分值;
情感类型识别模块,用于根据多个问题对应的情感分值识别所述待分类文本对应的情感类型。
在其中一个实施例中,所述模型调用模块还用于将所述问题答复进行分词,得到多个词语;根据所述问题调用对应的子模型;利用所述子模型对所述词语进行情感分类,得到所述问题对应的情感分值。
在其中一个实施例中,在所述情感类型识别模块之后,所述装置还包括:
需求类型获取模块,用于获取情感需求类型;
类型匹配模块,用于将分类后的情感类型与所述情感需求类型进行匹配,得到对应的第一匹配度;
情感类型筛选模块,用于根据所述第一匹配度筛选出符合预设条件的情感类型;
信息提取模块,用于提取所述情感类型对应的主体信息。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
上述基于情感的文本分类处理方法、装置、计算机设备和存储介质,在获取到情感分类任务中的待分类文本标识后,根据待分类文本标识获取对应待分类文本中的多个问题以及每个问题对应的问题答复,调用情感分类模型中的多个子模型,对每个问题对应的问题答复逐一进行情感分类,根据得到的每个问题对应的情感分值识别待分类文本对应的情感类型。通过调用对应的子模型,针对每一个问题的具体情况,对问题答复逐一进行情感分类,再综合每个问题对应的情感分值识别待分类文本对应的情感类型。与传统方式中对所有文本统一进行情感分类相比,充分结合问题,对相应的问题答复进行情感分类,有效的提高了对文本进行情感分类的准确性。
附图说明
图1为一个实施例中基于情感的文本分类处理方法的应用环境图;
图2为一个实施例中基于情感的文本分类处理方法的流程示意图;
图3为一个实施例中根据情感类型提取主体信息的步骤的流程示意图;
图4为一个实施例中基于情感的文本分类处理装置的结构框图;
图5为另一个实施例中基于情感的文本分类处理装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于情感的文本分类处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104获取终端102发起的情感分类任务,情感分类任务中包括待分类文本标识,服务器104根据待分类文本标识获取对应的待分类文本,根据获取到的情感分类任务调用对应的情感分类模型。服务器104将待分类文本中的问题及问题答复输入情感分类模型的子模型中,通过子模型运算,输出问题对应的情感分值。服务器104根据多个问题对应的情感分值识别待分类文本对应的情感类型。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机和平板电脑,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于情感的文本分类处理方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤202,获取情感分类任务,情感分类任务中包括待分类文本标识。
服务器获取情感分类任务,对获取到的情感分类任务进行解析,得到情感分类任务中包括的待分类文本标识。该情感分类任务可由终端创建并上传至服务器。情感分类任务中包括了待分类文本标识,待分类文本标识指向对应的待分类文本。待分类文本标识可以包括多种类型。在其中一个实施例中,待分类文本标识可以是待分类文本的文件名。服务器可以执行情感分类任务,对待分类文本标识对应的待分类文本进行情感分类处理。
步骤204,根据待分类文本标识获取对应的待分类文本,待分类文本包括多个问题以及对应的问题答复。
服务器可以根据待分类文本标识获取对应的待分类文本。具体的,服务器可以获取待分类文本标识与待分类文本之间的映射关系,利用映射关系获取与待分类文本标识对应的待分类文本。待分类文本中包括多个问题以及对应的问题答复。
其中,服务器可以针对不同用户提出不同问题,也可以对不同用户提出相同问题。问题答复是由用户针对每个问题对应做出的答复意见。例如,在人工智能面试过程中,可以针对不同的面试者提出不同的问题,并接收面试者的回答作为对应的问题答复,以避免面试者私下交流,更真实的反应面试者的应变能力。其中,提出问题的方式可以是多样的。服务器可以从预设问题中随机挑选问题进行提问,也可以根据面试者的回答挑选相关的问题进行提问。再例如,在问卷调查过程中,服务器可以针对不同的被调查者提出相同的问题,接收被调查者的问题答复,以了解被调查者对该些问题的情感倾向。
步骤206,根据情感分类任务调用对应的情感分类模型,情感分类模型包括多个子模型。
服务器可以根据情感分类任务调用对应的情感分类模型,情感分类模型是通过训练得到的用于对问题和问题答复文本进行情感分类的模型。其中,情感分类模型可以由多种分类模型训练得到,比如Fasttext模型。情感分类模型中包括多个子模型,不同的问题可以对应不同的子模型。服务器可以根据情感分类任务调用情感分类模型中问题对应的子模型对问题答复进行情感分类处理。
步骤208,将问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出问题对应的情感分值。
服务器将待分类文本中的问题以及对应的问题答复输入至对应的子模型中,调用子模型对问题答复进行情感分类。通过子模型的运算,输出该问题对应的情感分值。其中,情感分值可以反映针对问题的问题答复的情感倾向。具体的,服务器通过调用子模型进行运算,得到问题答复对应的各个情感标签的概率。根据对应的情感标签的概率进行计算,得到问题对应的情感分值,并输出该问题对应的情感分值。比如,利用Fasttext模型对待分类文本进行情感分类。服务器将待分类文本中的问题答复分别输入问题对应的Fasttext模型的子模型中,子模型对问题答复进行情感分类处理,得到多个情感标签对应的概率。例如情感标签可以包括积极和消极,该问题答复的情感分类结果为:积极概率68%,消极概率32%。根据问题答复的情感标签概率,计算出对应问题对应的情感分值,比如满分值10分时,情感分值为7分。
步骤210,根据多个问题对应的情感分值识别待分类文本对应的情感类型。
服务器综合多个问题对应的情感分值,根据多个问题对应的情感分值识别该待分类文本对应的情感类型,完成对待分类文本进行情感分类的情感分类任务。
在本实施例中,在获取到情感分类任务中的待分类文本标识后,根据待分类文本标识获取对应待分类文本中的多个问题以及每个问题对应的问题答复,调用情感分类模型中的多个子模型,对每个问题对应的问题答复逐一进行情感分类,根据得到的每个问题对应的情感分值识别待分类文本对应的情感类型。通过调用对应的子模型,针对每一个问题的具体情况,对问题答复逐一进行情感分类,再综合每个问题对应的情感分值识别待分类文本对应的情感类型。与传统方式中对所有文本统一进行情感分类相比,充分结合问题,对相应的问题答复进行情感分类,有效的提高了对文本进行情感分类的准确性。
在一个实施例中,根据多个问题对应的情感分值识别待分类文本对应的情感类型的步骤,包括:获取每个问题对应的权重;根据权重和对应的情感分值进行计算,得到修改后的分值;将多个问题对应的修改后的分值进行累加,得到情感总分值;根据情感总分值识别待分类文本对应的情感类型。
服务器获取每个问题所对应的权重。由于每个问题对待分类文本的分类程度的重要性不同,为了均衡每个问题对情感分类程度的影响,每个问题都对应设置一个权重。用户可针对每个问题预先设置对应的重要性,服务器根据每个问题在所有问题中所占的重要性设置每个问题对应的权重。重要的问题所占的权重就可以高一些,简单的问题所占的权重就可以低一些。服务器根据权重和每个问题对应的情感分值进行计算,得到每个问题对应的修改后的分值。该修改后的分值可以客观体现对应的问题答复在待分类文本中的情感。例如,在面试过程中,可能会出现不同类型的问题,比如可以包括关于身份的问题、关于个人技能的问题和关于求职意向的问题等。在上述三类问题中,关于身份的问题所占的权重可以比关于个人技能和求职意向的问题所占的权重轻一些。因此,根据三类问题的问题答复的情感分值,需要结合问题对应的权重,重新进行计算,以得到问题对应的修改后的分值。
服务器将计算得到的多个问题对应的修改后的分值进行累加,得到情感总分值。该情感总分值是综合了问题的待分类文本的情感总分值。服务器根据该情感总分值,识别待分类文本对应的情感类型,完成对待分类文本进行文本分类的情感分类任务。
在本实施例中,服务器通过获取每个问题对应的权重,计算每个问题修改后的分值,利用累加多个问题对应的修改后的分值,得到的情感总分值,并通过情感总分值识别待分类文本对应的情感类型。通过结合每个问题对应的权重,解决了问题的重要性对最终情感类型的影响,有效的提高了对待分类文本进行情感分类的准确性。
在一个实施例中,用户针对问题做出的答复意见可以包括多种形式。比如,可以包括文本形式和语音形式。服务器在收到答复意见时,可以判断答复意见的形式。若是文本形式,则直接将文本形式的答复意见作为问题答复,结合多个问题和问题答复生成待分类文本。若答复意见是语音形式的内容,服务器则将语音内容转换为文本形式的答复内容,并将该答复内容作为问题答复,生成待分类文本。
在本实施例中,除了接收文本形式的问题答复,还可以接收语音形式的问题答复。通过将语音形式的问题答复转换为文本形式的问题答复,生成待分类文本,丰富了兼容的问题答复形式,便于用户采用多种形式做出问题答复。
在一个实施例中,将问题以及对应的问题答复输入至对应的子模型,通过子模型运算的步骤,包括:将问题答复进行分词,得到多个词语;根据问题调用对应的子模型;利用子模型对词语进行情感分类,得到问题对应的情感分值。
服务器可以采用多种方式对待分类文本中的问题答复进行分词,得到多个词语。具体的,服务器可以采用字符串匹配、理解、统计等方式中的一种或多种方式的结合对问题答复进行分词。其中,字符串匹配方式是指将问题答复与预设词典中的词条进行匹配,若在词典中找到该字符串,则认为匹配成功,即识别出一个词。字符串匹配的方式可以包括正向字符串匹配和逆向字符串匹配。理解方式是指服务器在对问题答复进行词语切割时进行语义分析和句法分析,利用语义信息和句法信息处理切割词语时出现的歧义情况。统计方式是指服务器对问题答复中相邻共现的字的组合的频度进行统计,根据他们的共现信息进行分词。在其中一个实施例中,服务器在分词时还可以引入N-gram向量。通过得到的向量特征确定对问题答复进行分词后的词语顺序,更加准确的体现问题答复的内容,有效的提高了对待分类文本情感分类的准确性。
每个问题对应一个子模型。服务器获取问题与子模型之间的映射关系,根据映射关系调用问题对应的子模型。服务器将分词得到的多个词语输入子模型中,利用子模型对问题答复对应的词语进行情感分类,以得到问题对应的情感分值。
在本实施例中,通过对问题答复进行分词,调用问题对应的子模型对得到的词语进行情感分类,得到了问题对应的情感分值。针对每一个问题的具体内容调用对应的子模型,得到问题对应的情感分值,有效的提高了对待分类文本进行情感分类的准确性。
在一个实施例中,服务器在获取到待分类文本后,对待分类文本进行清理。比如删除不符合预设规则的待分类文本。再对清理之后的待分类文本进行情感分类。具体的,服务器将问题答复进行分词,得到多个词语后,根据问题调用对应的子模型。按照子模型的需要对多个词语进行整理,整理成子模型需要的数据形式。比如,服务器可以将词语整理成表格形式,再将表格形式的词语输入子模型中,利用子模型对问题答复进行情感分类,得到问题对应的情感分值。
在本实施例中,获取到待分类文本后,对待分类文本进行清理,剔除不合法的待分类文本,并对分词得到的词语进行整理,得到符合子模型需求的数据形式,输入子模型中。有效的提高了对待分类文本的情感分类效率。
在一个实施例中,在根据多个问题对应的情感分值识别待分类文本对应的情感类型的步骤之后,上述方法还包括:根据情感类型提取主体信息的步骤。如图3所示,该步骤具体包括:
步骤302,获取情感需求类型。
步骤304,将分类后的情感类型与情感需求类型进行匹配,得到对应的第一匹配度。
步骤306,根据第一匹配度筛选出符合预设条件的情感类型。
步骤308,提取情感类型对应的主体信息。
服务器获取情感需求类型,其中,情感需求类型是指符合用户需求的情感类型。服务器可以采用多种方式将对待分类文本进行情感分类后得到的情感类型与情感类型进行匹配。具体的,服务器可以将分类后得到的情感类型逐一与情感需求类型进行匹配,还可以调用多个线程对情感类型的匹配并行处理。服务器将情感类型与情感需求类型进行匹配后,得到该情感类型对应的第一匹配度。服务器对多个情感类型对应的第一匹配度进行筛选,筛选出符合预设条件的情感类型。其中,预设条件可以是由用户预先设置的条件,比如筛选出第一匹配度大于一个定值的情感类型。服务器提取符合预设条件的情感类型对应的主体信息,以得到符合情感需求类型的主体信息。
例如,在智能面试中,服务器将面试者提供的待分类文本进行情感分类后得到该面试者对应的情感类型,服务器可以获取招聘岗位的情感需求类型,将面试者们的情感类型与岗位的情感需求类型进行匹配,得到多个面试者们对应的第一匹配度。服务器根据第一匹配度进行筛选,筛选出第一匹配度符合预设条件的情感类型,该情感类型即是符合岗位情感需求类型的。服务器提取符合条件的情感类型对应的主体信息,得到符合条件的主体信息。通过从多个面试者的情感类型中筛选出与岗位情感需求类型匹配的面试者的主体信息,从多个面试者中根据情感类型初步筛选出符合招聘岗位需求的面试者,有效的提高了面试效率和准确性。
在本实施例中,通过将情感类型与情感需求类型进行匹配,根据第一匹配度筛选出符合预设条件的情感类型,有效的利用情感类型进行满足需求的筛选,得到符合需求的主体信息,有效的丰富了目标筛选方式,提高了筛选效率。
在一个实施例中,在根据多个问题对应的情感分值识别待分类文本对应的情感类型的步骤之后,上述方法还包括:获取多种产品信息,产品信息包括产品类型;将产品类型与分类后的情感类型进行匹配,得到对应的第二匹配度;当第二匹配度大于预定值时,将产品类型对应的产品信息标记为目标产品信息;提取情感类型对应的终端标识,将目标产品信息推送至终端标识对应的终端。
服务器获取多种产品对应的产品信息,产品信息中包括了对应的产品类型。多种产品中可以包括不同产品类型的产品。例如,在基金类产品中,包括高风险高收益型产品,也包括低风险低收益型产品。服务器可以采用多种方式将多种产品的产品类型与分类后的情感类型进行匹配。具体的,服务器可以将多种产品对应的产品类型依次与情感类型进行匹配,也可以调用多个线程对产品类型与情感类型并行处理,得到对应的第二匹配度。当第二匹配度大于预定值时,将该产品类型对应的产品信息标记为目标产品信息。其中,预定值是由用户预先设定的值。当第二匹配度大于预定值时,则表示该产品类型对应的产品与该情感类型对应的用户是相匹配的。例如,高风险高收益型产品与偏向冒险型的用户比较匹配,低风险低收益型产品与偏向保守型的用户比较匹配。服务器提取情感类型对应的终端标识,将该目标产品信息推送至终端标识对应的终端,完成符合情感类型匹配的产品信息推送。
在本实施例中,通过将产品类型与用户的情感类型进行匹配,为用户推送符合用户情感类型的目标产品信息,有效的提高了对应信息推送的准确性。
可以理解的是,在一个实施例中,在获取多种产品信息,将产品类别与情感类型进行匹配之前,还可以获取情感需求类型,将分类后的情感类型与情感需求类型进行匹配,得到对应的第一匹配度,根据第一匹配度筛选出符合预设条件的情感类型。
服务器再将多种产品类型与筛选出的情感类型进行匹配,得到对应的第二匹配度,将第二匹配度大于预定值的产品类型对应的产品信息标记为目标产品信息,将目标产品信息推送至情感类型对应的终端。服务器可以利用情感类型对用户进行筛选,筛选出符合情感需求类型的用户。例如,服务器可以根据情感类型筛选出对购买产品有积极意向的用户,再将产品类型与筛选出的用户的情感类型进行匹配,从多种产品类型中筛选出符合用户情感类型的产品类型。到达给有购买意向的用户推送符合用户情感类型的产品信息的效果。
在本实施例中,将对情感类型进行筛选和对产品类型进行筛选相结合,有效的提高了产品信息推送的效率和准确性。
在一个实施例中,服务器建立通用情感分类模型,通用情感分类模型可以采用Fasttext模型。服务器接收训练集数据,其中,训练集数据中可以包括多个训练文本,训练文本中包括目标问题、目标问题对应的问题答复以及问题答复对应的目标情感分值。每个目标问题可以对应多个问题答复和对应的目标情感分值。服务器可以利用训练集数据对通用情感分类模型进行训练。具体的,服务器调用目标问题对应的通用情感分类模型中的子模型,将对应的问题答复输入子模型中,通过子模型运算,输出训练情感分值。服务器可以将训练情感分值与目标情感分值进行比对,根据比对结果对相应的子模型进行调整。调整后重复将问题答复输入对应的子模型中,对子模型进行调整,直到训练情感分值与目标情感分值比对成功,即得到了该目标问题对应的目标子模型。服务器利用多个训练文本中的目标问题、问题答复以及目标情感分值对多个子模型进行训练,以得到目标情感分类模型。
在本实施例中,通过利用训练集数据对通用情感分类模型进行训练,得到目标情感分类模型,有效的提高了目标情感分类模型的准确度。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种基于情感的文本分类处理装置,包括:任务获取模块402、文本获取模块404、模型调用模块406和情感类型识别模块408,其中:
任务获取模块402,用于获取情感分类任务,情感分类任务中包括待分类文本标识。
文本获取模块404,用于根据待分类文本标识获取对应的待分类文本,待分类文本包括多个问题以及对应的问题答复。
模型调用模块406,用于根据情感分类任务调用对应的情感分类模型,情感分类模型包括多个子模型;将问题以及对应的问题答复输入至对应的子模型,通过子模型运算,输出问题对应的情感分值。
情感类型识别模块408,用于根据多个问题对应的情感分值识别待分类文本对应的情感类型。
在一个实施例中,上述模型调用模块406还用于将问题答复进行分词,得到多个词语;根据问题调用对应的子模型;利用子模型对词语进行情感分类,得到问题对应的情感分值。
在一个实施例中,如图5所示,在上述情感类型识别模块408之后,上述基于情感的文本分类处理装置还包括:
需求类型获取模块502,用于获取情感需求类型。
情感类型匹配模块504,用于将分类后的情感类型与情感需求类型进行匹配,得到对应的第一匹配度。
情感类型筛选模块506,用于根据第一匹配度筛选出符合预设条件的情感类型。
主体信息提取模块508,用于提取情感类型对应的主体信息。
在一个实施例中,在上述情感类型识别模块408之后,上述基于情感的文本分类处理装置还包括产品信息推送模块,用于获取多种产品信息,产品信息包括产品类型;将产品类型与分类后的情感类型进行匹配,得到对应的第二匹配度;当第二匹配度大于预定值时,将产品类型对应的产品信息标记为目标产品信息;提取情感类型对应的终端标识,将目标产品信息推送至终端标识对应的终端。
在一个实施例中,上述情感类型识别模块408还用于获取每个问题对应的权重;根据权重和对应的情感分值进行计算,得到修改后的分值;将多个问题对应的修改后的分值进行累加,得到情感总分值;根据情感总分值识别待分类文本对应的情感类型。
关于基于情感的文本分类处理装置的具体限定可以参见上文中对于基于情感的文本分类处理方法的限定,在此不再赘述。上述基于情感的文本分类处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于情感的文本分类处理数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于情感的文本分类处理方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种基于情感的文本分类处理方法,所述方法包括:
获取多个终端各自上传的情感分类任务,所述情感分类任务中包括待分类文本标识;
对于每个所述待分类文本,根据所述待分类文本标识获取对应的待分类文本,所述待分类文本包括多个问题以及针对每个问题做出的对应的问题答复;
根据所述情感分类任务调用对应的情感分类模型,所述情感分类模型包括多个子模型,不同的问题对应不同的子模型,每个问题对应一个子模型;
根据问题与子模型之间的映射关系调用问题对应的子模型,将所述问题答复输入至相应的问题对应的子模型中,通过所述子模型对所述问题答复进行情感分类处理,得到所述问题答复对应多个情感标签的概率,根据对应多个情感标签的概率进行计算,得到所述问题答复相应的问题对应的情感分值,并输出所述问题对应的情感分值;
根据所述多个问题中每个问题对应的权重,对相应的情感分值进行加权后累加,得到所述多个问题对应的情感总分值,根据所述情感总分值,识别所述待分类文本对应的情感类型;
获取情感需求类型,将所述多个终端各自上传的待分类文本对应的情感类型分别与所述情感需求类型进行匹配,得到各情感类型对应的第一匹配度,根据所述第一匹配度筛选出符合预设条件的情感类型;
获取多种产品信息,所述产品信息包括产品类型;
将所述产品类型与筛选出的所述符合预设条件的情感类型进行匹配,得到对应的第二匹配度,将所述第二匹配度大于预定值的产品类型对应的产品信息标记为目标产品信息,提取所述筛选出的符合预设条件的情感类型对应的终端标识,将所述目标产品信息推送至所述终端标识对应的终端。
2.根据权利要求1所述的方法,其特征在于,所述通过所述子模型对所述问题答复进行情感分类处理,得到所述问题答复对应多个情感标签的概率,根据对应多个情感标签的概率进行计算,得到所述问题答复相应的问题对应的情感分值,包括:
将所述问题答复进行分词,得到多个词语;
利用所述子模型对所述词语进行情感分类处理,得到所述问题答复对应多个情感标签的概率,根据对应多个情感标签的概率进行计算,得到所述问题答复相应的问题对应的情感分值。
3.根据权利要求1所述的方法,其特征在于,所述将所述多个终端各自上传的待分类文本对应的情感类型与所述情感需求类型进行匹配,得到各情感类型对应的第一匹配度,包括:
调用多个线程,并行地将所述多个终端各自上传的待分类文本对应的情感类型与所述情感需求类型进行匹配,得到各情感类型对应的第一匹配度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一匹配度筛选出符合预设条件的情感类型之后,所述方法还包括:
提取所述符合预设条件的情感类型对应的主体信息。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述子模型的训练步骤包括:
获取训练文本,所述训练文本包括目标问题、所述目标问题对应的问题答复以及所述问题答复对应的目标情感分值;
调用所述目标问题对应的通用情感分类模型中的子模型,将所述目标问题对应的问题答复输入所述通用情感分类模型中的子模型中,通过子模型运算,输出训练情感分值;
将所述训练情感分值与所述问题答复对应的目标情感分值进行比对,根据比对结果对相应的子模型进行调整,直至训练情感分值与目标情感分值比对成功,得到所述目标问题对应的目标子模型。
6.一种基于情感的文本分类处理装置,其特征在于,所述装置包括:
任务获取模块,用于获取多个终端各自上传的情感分类任务,所述情感分类任务中包括待分类文本标识;
文本获取模块,用于对于每个所述待分类文本,根据所述待分类文本标识获取对应的待分类文本,所述待分类文本包括多个问题以及针对每个问题做出的对应的问题答复;
模型调用模块,用于根据所述情感分类任务调用对应的情感分类模型,所述情感分类模型包括多个子模型,不同的问题对应不同的子模型,每个问题对应一个子模型,根据问题与子模型之间的映射关系调用问题对应的子模型,将所述问题答复输入至相应的问题对应的子模型中,通过所述子模型对所述问题答复进行情感分类处理,得到所述问题答复对应多个情感标签的概率,根据对应多个情感标签的概率进行计算,得到所述问题答复相应的问题对应的情感分值,并输出所述问题对应的情感分值;
情感类型识别模块,用于根据所述多个问题中每个问题对应的权重,对相应的情感分值进行加权后累加,得到所述多个问题对应的情感总分值,根据所述情感总分值,识别所述待分类文本对应的情感类型;
需求类型获取模块,用于获取情感需求类型;
情感类型匹配模块,用于将所述多个终端各自上传的待分类文本对应的情感类型分别与所述情感需求类型进行匹配,得到各情感类型对应的第一匹配度;
情感类型筛选模块,用于根据所述第一匹配度筛选出符合预设条件的情感类型;
产品信息推送模块,用于获取多种产品信息,所述产品信息包括产品类型;将所述产品类型与筛选出的所述符合预设条件的情感类型进行匹配,得到对应的第二匹配度,将所述第二匹配度大于预定值的产品类型对应的产品信息标记为目标产品信息,提取所述筛选出的符合预设条件的情感类型对应的终端标识,将所述目标产品信息推送至所述终端标识对应的终端。
7.根据权利要求6所述的装置,其特征在于,所述模型调用模块还用于将所述问题答复进行分词,得到多个词语;利用所述子模型对所述词语进行情感分类处理,得到所述问题答复对应多个情感标签的概率,根据对应多个情感标签的概率进行计算,得到所述问题答复相应的问题对应的情感分值。
8.根据权利要求6所述的装置,其特征在于,所述情感类型匹配模块,还用于调用多个线程,并行地将所述多个终端各自上传的待分类文本对应的情感类型与所述情感需求类型进行匹配,得到各情感类型对应的第一匹配度。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
信息提取模块,用于提取所述符合预设条件的情感类型对应的主体信息。
10.根据权利要求6至9中任一项所述的装置,其特征在于,所述装置还包括:
训练模块,用于获取训练文本,所述训练文本包括目标问题、所述目标问题对应的问题答复以及所述问题答复对应的目标情感分值;调用所述目标问题对应的通用情感分类模型中的子模型,将所述目标问题对应的问题答复输入所述通用情感分类模型中的子模型中,通过子模型运算,输出训练情感分值;将所述训练情感分值与所述问题答复对应的目标情感分值进行比对,根据比对结果对相应的子模型进行调整,直至训练情感分值与目标情感分值比对成功,得到所述目标问题对应的目标子模型。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN201910042837.5A 2019-01-17 2019-01-17 基于情感的文本分类处理方法、装置和计算机设备 Active CN109960725B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910042837.5A CN109960725B (zh) 2019-01-17 2019-01-17 基于情感的文本分类处理方法、装置和计算机设备
PCT/CN2019/117161 WO2020147395A1 (zh) 2019-01-17 2019-11-11 基于情感的文本分类处理方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910042837.5A CN109960725B (zh) 2019-01-17 2019-01-17 基于情感的文本分类处理方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN109960725A CN109960725A (zh) 2019-07-02
CN109960725B true CN109960725B (zh) 2024-06-21

Family

ID=67023453

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910042837.5A Active CN109960725B (zh) 2019-01-17 2019-01-17 基于情感的文本分类处理方法、装置和计算机设备

Country Status (2)

Country Link
CN (1) CN109960725B (zh)
WO (1) WO2020147395A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109960725B (zh) * 2019-01-17 2024-06-21 平安科技(深圳)有限公司 基于情感的文本分类处理方法、装置和计算机设备
CN111881286B (zh) * 2019-09-10 2021-08-24 马上消费金融股份有限公司 一种分类模糊性分析方法及装置
CN111222837A (zh) * 2019-10-12 2020-06-02 中国平安财产保险股份有限公司 智能化面试的方法、***、设备及计算机存储介质
CN111078879A (zh) * 2019-12-09 2020-04-28 北京邮电大学 基于深度学习的卫星互联网文本敏感信息检测方法及装置
CN112214576B (zh) * 2020-09-10 2024-02-06 深圳价值在线信息科技股份有限公司 舆情分析方法、装置、终端设备及计算机可读存储介质
CN112131366B (zh) * 2020-09-23 2024-02-09 腾讯科技(深圳)有限公司 训练文本分类模型及文本分类的方法、装置及存储介质
CN112383593B (zh) * 2020-10-30 2023-06-02 中国平安人寿保险股份有限公司 基于线下陪访的智能内容推送方法、装置及计算机设备
CN112651236B (zh) * 2020-12-28 2021-10-01 中电金信软件有限公司 提取文本信息的方法、装置、计算机设备和存储介质
CN112784583A (zh) * 2021-01-26 2021-05-11 浙江香侬慧语科技有限责任公司 一种多角度情感分析方法、***、存储介质及设备
CN112906717B (zh) * 2021-03-04 2024-05-28 广联达科技股份有限公司 一种工程文件内容的识别方法及***
CN113408269B (zh) * 2021-07-20 2024-06-28 北京百度网讯科技有限公司 文本情感分析方法和装置
CN113722491A (zh) * 2021-09-08 2021-11-30 北京有竹居网络技术有限公司 确定文本情节类型的方法、装置、可读介质及电子设备
CN113807103B (zh) * 2021-09-16 2024-04-09 陈雪刚 基于人工智能的招聘方法、装置、设备及存储介质
CN116108836B (zh) * 2023-04-10 2023-07-11 之江实验室 文本情感识别方法、装置、计算机设备及可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108513175A (zh) * 2018-03-29 2018-09-07 网宿科技股份有限公司 一种弹幕信息的处理方法及***

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102317964B (zh) * 2007-04-06 2016-04-06 盖亚软件Ip有限公司 一种内容分发***和分发内容的方法
WO2009152154A1 (en) * 2008-06-09 2009-12-17 J.D. Power And Associates Automatic sentiment analysis of surveys
US20120290910A1 (en) * 2011-05-11 2012-11-15 Searchreviews LLC Ranking sentiment-related content using sentiment and factor-based analysis of contextually-relevant user-generated data
US10437871B2 (en) * 2015-08-12 2019-10-08 Hithink Royalflush Information Network Co., Ltd. Method and system for sentiment analysis of information
CN106445919A (zh) * 2016-09-28 2017-02-22 上海智臻智能网络科技股份有限公司 一种情感分类方法及装置
US10878479B2 (en) * 2017-01-05 2020-12-29 Microsoft Technology Licensing, Llc Recommendation through conversational AI
CN106909654B (zh) * 2017-02-24 2020-07-21 北京时间股份有限公司 一种基于新闻文本信息的多级分类***及方法
CN107679234B (zh) * 2017-10-24 2020-02-11 上海携程国际旅行社有限公司 客服信息提供方法、装置、电子设备、存储介质
CN108133038B (zh) * 2018-01-10 2022-03-22 重庆邮电大学 一种基于动态记忆网络的实体级别情感分类***及方法
CN108536681B (zh) * 2018-04-16 2023-05-30 腾讯科技(深圳)有限公司 基于情感分析的智能问答方法、装置、设备及存储介质
CN108629043B (zh) * 2018-05-14 2023-05-12 平安科技(深圳)有限公司 网页目标信息的提取方法、装置及存储介质
CN108874992B (zh) * 2018-06-12 2021-03-19 深圳华讯网络科技有限公司 舆情分析方法、***、计算机设备和存储介质
CN109960725B (zh) * 2019-01-17 2024-06-21 平安科技(深圳)有限公司 基于情感的文本分类处理方法、装置和计算机设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108513175A (zh) * 2018-03-29 2018-09-07 网宿科技股份有限公司 一种弹幕信息的处理方法及***

Also Published As

Publication number Publication date
WO2020147395A1 (zh) 2020-07-23
CN109960725A (zh) 2019-07-02

Similar Documents

Publication Publication Date Title
CN109960725B (zh) 基于情感的文本分类处理方法、装置和计算机设备
CN110765265B (zh) 信息分类抽取方法、装置、计算机设备和存储介质
CN109829628B (zh) 基于大数据的风险预警方法、装置和计算机设备
CN109871446B (zh) 意图识别中的拒识方法、电子装置及存储介质
CN109165840B (zh) 风险预测处理方法、装置、计算机设备和介质
CN111859960B (zh) 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质
WO2020143844A1 (zh) 意图分析方法、装置、显示终端及计算机可读存储介质
WO2021068321A1 (zh) 基于人机交互的信息推送方法、装置和计算机设备
CN109829629B (zh) 风险分析报告的生成方法、装置、计算机设备和存储介质
WO2021114840A1 (zh) 基于语义分析的评分方法、装置、终端设备及存储介质
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及***
CN111191032B (zh) 语料扩充方法、装置、计算机设备和存储介质
CN108491406B (zh) 信息分类方法、装置、计算机设备和存储介质
CN108520041B (zh) 文本的行业分类方法、***、计算机设备和存储介质
CN111783471B (zh) 自然语言的语义识别方法、装置、设备及存储介质
CN110717021B (zh) 人工智能面试中获取输入文本和相关装置
CN111309881A (zh) 智能问答中未知问题处理方法、装置、计算机设备和介质
CN110633475A (zh) 基于计算机场景的自然语言理解方法、装置、***和存储介质
CN110931012A (zh) 答复消息生成方法、装置、计算机设备和存储介质
CN113240510A (zh) 异常用户预测方法、装置、设备及存储介质
CN112632248A (zh) 问答方法、装置、计算机设备和存储介质
CN113762392A (zh) 基于人工智能的理财产品推荐方法、装置、设备及介质
CN111400340A (zh) 一种自然语言处理方法、装置、计算机设备和存储介质
CN112464660B (zh) 文本分类模型构建方法以及文本数据处理方法
CN113850077A (zh) 基于人工智能的话题识别方法、装置、服务器及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant