CN116541523A - 一种基于大数据的法律判决舆情分类方法 - Google Patents
一种基于大数据的法律判决舆情分类方法 Download PDFInfo
- Publication number
- CN116541523A CN116541523A CN202310485333.7A CN202310485333A CN116541523A CN 116541523 A CN116541523 A CN 116541523A CN 202310485333 A CN202310485333 A CN 202310485333A CN 116541523 A CN116541523 A CN 116541523A
- Authority
- CN
- China
- Prior art keywords
- public opinion
- level feature
- text
- feature vectors
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000013598 vector Substances 0.000 claims abstract description 108
- 238000013145 classification model Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 10
- 230000007246 mechanism Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 239000004973 liquid crystal related substance Substances 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000013135 deep learning Methods 0.000 description 5
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于自然语言处理领域,具体涉及一种基于大数据的法律判决舆情分类方法;该方法包括:获取法律判决文本数据和带标签的舆情文本数据;提取舆情文本的词级特征向量和句级特征向量;提取法律判决文本的词级特征向量;根据舆情文本的词级特征向量和法律判决文本的词级特征向量得到舆情文本的交叉词级特征向量;对舆情文本的句级特征向量作聚类处理,得到正向舆情聚类中心和非正向舆情聚类中心;根据交叉词级特征进行分类,得到舆情文本的分类结果;计算模型总损失;根据总损失调整模型参数,得到训练好的文本分类模型;本发明提高了模型的分类准确度。
Description
技术领域
本发明属于自然语言处理领域,具体涉及一种基于大数据的法律判决舆情分类方法。
背景技术
对于文本分类来说,传统的方法主要有基于规则的方法、基于统计的方法和基于深度学习的方法。基于规则的方法需要专家知识来人工定义规则和随时改进规则,对于很多需要理解语境的文本无法通过简单的规则进行处理,因此不太适用于大规模的文本分类;基于统计的方法往往存在数据稀疏性问题且难以处理长文本,这会导致训练和推理变得非常困难,难以用于实际;基于深度学习的方法,通过各种深度学习网络提取文本的数学表征,最后进行分类任务,目前大部分文本分类的最优模型都开始采用基于深度学习的方法。
深度学习的方法有多种,例如基于Bert的文本分类方法、基于LSTM神经网络的文本分类方法等,但是这些方法通常只对输入的舆情文本进行分类,没有注入相关的先验知识,模型只能针对当前舆情文本进行分类,对于文本中出现的一些判决书中的词不能获得其完整的信息。
发明内容
针对现有技术存在的不足,本发明提出了一种基于大数据的法律判决舆情分类方法,该方法包括:获取法律判决文本数据和待分类的舆情文本数据,将法律判决文本数据和待分类的舆情文本数据输入到训练好的文本分类模型中,得到舆情文本数据的分类结果;
文本分类模型的训练过程包括:
S1:获取法律判决文本数据和带标签的舆情文本数据;
S2:根据舆情文本数据提取舆情文本的词级特征向量和句级特征向量;根据法律判决文本数据提取法律判决文本的词级特征向量和句级特征向量;
S3:采用多头注意力机制对舆情文本的词级特征向量和法律判决文本的词级特征向量进行处理,得到舆情文本的交叉词级特征向量;
S4:对舆情文本的句级特征向量作聚类处理,得到正向舆情聚类中心和非正向舆情聚类中心;
S5:将交叉词级特征向量输入到全连接神经网络进行处理,得到舆情文本的低维特征;根据低维特征对舆情文本进行分类,得到舆情文本的分类结果;
S6:对低维特征和两个聚类中心作对比学习并计算对比学习损失;根据标签和分类结果计算全连接分类损失;根据对比学习损失函数与全连接分类损失计算模型总损失;
S7:根据总损失调整模型参数,得到训练好的文本分类模型。
优选的,所述步骤S2具体包括:
S21:采用预训练的Bert模型对舆情文本数据进行处理,得到舆情文本的词级特征向量和句级特征向量;
S22:查询预训练的Bert模型的vocab词表,得到法律判决文本的词级特征向量;将词级特征向量通过全连接网络获得法律判决文本的句级特征向量。
优选的,所述步骤S3具体包括:将舆情文本的词级特征向量分别输入到不同的线性层进行处理,得到K矩阵和V矩阵;将法律判决文本的词级特征向量输入到线性层进行处理,得到Q矩阵;根据K矩阵、V矩阵和Q矩阵得到交叉词级特征向量。
进一步的,计算交叉词级特征向量的公式为:
其中,M表示交叉词级特征向量,dk表示多头注意力机制中每个头的维度,E表示单位矩阵,softmax()表示softmax激活函数。
优选的,对舆情文本的句级特征向量作聚类处理的过程包括:
S41:将法律判决文本的句级特征向量作为正向舆情聚类中心,并随机初始化与正向舆情聚类中心维度相同的非正向舆情聚类中心;
S42:计算每个舆情文本的句级特征向量与两个聚类中心的距离,将句级特征向量归类到距离最小的类别;
S43:更新非正向舆情聚类中心并返回步骤S42;直到非正向舆情聚类中心不再发生变化。
进一步的,计算舆情文本的句级特征向量与聚类中心距离的公式为:
其中,distance表示舆情文本的句级特征向量与聚类中心的距离,hi表示句级特征向量第i个维度的值,ci表示聚类中心第i个维度的值,d表示句级特征向量的维度。
进一步的,更新非正向舆情聚类中心的过程包括:计算所有被归类到非正向舆情的的句级特征向量的聚类中心,将该聚类中心作为新的非正向舆情聚类中心,计算新的非正向舆情聚类中心的公式为:
其中,表示新的非正向舆情聚类中心,m表示所有被归类到非正向舆情的句级特征向量个数,Hid表示所有被归类到非正向舆情的句级特征向量集合H中第i个向量在第d个维度上的值。
优选的,计算对比学习损失的公式为:
其中,l1表示对比学习损失,Si表示舆情文本中第i条舆情评论的低维特征向量,C1表示正向舆情聚类中心,表示非正向舆情聚类中心,sim()表示求余弦相似度,min()表示求最小值,b表示每批次的舆情评论数量,/>表示第i条舆情评论的预测结果。
优选的,计算全连接分类损失的公式为:
其中,l2表示全连接分类损失,yi表示第i条舆情评论的标签,表示第i条舆情评论的预测概率值。
本发明的有益效果为:本发明采用基于聚类的对比学习和基于cross attention的注意力机制解决了传统模型无法结合判决文书和舆情以获取更多信息来充分挖掘舆情与判决文书之间的内在关系的问题,通过基于聚类的对比学习,缓解了句极特征向量与由舆情文本词向量构成的序列向量表征不一致的问题并提高了模型的鲁棒性,基于crossattention的注意力机制,引入了更多关于舆情的前缀信息,模型对于舆情中出现的一些关键信息结合判决文书信息后将会有更深入的理解,提高了模型的分类准确度。
附图说明
图1为本发明中文本分类模型训练流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出了一种基于大数据的法律判决舆情分类方法,如图1所示,所述方法包括以下内容:获取法律判决文本数据和待分类的舆情文本数据,将法律判决文本数据和待分类的舆情文本数据输入到训练好的文本分类模型中,得到舆情文本数据的分类结果;
文本分类模型的训练过程包括:
S1:获取法律判决文本数据和带标签的舆情文本数据。
获取法律判决文本数据,具体的,获取中国裁判文书网获取判决文书,根据文书概要,依次拼接案件类型、案由、审理程序和标题,构成法律判决文本数据。从互联网上获取与判决文书相关的舆情评论,并对其进行人工标注,标注1表明该评论不反对该判决文书,作为正向舆情,标注0表示该评论反对该判决文书,作为非正向舆情,得到带标签的舆情文本数据。根据一条判决文书对应多条舆情文本的原则,将所有舆情文本按照判决文书进行聚合,对每条判决文书抽取对应80%的舆情文本作为训练集,其余作为测试集。
S2:根据舆情文本数据提取舆情文本的词级特征向量和句级特征向量;根据法律判决文本数据提取法律判决文本的词级特征向量和句级特征向量。
将训练集分批次输入模型以对模型进行训练,具体的:
S21:采用预训练的Bert模型对舆情文本数据进行处理,具体的,将Bert模型输出的CLS位置的向量作为舆情文本的句级特征向量,其余位置的输出作为舆情文本的词级特征向量序列;
S22:查询预训练的Bert模型的vocab词表,得到法律判决文本的词级特征向量;并将词级特征向量通过全连接网络获得法律判决文本的句级特征向量。
S3:采用多头注意力机制对舆情文本的词级特征向量和法律判决文本的词级特征向量进行处理,得到舆情文本的交叉词级特征向量。
将舆情文本的词级特征向量分别输入到不同的线性层进行处理,得到K矩阵和V矩阵;将法律判决文本的词级特征向量输入到线性层进行处理,得到Q矩阵;根据K矩阵、V矩阵和Q矩阵计算交叉词级特征向量,具体的,构建cross attention网络,用法律判决文本对应的Q矩阵去查询舆情文本对应的K矩阵中的内容,获得舆情文本对应的V矩阵的重要性权重,通过将权重矩阵V的对角线元素削弱来缓解每个词过度关注自身的问题;采用多头注意力机制对舆情文本的词级特征向量和法律判决文本的词级特征向量进行处理的公式表示为:
其中,M表示交叉词级特征向量,dk表示多头注意力机制中每个头的维度,E表示单位矩阵,softmax()表示softmax激活函数,表示对于矩阵中的每一个元素xi,将其值缩放到[0,1]的范围内。
S4:对舆情文本的句级特征向量作聚类处理,得到正向舆情聚类中心和非正向舆情聚类中心。
S41:将法律判决文本的句级特征向量作为正向舆情聚类中心C1,并随机初始化与正向舆情聚类中心维度相同的非正向舆情聚类中心C2。
聚类中心Ci,i=1,2可表示为:
Ci={c1,c2,...,cd}
S42:计算每个舆情文本的句级特征向量与两个聚类中心的距离,将句级特征向量归类到距离最小的类别。
其中,distance表示舆情文本的句级特征向量与聚类中心的距离,hi表示句级特征向量第i个维度的值,ci表示聚类中心第i个维度的值,d表示句级特征向量的维度。
将舆情文本的句级特征向量归类到与聚类中心距离最小的类别(正向舆情或反向舆情)。
S43:更新非正向舆情聚类中心并返回步骤S42;直到非正向舆情聚类中心不再发生变化。
更新非正向舆情聚类中心的过程包括:计算所有被归类到非正向舆情的句级特征向量的聚类中心,将该聚类中心作为新的非正向舆情聚类中心,计算新的非正向舆情聚类中心的公式为:
其中,表示新的非正向舆情聚类中心,m表示所有被归类到非正向舆情的句级特征向量个数,Hid表示所有被归类到非正向舆情的句级特征向量集合H中第i个向量在第d个维度上的值。
S5:将交叉词级特征向量输入到全连接神经网络进行处理,得到舆情文本的低维特征;根据低维特征对舆情文本进行分类,具体的,将低维特征通过全连接神经网络获得对于每个类别的概率,选取概率最大的类别作为舆情文本的分类结果。
S6:对低维特征和两个聚类句级特征向量作对比学习并计算对比学习损失;根据标签和分类结果计算全连接分类损失;根据对比学习损失函数与全连接分类损失计算模型总损失。
计算对比学习损失l1的公式为:
其中,l1表示对比学习损失,Si表示舆情文本中第i条舆情评论的低维特征向量,C1表示正向舆情聚类中心,表示非正向舆情聚类中心,sim()表示求余弦相似度,min()表示求最小值,b表示每批次的舆情评论数量,/>表示第i条舆情评论的预测结果;通过这样的设计,可以让模型着重关注于被模型预测错误的数据,使得模型在对比学习中与对应类别的聚类中心对齐。
计算全连接分类损失l2的公式为:
其中,yi表示第i条舆情评论的标签,表示第i条舆情评论的预测概率值。
根据对比学习损失函数与全连接分类损失计算模型总损失,具体公式为:
其中l1表示对比学习损失函数,l2表示全连接分类损失函数。
S7:根据总损失调整模型参数,得到得到训练好的文本分类模型。
根据损失函数优化模型,当损失最小时,完成模型的训练;获取法律判决文本数据和待分类的舆情文本数据,将法律判决文本数据和待分类的舆情文本数据输入到训练好的文本分类模型中,可得到舆情文本数据的分类结果。
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于大数据的法律判决舆情分类方法,其特征在于,包括:获取法律判决文本数据和待分类的舆情文本数据,将法律判决文本数据和待分类的舆情文本数据输入到训练好的文本分类模型中,得到舆情文本数据的分类结果;
文本分类模型的训练过程包括:
S1:获取法律判决文本数据和带标签的舆情文本数据;
S2:根据舆情文本数据提取舆情文本的词级特征向量和句级特征向量;根据法律判决文本数据提取法律判决文本的词级特征向量和句级特征向量;
S3:采用多头注意力机制对舆情文本的词级特征向量和法律判决文本的词级特征向量进行处理,得到舆情文本的交叉词级特征向量;
S4:对舆情文本的句级特征向量作聚类处理,得到正向舆情聚类中心和非正向舆情聚类中心;
S5:将交叉词级特征向量输入到全连接神经网络进行处理,得到舆情文本的低维特征;根据低维特征对舆情文本进行分类,得到舆情文本的分类结果;
S6:对低维特征和两个聚类中心作对比学习并计算对比学习损失;根据标签和分类结果计算全连接分类损失;根据对比学习损失函数与全连接分类损失计算模型总损失;
S7:根据总损失调整模型参数,得到训练好的文本分类模型。
2.根据权利要求1所述的一种基于大数据的法律判决舆情分类方法,其特征在于,所述步骤S2具体包括:
S21:采用预训练的Bert模型对舆情文本数据进行处理,得到舆情文本的词级特征向量和句级特征向量;
S22:查询预训练的Bert模型的vocab词表,得到法律判决文本的词级特征向量;将词级特征向量通过全连接网络获得法律判决文本的句级特征向量。
3.根据权利要求1所述的一种基于大数据的法律判决舆情分类方法,其特征在于,所述步骤S3具体包括:将舆情文本的词级特征向量分别输入到不同的线性层进行处理,得到K矩阵和V矩阵;将法律判决文本的词级特征向量输入到线性层进行处理,得到Q矩阵;根据K矩阵、V矩阵和Q矩阵得到交叉词级特征向量。
4.根据权利要求3所述的一种基于大数据的法律判决舆情分类方法,其特征在于,计算交叉词级特征向量的公式为:
其中,M表示交叉词级特征向量,dk表示多头注意力机制中每个头的维度,E表示单位矩阵,softmax()表示softmax激活函数。
5.根据权利要求1所述的一种基于大数据的法律判决舆情分类方法,其特征在于,对舆情文本的句级特征向量作聚类处理的过程包括:
S41:将法律判决文本的句级特征向量作为正向舆情聚类中心,并随机初始化与正向舆情聚类中心维度相同的非正向舆情聚类中心;
S42:计算每个舆情文本的句级特征向量与两个聚类中心的距离,将句级特征向量归类到距离最小的类别;
S43:更新非正向舆情聚类中心并返回步骤S42;直到非正向舆情聚类中心不再发生变化。
6.根据权利要求5所述的一种基于大数据的法律判决舆情分类方法,其特征在于,计算舆情文本的句级特征向量与聚类中心距离的公式为:
其中,distance表示舆情文本的句级特征向量与聚类中心的距离,hi表示句级特征向量第i个维度的值,ci表示聚类中心第i个维度的值,d表示句级特征向量的维度。
7.根据权利要求5所述的一种基于大数据的法律判决舆情分类方法,其特征在于,更新非正向舆情聚类中心的过程包括:计算所有被归类到非正向舆情的的句级特征向量的聚类中心,将该聚类中心作为新的非正向舆情聚类中心,计算新的非正向舆情聚类中心的公式为:
其中,表示新的非正向舆情聚类中心,m表示所有被归类到非正向舆情的句级特征向量个数,Hid表示所有被归类到非正向舆情的句级特征向量集合H中第i个向量在第d个维度上的值。
8.根据权利要求1所述的一种基于大数据的法律判决舆情分类方法,其特征在于,计算对比学习损失的公式为:
其中,l1表示对比学习损失,Si表示舆情文本中第i条舆情评论的低维特征向量,C1表示正向舆情聚类中心,表示非正向舆情聚类中心,sim()表示求余弦相似度,min()表示求最小值,b表示每批次的舆情评论数量,/>表示第i条舆情评论的预测结果。
9.根据权利要求1所述的一种基于大数据的法律判决舆情分类方法,其特征在于,计算全连接分类损失的公式为:
其中,l2表示全连接分类损失,yi表示第i条舆情评论的标签,表示第i条舆情评论的预测概率值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310485333.7A CN116541523A (zh) | 2023-04-28 | 2023-04-28 | 一种基于大数据的法律判决舆情分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310485333.7A CN116541523A (zh) | 2023-04-28 | 2023-04-28 | 一种基于大数据的法律判决舆情分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116541523A true CN116541523A (zh) | 2023-08-04 |
Family
ID=87449930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310485333.7A Pending CN116541523A (zh) | 2023-04-28 | 2023-04-28 | 一种基于大数据的法律判决舆情分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116541523A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407527A (zh) * | 2023-10-19 | 2024-01-16 | 重庆邮电大学 | 一种教育领域舆情大数据分类方法 |
CN117453916A (zh) * | 2023-10-26 | 2024-01-26 | 重庆邮电大学 | 一种基于大数据的微博异常用户检测方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704558A (zh) * | 2017-09-28 | 2018-02-16 | 北京车慧互动广告有限公司 | 一种用户意见抽取方法及*** |
CN110750646A (zh) * | 2019-10-16 | 2020-02-04 | 乐山师范学院 | 一种旅店评论文本的属性描述提取方法 |
CA3135387A1 (en) * | 2019-04-18 | 2020-10-22 | Microsoft Technology Licensing, Llc | Architectures for modeling comment and edit relations |
CN111858945A (zh) * | 2020-08-05 | 2020-10-30 | 上海哈蜂信息科技有限公司 | 基于深度学习的评论文本方面级情感分类方法及*** |
CN112926336A (zh) * | 2021-02-05 | 2021-06-08 | 昆明理工大学 | 基于正文评论交互式注意力的微博案件方面级观点识别方法 |
CN113282754A (zh) * | 2021-06-10 | 2021-08-20 | 北京中科闻歌科技股份有限公司 | 针对新闻事件的舆情检测方法、装置、设备和存储介质 |
US20220036011A1 (en) * | 2020-07-30 | 2022-02-03 | InfoAuthN AI Inc. | Systems and Methods for Explainable Fake News Detection |
CN114398480A (zh) * | 2021-11-26 | 2022-04-26 | 重庆邮电大学 | 基于关键信息抽取的金融舆情细分方面检测方法和设备 |
CN114548321A (zh) * | 2022-03-05 | 2022-05-27 | 昆明理工大学 | 基于对比学习的自监督舆情评论观点对象分类方法 |
CN115146629A (zh) * | 2022-05-10 | 2022-10-04 | 昆明理工大学 | 一种基于对比学习的新闻文本与评论相关性分析方法 |
CN115169449A (zh) * | 2022-06-29 | 2022-10-11 | 中山大学 | 基于对比学习与持续性学习的属性级情感分析方法、***及存储介质 |
CN115906835A (zh) * | 2022-11-23 | 2023-04-04 | 之江实验室 | 一种基于聚类和对比学习的中文问句文本表示学习的方法 |
CN115952291A (zh) * | 2023-03-14 | 2023-04-11 | 山东大学 | 基于多头自注意力及lstm的金融舆情分类方法及*** |
-
2023
- 2023-04-28 CN CN202310485333.7A patent/CN116541523A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704558A (zh) * | 2017-09-28 | 2018-02-16 | 北京车慧互动广告有限公司 | 一种用户意见抽取方法及*** |
CA3135387A1 (en) * | 2019-04-18 | 2020-10-22 | Microsoft Technology Licensing, Llc | Architectures for modeling comment and edit relations |
CN110750646A (zh) * | 2019-10-16 | 2020-02-04 | 乐山师范学院 | 一种旅店评论文本的属性描述提取方法 |
US20220036011A1 (en) * | 2020-07-30 | 2022-02-03 | InfoAuthN AI Inc. | Systems and Methods for Explainable Fake News Detection |
CN111858945A (zh) * | 2020-08-05 | 2020-10-30 | 上海哈蜂信息科技有限公司 | 基于深度学习的评论文本方面级情感分类方法及*** |
CN112926336A (zh) * | 2021-02-05 | 2021-06-08 | 昆明理工大学 | 基于正文评论交互式注意力的微博案件方面级观点识别方法 |
CN113282754A (zh) * | 2021-06-10 | 2021-08-20 | 北京中科闻歌科技股份有限公司 | 针对新闻事件的舆情检测方法、装置、设备和存储介质 |
CN114398480A (zh) * | 2021-11-26 | 2022-04-26 | 重庆邮电大学 | 基于关键信息抽取的金融舆情细分方面检测方法和设备 |
CN114548321A (zh) * | 2022-03-05 | 2022-05-27 | 昆明理工大学 | 基于对比学习的自监督舆情评论观点对象分类方法 |
CN115146629A (zh) * | 2022-05-10 | 2022-10-04 | 昆明理工大学 | 一种基于对比学习的新闻文本与评论相关性分析方法 |
CN115169449A (zh) * | 2022-06-29 | 2022-10-11 | 中山大学 | 基于对比学习与持续性学习的属性级情感分析方法、***及存储介质 |
CN115906835A (zh) * | 2022-11-23 | 2023-04-04 | 之江实验室 | 一种基于聚类和对比学习的中文问句文本表示学习的方法 |
CN115952291A (zh) * | 2023-03-14 | 2023-04-11 | 山东大学 | 基于多头自注意力及lstm的金融舆情分类方法及*** |
Non-Patent Citations (2)
Title |
---|
白健等: "基于弹幕的网络舆情文本挖掘与情感分析", 软件工程, vol. 25, no. 11 * |
魏刚等: "基于信息增强的中文舆情文本情感分析", 通信技术, vol. 55, no. 7 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407527A (zh) * | 2023-10-19 | 2024-01-16 | 重庆邮电大学 | 一种教育领域舆情大数据分类方法 |
CN117453916A (zh) * | 2023-10-26 | 2024-01-26 | 重庆邮电大学 | 一种基于大数据的微博异常用户检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110298037B (zh) | 基于增强注意力机制的卷积神经网络匹配的文本识别方法 | |
WO2023024412A1 (zh) | 基于深度学习模型的视觉问答方法及装置、介质、设备 | |
CN111209401A (zh) | 网络舆情文本信息情感极性分类处理***及方法 | |
WO2018028077A1 (zh) | 一种基于深度学习的中文语义分析的方法及装置 | |
CN116541523A (zh) | 一种基于大数据的法律判决舆情分类方法 | |
CN110188195B (zh) | 一种基于深度学习的文本意图识别方法、装置及设备 | |
CN114943230B (zh) | 一种融合常识知识的中文特定领域实体链接方法 | |
CN112905736B (zh) | 一种基于量子理论的无监督文本情感分析方法 | |
CN112434686B (zh) | 针对ocr图片的端到端含错文本分类识别仪 | |
CN115545041B (zh) | 一种增强医疗语句语义向量表示的模型构造方法及*** | |
CN111540470B (zh) | 一种基于bert迁移学习的社交网络抑郁倾向检测模型及其训练方法 | |
CN114648016A (zh) | 一种基于事件要素交互与标签语义增强的事件论元抽取方法 | |
CN113869055A (zh) | 基于深度学习的电网项目特征属性识别方法 | |
CN115238693A (zh) | 一种基于多分词和多层双向长短期记忆的中文命名实体识别方法 | |
CN111460147A (zh) | 一种基于语义增强的标题短文本分类方法 | |
CN112950414B (zh) | 一种基于解耦法律要素的法律文本表示方法 | |
CN114756678A (zh) | 一种未知意图文本的识别方法及装置 | |
CN114356990A (zh) | 基于迁移学习的基地命名实体识别***及方法 | |
CN116522165B (zh) | 一种基于孪生结构的舆情文本匹配***及方法 | |
CN112329449A (zh) | 基于情感词典和Transformer的情感分析方法 | |
CN115422362B (zh) | 一种基于人工智能的文本匹配方法 | |
CN116227486A (zh) | 一种基于检索和对比学习的情感分析方法 | |
CN114997331A (zh) | 基于度量学习的小样本关系分类方法及*** | |
CN115062615A (zh) | 一种金融领域事件抽取方法和装置 | |
CN112015921B (zh) | 一种基于学习辅助知识图谱的自然语言处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20240125 Address after: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province Applicant after: Yami Technology (Guangzhou) Co.,Ltd. Country or region after: China Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing Applicant before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS Country or region before: China |
|
TA01 | Transfer of patent application right |