CN105740238A - 一种融合句义信息的事件关系强度图构建方法 - Google Patents

一种融合句义信息的事件关系强度图构建方法 Download PDF

Info

Publication number
CN105740238A
CN105740238A CN201610124157.4A CN201610124157A CN105740238A CN 105740238 A CN105740238 A CN 105740238A CN 201610124157 A CN201610124157 A CN 201610124157A CN 105740238 A CN105740238 A CN 105740238A
Authority
CN
China
Prior art keywords
event
word
information
topic
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610124157.4A
Other languages
English (en)
Other versions
CN105740238B (zh
Inventor
罗森林
吴舟婷
潘丽敏
陈倩柔
邹丽丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201610124157.4A priority Critical patent/CN105740238B/zh
Publication of CN105740238A publication Critical patent/CN105740238A/zh
Application granted granted Critical
Publication of CN105740238B publication Critical patent/CN105740238B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种融合句义信息的事件关系强度图构建方法。首先基于汉语句义结构理论,提取句子语义信息,扩充事件的特征维度,并利用改进的TF?IDF方法完成事件向量表达,再结合上下文信息和核心事件信息优化事件向量,最后利用LDA方法获取事件之间关系强度,设定合适的关系强度阈值,构建事件关系强度图。本发明通过融合句义信息,提供了一种将孤立分散的事件以一种可度量形式关联起来的方法,并通过事件关系强度图直观展示事件间的关系,准确的定位核心事件,有力支撑后续基于事件关系的自动文摘、舆情预测等自然语言处理应用。

Description

一种融合句义信息的事件关系强度图构建方法
技术领域
本发明涉及一种融合句义信息的事件关系强度图构建方法,属于计算机科学及自然语言处理的信息抽取领域。
背景技术
事件是指在某个特定时间和地点发生的,由一个或多个角色参与的,由一个或多个动作组成的一件事情。随着移动互联网技术的迅速发展,事件发生后,尤其是突发事件,会快速涌现出大量与之相关的新闻报道、微博评论以及博客等文本。由于事件固有的时间、地点、人物、起因、经过、结果等属性,其发生往往不是孤立的,而是会与其它事件存在不同程度的相互关系,通常用关系强度来度量。为了从大量的文本中,快速准确地定位相互关联的事件,需要基于事件间的关系强度构建事件关系强度图,从而为自动文摘、舆情预测等自然语言应用提供有效支撑。
目前,针对事件关系识别的研究主要有模式匹配法、元素和位置分析法以及规则推理法。
模式匹配法是事件关系检测的主要方法之一,主要是借助事件特征项指导模式的建立。触发词是事件的核心,直接表明事件的发生,是决定事件类别的最主要特征。根据事件触发词之间的关系,人工定义模板,抽取文本中符合模板的事件关系。事件关系检测的模式匹配方法,往往通过对事件触发词间的关系进行研究,借助触发词间的关系,制定相应的模式,辅助事件间关系的识别。
元素和位置分析法,事件元素是事件的重要组成部分,事件元素给出了事件的参与者,时间、地点等信息。每个事件包含特定的事件元素信息,且相关事件之间往往共享某一个或者某几个事件元素。事件位置能表明事件发生的上下文环境,相关的事件在文本也以较大的概率先后出现。因此位置和事件元素在事件关系的识别中扮演着重要的角色。基于位置和元素的事件关系检测方法,即是将事件位置和元素信息作为重要线索识别事件之间关系的方法。
规则推理法主要是基于Allen的“区间代数”算法构建推理规则,如“if-then”这类规则,实现事件关系自动推理;或是对规则进行扩展,训练有效的分类器,对事件关系进行分类。如Mani和Tatu的事件时序关系识别***。
现有方法可总结为如下两个方面:①不给出具体的关系类型,围绕事件关系检测任务对事件之间逻辑关系进行有无的判断。但是,这类方法仅对事件浅层逻辑关系进行识别,不能深入到事件内部的语义联系,如关系类型或联系紧密度,离实际应用还有一定的差距。②从分类关系中的某一特定类型关系出发,主要以因果关系和时序关系为主。但是,这类方法存在如下问题:首先,仅对某一特定类型的事件关系进行研究,不具有普适性和全面性。其次,在事件关系定义方面,这些方法仅对事件关系进行了初步的定义和类别划分,但尚未形成事件关系的统一定义。同时,也没有比较完整的事件关系标注语料做支撑,这使得该类方法在全面识别事件关系中面临较大的困难。
因此,现有的基于类型识别的事件关系强度计算方法效果并不理想,构建的事件强度关系图难以应用推广。
发明内容
本发明为解决关系类型识别效果差、事件关系强度图准确性不高的问题,提出一种融合句义信息的事件关系强度图构建方法。利用汉语语义学的句义结构理论挖掘事件之间的内在语义关系,扩充事件特征维度,建立事件向量模型,直接利用向量计算衡量事件间关联关系的强弱,进而构建事件关系强度图,实现事件关联关系的可视化。
本发明的设计原理为:1.基于汉语句义结构理论,提取句子语义信息,扩充事件的特征维度;2.利用改进的TF-IDF方法完成事件向量表达;3.结合上下文信息和核心事件信息完成事件向量的优化;4.利用LDA方法获取事件之间关系强度;5.设定合适的关系强度阈值,得到事件对集合,构建事件关系强度图。
所述基于汉语句义结构理论,提取句义语义信息,扩充事件的特征维度是指通过分析事件所在文本,利用汉语句义结构模型提取句子的话题、述题、一般项和基本项。其中,话题和述题是对句义的划分,利用话题成分可以获取句义的被描述对象,述题成分可以获取句义对话题的描述内容。其中,一般项和基本项是对词语的标注,利用一般项获取句义中的修饰成分,利用基本项可以获取句子的核心语义。利用话题、述题、一般项和基本项扩充事件特征空间可以获取更多语义信息。
所述改进的词频-逆文档频率tf-idf方法其特征在于用该词语在所有文本中出现的次数总和与所有文本中总的词语个数的比值作为该词语的TF值时,解决事件等短文本向量表达中存在的稀疏问题。
所述利用核心事件信息完成事件向量的优化其特征在于通过引入触发词的标题信息Istit、位置信息Loc、出现频率信息Freq、标记词语信息Mark、词语词性信息Pos、话题Topic,述题Comment,一般项Comment Arg和基本项BasicArg对事件触发词进行打分。选取得分值最高的触发词作为核心触发词,并用打分权值替代原触发词权值,完成核心事件向量的优化。
所述设定合适的关系强度阈值其特征在于保留关系强度值大于阈值0.2的事件对,并用有效的线段进行连接,从而得到事件关系图。
本发明的技术方案是通过如下步骤实现的:
步骤1:基于汉语句义结构理论,提取句子语义信息,扩充事件的特征维度;所述句义信息是指汉语句义结构模型中提取的句义成分,包括谓词,话题、述题、基本项和一般项;其中,话题是句义的被描述对象,述题是句义对话题的描述内容,基本项是句子的核心语义信息,一般项是句义中的修饰成分;
步骤1.1,依据句义结构模型的语义将事件集合对应的文本进行分词、词性标注等处理,获取事件集合以及其对应的词语序列;根据词性去除词语序列中噪声词语,包括形容词和副词,得到特征词;
步骤1.2,基于汉语句义结构理论,提取事件所在文本的谓词、话题、述题、基本项和一般项作为句义特征,结合事件自身的触发词和事件元素,得到事件特征空间;
步骤2:在步骤1得到事件特征空间的基础上,利用改进的TF-IDF方法完成事件向量表达;所述改进的TF-IDF方法,依据词语语义信息,其TF值计算方法为词语在所有文本中出现的次数总和与所有文本中总的词语个数的比值,其IDF值计算方法为文本总数与词语出现的文本总数的比值;其中,词语TF值计算公式为:
Ntf(wi)=No/NV (1)
Ntf(wi)表示词语wi的TF值,No表示该词语在所有文本中出现的次数总和,NV表示所有文本中总的词语个数。词语IDF值的计算公式为:
Nidf(wi)=Nm/Nm,o (2)
Nidf(wi)表示词语wi的IDF值,Nm表示文本的总数,若wi作为句义结构模型的基本项出现,则Nm,o表示词语wi作为基本项出现的文本个数,若wi作为句义结构模型的一般项出现,则Nm,o表示词语wi作为一般项出现的文本个数。词语wi最终TF-IDF值Ntfidf(wi)计算公式为:
Ntfidf(wi)=Ntf*Nidf (3)
步骤3,在步骤2得到事件向量表达的基础上,结合核心事件信息和上下文信息来优化事件向量;
步骤3.1,利用核心事件信息核心事件向量的优化,引入触发词的标题信息Istit、位置信息Loc、出现频率信息Freq、标记词语信息Mark、词语词性信息Pos、话题Topic,述题Comment,一般项Comment Arg和基本项Basic Arg对事件触发词进行打分,选取得分值最高的触发词作为核心触发词,其对应的事件向量即为核心事件向量,具体打分公式如式(4)所示:
Trig _ Score = 0.2 × Istit + 0.1 × Loc + 0.1 × Freq + 0.1 × Mstk + 0.1 × Pos + 0.1 × Topic + 0.1 × Comment + 0.1 × Comment Arg + 0.1 × Basic Arg - - - ( 4 )
用打分权值替代原触发词权值,完成核心事件向量的优化;
步骤3.2,利用上下文信息优化事件向量,所述利用上下文信息优化事件向量是指若两个事件出现同一句,取后面事件触发词的权值去填充位于前面的事件向量对应的位置,完成事件向量优化;
步骤4,在步骤3完成事件向量优化的基础上,利用LDA方法获取事件之间关系强度;
步骤4.1,获取词语的主题表示结果,其具体方法为:采用LDA模型对得到词语-事件矩阵进行分析,得到词语的主题表示结果,此时主题个数k取N/2,N为文本中事件个数;
步骤4.2,计算事件之间的关系强度,其具体方法为:将事件看成是由主题构成的向量,计算两两事件之间的余弦夹角值,作为事件对的关系强度;计算公式为:
S i m ( d i , d y ) = d → i * d → j | d → i | * | d → j | = Σ k = 1 m w k i * w k j Σ k = 1 m w k i * Σ k = 1 m w k j - - - ( 5 )
步骤5,在步骤4得到两两事件关系的基础上,选取合适的关系强度阈值,构建事件关系强度图,所述合适的关系强度阈值设定为0.2。
有益效果
本发明通过融合句义信息,提供了一种事件关系强度图构建方法,可以将这些孤立分散的事件以一种可度量的形式关联起来,避免传统事件关系识别效果较差的问题,并通过事件关系强度图直观展示事件间的关联关系,准确的定位核心事件,有力支撑后续基于事件关系的自动文摘、舆情预测等自然语言处理应用。
附图说明
图1为本发明的事件关系强度图构建方法流程图;
图2为本发明实施例对应的事件关系强度图。
具体实施方式
实验采用的数据来自上海大学计算机实验室中文事件语料(CEC),选择该语料中火灾类突发公共事件新闻报道。选取的文本中共包含了4个段落、9个句子。
步骤1,基于汉语句义结构理论,提取句子语义信息(包括谓词,话题、述题、基本项和一般项),扩充事件的特征维度;
步骤1.1,依据句义结构模型的语义将事件集合对应的文本进行分词、词性标注等处理,获取事件集合以及其对应的词语序列;根据词性去除词语序列中噪声词语,包括形容词和副词,得到特征词;
步骤1.2,基于汉语句义结构理论,提取事件所在文本的谓词、话题、述题、基本项和一般项作为句义特征,结合事件自身的触发词和事件元素,得到事件特征空间;
步骤2,在步骤1得到事件特征空间的基础上,利用改进的TF-IDF方法完成事件向量表达;其中,词语TF值计算公式为:
Ntf(wi)=No/NV (1)
Ntf(wi)表示词语wi的TF值,No表示该词语在所有文本中出现的次数总和,NV表示所有文本中总的词语个数。词语IDF值的计算公式为:
Nidf(wi)=Nm/Nm,o (2)
Nidf(wi)表示词语wi的IDF值,Nm表示文本的总数,若wi作为句义结构模型的基本项出现,则Nm,o表示词语wi作为基本项出现的文本个数,若wi作为句义结构模型的一般项出现,则Nm,o表示词语wi作为一般项出现的文本个数;词语wi最终TF-IDF值Ntfidf(wi)计算公式为:
Ntfidf(wi)=Ntf*Nidf (3)
步骤3,在步骤2得到事件向量表达的基础上,结合核心事件信息和上下文信息来优化事件向量;
步骤3.1,利用核心事件信息核心事件向量的优化,引入触发词的标题信息Istit、位置信息Loc、出现频率信息Freq、标记词语信息Mark、词语词性信息Pos、话题Topic,述题Comment,一般项Comment Arg和基本项Basic Arg对事件触发词进行打分,选取得分值最高的触发词作为核心触发词,其对应的事件向量即为核心事件向量,具体打分公式如式(4)所示:
Trig _ Score = 0.2 × Istit + 0.1 × Loc + 0.1 × Freq + 0.1 × Mstk + 0.1 × Pos + 0.1 × Topic + 0.1 × Comment + 0.1 × Comment Arg + 0.1 × Basic Arg - - - ( 4 )
用打分权值替代核心事件向量中担任核心触发词的权值,完成核心事件向量的优化。
步骤3.2,利用上下文信息优化事件向量。所述利用上下文信息优化事件向量是指若两个事件出现同一句,取后面事件触发词的权值去填充位于前面的事件向量对应的位置,完成事件向量优化;
步骤4,在步骤3完成事件向量优化的基础上,利用LDA方法获取事件之间关系强度;
步骤4.1,采用LDA模型对得到的事件-词语矩阵进行分析,得到词语的主题表示结果,此时主题个数k取N/2,N为文本中事件个数;
步骤4.2,采用向量余弦夹角计算两个事件之间的关系强度;计算公式为:
S i m ( d i , d y ) = d → i * d → j | d → i | * | d → j | = Σ k = 1 m w k i * w k j Σ k = 1 m w k i * Σ k = 1 m w k j - - - ( 5 )
步骤5,构建事件关系强度图。保留关系强度值大于阈值0.2的事件对,最终得到16个节点,51对满足条件的事件对,使用社会网络画图工具NetDraw软件将这些事件对以图的形式展现出来,如图2所示。

Claims (3)

1.一种融合句义信息的事件关系强度图构建方法,所述方法包括如下步骤:
步骤1:基于汉语句义结构理论,提取句子语义信息,扩充事件的特征维度;所述句义信息是指汉语句义结构模型中提取的句义成分,包括谓词,话题、述题、基本项和一般项;其中,话题是句义的被描述对象,述题是句义对话题的描述内容,基本项是句子的核心语义信息,一般项是句义中的修饰成分;
步骤1.1,依据句义结构模型的语义将事件集合对应的文本进行分词、词性标注等处理,获取事件集合以及其对应的词语序列;根据词性去除词语序列中噪声词语,包括形容词和副词,得到特征词;
步骤1.2,基于汉语句义结构理论,提取事件所在文本的谓词、话题、述题、基本项和一般项作为句义特征,结合事件自身的触发词和事件元素,得到事件特征空间;
步骤2:在步骤1得到事件特征空间的基础上,利用改进的TF-IDF方法完成事件向量表达;所述改进的TF-IDF方法,依据词语语义信息,其TF值计算方法为词语在所有文本中出现的次数总和与所有文本中总的词语个数的比值,其IDF值计算方法为文本总数与词语出现的文本总数的比值;
步骤3:在步骤2得到事件向量表达的基础上,结合核心事件信息和上下文信息来优化事件向量;
步骤3.1,利用核心事件信息优化核心事件向量,所述核心事件向量是指通过引入触发词所在文本的标题信息Istit、位置信息Loc、出现频率信息Freq、标记词语信息Mark、词语词性信息Pos、话题Topic,述题Comment,一般项Comment Arg和基本项Basic Arg对触发词进行打分,选取得分值最高的触发词作为核心触发词,其对应的事件向量即为核心事件向量;所述核心事件向量优化是指用打分权值替代原触发词权值,完成核心事件向量的优化;
步骤3.2,利用上下文信息优化事件向量,所述利用上下文信息优化事件向量是指若两个事件出现同一句,取后面事件触发词的权值去填充位于前面的事件向量对应的位置,完成事件向量优化;
步骤4:在步骤3完成事件向量优化的基础上,利用LDA方法获取事件之间关系强度;
步骤4.1,获取词语的主题表示结果,其具体方法为:采用LDA模型对得到的事件-词语矩阵进行分析,得到词语的主题表示结果,此时主题个数k取N/2,N为文本中事件个数;
步骤4.2,计算事件之间的关系强度,其具体方法为:将事件看成是由主题构成的向量,计算两两事件之间的余弦夹角值,作为事件对的关系强度;
步骤5:在步骤4得到两两事件关系的基础上,选取合适的关系强度阈值,构建事件关系强度图,所述合适的关系强度阈值设定为0.2。
2.根据权利要求1所述的一种融合句义信息的事件关系强度图构建方法,其特征在于:步骤2中,词语TF值计算公式为:
Ntf(wi)=No/NV (1)
Ntf(wi)表示词语wi的TF值,No表示该词语在所有文本中出现的次数总和,NV表示所有文本中总的词语个数。词语IDF值的计算公式为:
Nidf(wi)=Nm/Nm,o (2)
Nidf(wi)表示词语wi的IDF值,Nm表示文本的总数,若wi作为句义结构模型的基本项出现,则Nm,o表示词语wi作为基本项出现的文本个数,若wi作为句义结构模型的一般项出现,则Nm,o表示词语wi作为一般项出现的文本个数;词语wi最终TF-IDF值Ntfidf(wi)计算公式为:
Ntfidf(wi)=Ntf*Nidf (3)。
3.根据权利要求1所述的一种融合句义信息的事件关系强度图构建方法,其特征在于:步骤3.1中引入触发词的标题信息Istit、位置信息Loc、出现频率信息Freq、标记词语信息Mark、词语词性信息Pos、话题Topic,述题Comment,一般项Comment Arg和基本项Basic Arg对事件触发词打分,具体公式如式(4)所示。
选取得分值最高的触发词作为核心触发词,其对应的事件向量即为核心事件向量,用该打分权值替代原权值,完成核心事件向量的优化。
CN201610124157.4A 2016-03-04 2016-03-04 一种融合句义信息的事件关系强度图构建方法 Expired - Fee Related CN105740238B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610124157.4A CN105740238B (zh) 2016-03-04 2016-03-04 一种融合句义信息的事件关系强度图构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610124157.4A CN105740238B (zh) 2016-03-04 2016-03-04 一种融合句义信息的事件关系强度图构建方法

Publications (2)

Publication Number Publication Date
CN105740238A true CN105740238A (zh) 2016-07-06
CN105740238B CN105740238B (zh) 2019-02-01

Family

ID=56249811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610124157.4A Expired - Fee Related CN105740238B (zh) 2016-03-04 2016-03-04 一种融合句义信息的事件关系强度图构建方法

Country Status (1)

Country Link
CN (1) CN105740238B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543185A (zh) * 2018-11-22 2019-03-29 联想(北京)有限公司 语句主题获取方法和装置
CN110705255A (zh) * 2019-10-12 2020-01-17 京东数字科技控股有限公司 检测语句之间的关联关系的方法和装置
CN115422948A (zh) * 2022-11-04 2022-12-02 文灵科技(北京)有限公司 一种基于语义分析的事件层次网络识别***及方法
CN117435697A (zh) * 2023-12-21 2024-01-23 中科雨辰科技有限公司 一种获取核心事件的数据处理***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176963A (zh) * 2013-03-08 2013-06-26 北京理工大学 基于crf++汉语句义结构模型自动标注方法
CN103177089A (zh) * 2013-03-08 2013-06-26 北京理工大学 基于中心块的句义成分关系分层识别方法
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法
US20150347575A1 (en) * 2012-10-30 2015-12-03 International Business Machines Corporation Category-based lemmatizing of a phrase in a document

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150347575A1 (en) * 2012-10-30 2015-12-03 International Business Machines Corporation Category-based lemmatizing of a phrase in a document
CN103176963A (zh) * 2013-03-08 2013-06-26 北京理工大学 基于crf++汉语句义结构模型自动标注方法
CN103177089A (zh) * 2013-03-08 2013-06-26 北京理工大学 基于中心块的句义成分关系分层识别方法
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LONG TIAN 等: "Automatic Event Trigger Word Extraction in Chinese Event", 《JOURNAL OF SOFTWARE ENGINEERING AND APPLICATIONS》 *
林萌 等: "融合句义结构模型的微博话题摘要算法", 《浙江大学学报》 *
邹丽丽: "融合句义特征的事件关系强度计算方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543185A (zh) * 2018-11-22 2019-03-29 联想(北京)有限公司 语句主题获取方法和装置
CN109543185B (zh) * 2018-11-22 2021-11-16 联想(北京)有限公司 语句主题获取方法和装置
CN110705255A (zh) * 2019-10-12 2020-01-17 京东数字科技控股有限公司 检测语句之间的关联关系的方法和装置
CN115422948A (zh) * 2022-11-04 2022-12-02 文灵科技(北京)有限公司 一种基于语义分析的事件层次网络识别***及方法
CN117435697A (zh) * 2023-12-21 2024-01-23 中科雨辰科技有限公司 一种获取核心事件的数据处理***
CN117435697B (zh) * 2023-12-21 2024-03-22 中科雨辰科技有限公司 一种获取核心事件的数据处理***

Also Published As

Publication number Publication date
CN105740238B (zh) 2019-02-01

Similar Documents

Publication Publication Date Title
Murdoch et al. Beyond word importance: Contextual decomposition to extract interactions from lstms
Lytos et al. The evolution of argumentation mining: From models to social media and emerging tools
Maynard et al. Challenges in developing opinion mining tools for social media
Weichselbraun et al. Enriching semantic knowledge bases for opinion mining in big data applications
Luiz et al. A feature-oriented sentiment rating for mobile app reviews
Kheiri et al. Sentimentgpt: Exploiting gpt for advanced sentiment analysis and its departure from current machine learning
Godsay The process of sentiment analysis: a study
Bourequat et al. Sentiment analysis approach for analyzing iPhone release using support vector machine
Pilehvar et al. Card-660: Cambridge rare word dataset-a reliable benchmark for infrequent word representation models
CN104063399B (zh) 一种自动识别文本所承载的情感概率的方法及***
CN105183717A (zh) 一种基于随机森林和用户关系的osn用户情感分析方法
CN105740238A (zh) 一种融合句义信息的事件关系强度图构建方法
CN105512347A (zh) 一种基于地理主题模型的信息处理方法
Van Hee et al. Monday mornings are my fave:)# not exploring the automatic recognition of irony in english tweets
Bosco et al. Detecting happiness in Italian tweets: Towards an evaluation dataset for sentiment analysis in Felicitta
CN115017303A (zh) 基于新闻文本进行企业风险评估的方法、计算设备和介质
Kathuria et al. Real time sentiment analysis on twitter data using deep learning (Keras)
CN114519356A (zh) 目标词语的检测方法、装置、电子设备及存储介质
Shekhawat Sentiment classification of current public opinion on BREXIT: Naïve Bayes classifier model vs Python’s TextBlob approach
Altszyler et al. Using contextual information for automatic triage of posts in a peer-support forum
Caicedo et al. Bootstrapping semi-supervised annotation method for potential suicidal messages
Li et al. Application of public emotion feature extraction algorithm based on social media communication in public opinion analysis of natural disasters
CN117473078A (zh) 一种基于跨领域命名实体识别的长篇文学可视阅读***
Shabaz et al. AS: a novel sentimental analysis approach
Ahmad et al. Sentiment Analysis of Code-Mixed Social Media Text (SA-CMSMT) in Indian-Languages

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190201