CN108920448B - 一种基于长短期记忆网络的比较关系抽取的方法 - Google Patents

一种基于长短期记忆网络的比较关系抽取的方法 Download PDF

Info

Publication number
CN108920448B
CN108920448B CN201810472088.5A CN201810472088A CN108920448B CN 108920448 B CN108920448 B CN 108920448B CN 201810472088 A CN201810472088 A CN 201810472088A CN 108920448 B CN108920448 B CN 108920448B
Authority
CN
China
Prior art keywords
sentence
comparative
comparison
word
corpus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810472088.5A
Other languages
English (en)
Other versions
CN108920448A (zh
Inventor
张雷
夏丽
潘元元
李博
王崇骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201810472088.5A priority Critical patent/CN108920448B/zh
Publication of CN108920448A publication Critical patent/CN108920448A/zh
Application granted granted Critical
Publication of CN108920448B publication Critical patent/CN108920448B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Abstract

一种基于长短期记忆网络的比较句关系抽取的方法,包括语料库构建阶段、比较句句型极性分析构建阶段、特征‑情感本体库构建阶段和比较要素抽取阶段、比较关系获取阶段,其中,语料库构建阶段,爬取互联网电商平台的评论数据,并对数据进行预处理,最终形成语料库;比较句句型极性分析构建阶段,总结语料库中的比较句句型,并对各句型的极性关系展开;特征‑情感本体库构建阶段,总结语料库中的特征词、情感词,并映射到本体库;比较要素抽取阶段,利用词向量构建句子的向量矩阵表示作为网络的输入,比较关系获取阶段,综合比较句句型、特征‑情感本体库以及比较要素,最终获得比较关系。

Description

一种基于长短期记忆网络的比较关系抽取的方法
技术领域
本发明涉及自然语言处理与深度学习技术,具体涉及一种基于长短期记忆网络的比较关系抽取的方法。
背景技术
随着互联网的普及和深入发展,淘宝、京东等电商网站逐渐进入了人们的日常生活。网络使人们更乐于在这些平台上发表和交流意见,同类产品的论坛、微博等社交平台上涌现了大量的产品评论。这些评论中蕴含着许多有价值的信息,然而面对这些海量的评论信息,人力无法快速地获取所需信息,迫切需要自动化的方法来帮助人们应对信息过载带来的挑战。
面向电商平台的比较句关系抽取研究正是在这种背景下产生。比较句关系抽取的主要任务是识别出“比较主体,比较客体,比较属性,比较结果”四个要素,形成有价值且直观的信息传达给企业和消费者。这样既可以帮助生产商家认识到自己产品以及竞争产品的的优劣,用户的需求等信息,从而制定更好的生产策略用于改进下一代产品,提升自身竞争力;又可以让普通消费者能够迅速了解到其他用户的产品使用体验,以便做出合理的购买决定。
目前,主流的比较关系抽取的方法大多是基于条件随机场算法,通常需要大量人工选取合适的特征进行抽取。该方法的缺点在于,一是需要人工总结大量的特征工程,耗时耗力;二是只用到了句子的浅层语义特征,无法利用深层语义特征;三是结果杂乱无章,比较分散,无法形成直观结果。
发明内容
本发明目的是,提出一种基于长短期记忆网络的比较关系抽取的方法,克服现有基于条件随机场算法的不足,借助于词向量和长短期记忆网络,可以学习到句子的分布式向量表示,该向量包含了文本的深层语义特征,可作为比较要素抽取模型的输入。
为解决上述问题,本发明提供的技术方案是,一种基于长短期记忆网络的比较句关系抽取的方法,首先构建语料库,接着构建比较句句型极性分析和特征-情感本体库,然后基于长短期记忆网络来构建句子的分布式表示进行比较要素抽取,最后获取比较关系。
具体步骤如下:一种基于长短期记忆网络的比较句关系抽取的方法,包括语料库构建阶段,爬取互联网电商平台的评论数据,并对数据进行预处理,最终形成语料库;比较句句型极性分析构建阶段,总结语料库中的比较句句型,并对各句型的极性关系展开;特征-情感本体库构建阶段,总结语料库中的特征词、情感词,并映射到本体库;比较要素抽取阶段,利用词向量构建句子的向量矩阵表示作为网络的输入,搭建长短期记忆网络并在loss层加入CRF层得到比较要素抽取模型,对比较句中的比较主体、比较客体、比较属性进行抽取;比较关系获取阶段,综合比较句句型、特征-情感本体库以及比较要素,最终获得比较关系。
进一步的,所述的爬取互联网电商平台的评论数据,并对数据进行预处理,最终形成语料库包括如下步骤:
S11、利用爬虫技术爬取京东网站上手机版块下的评论数据,涉及品牌有3种以上;
S12、对数据进行预处理,包括如下过程:去除非观点句、按标点符号对句子分句、筛选出比较句、对比较句比较关系进行标注。
所述的比较句句型极性分析构建阶段,总结语料库中的比较句句型,并对各
句型的极性关系展开包括如下步骤:
S21、将语料库中的比较句进行句式分类:等比、差比、极比,总结各类的比较搭配;
S22、将S21中的比较搭配利用哈工大同义词词林进行拓展
S23、将S22中得到的比较搭配模式库按照句式分类进行极性展开
所述的特征-情感本体库构建阶段包括如下步骤:
S31、对于每个比较句,利用LTP平台进行句法依存关系,得到XML视图X;
S32、对于句子中的每个词语,寻找是否存在父节点与其为SBV关系的词语,若存在则提取父节点对应的词语存入情感词列表,同时提取当前词语存入特征词列表;
S33、对S32中特征词列表中的词语,借助哈工大同义词词林进行拓展,形成最终的特征词列表featlist;
S34、结合S32中情感词列表和知网情感分析用词语集中的评价类词语集,将情感词分成“一般情感词”及“特殊情感词”,形成情感词列表sentilist。其中一般情感词是指评价词本身表达的极性就是描述特征的极性;特殊情感词是指评价词在评价不同的特征属性时会表达出不同的极性;
S35、结合中关村网站及京东商城对手机的参数描述进行分析,构建手机领域的本体库,形成特征-情感本体库;
S36、将S33和S34中的特征及情感词对应归类到S35总结的手机本体库,形成特征-情感本体库。
所述的比较要素抽取阶段,利用词向量构建句子的向量矩阵表示作为网络的输入包括如下步骤:
S41、利用word2vec训练语料文件得到每个词的词向量xi
S42、则一个长度为n的句子可以表示为:
Figure GDA0003185028310000031
Figure GDA0003185028310000032
表示连接操作符,从而构成由词向量构成的句子向量矩阵n*k,k为词向量的维度。
所述的搭建长短期记忆网络并在loss层加入CRF层得到比较要素抽取模型,
对比较句中的比较主体、比较客体、比较属性进行抽取包括如下步骤:
S51、将得到的句子向量矩阵作为输入送入长短期记忆网络中;
S52、根据传统RNN的公式计算当前时刻的候选记忆单元值
Figure GDA0003185028310000033
Figure GDA0003185028310000034
其中,Wxc、Whc分别是LSTM单元当前时刻输入数据xt和上一时刻LSTM单元输出数据ht-1的权值参数,bc为偏置参数,h为激活函数;RNN为循环神经网络;
S53、计算输入门的值it
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
其中,Wxi为LSTM单元当前时刻输入数据xt的权值参数,Whi为上一时刻LSTM单元输出数据ht-1的权值参数,Wci为上一时刻候选记忆单元值ct-1的权值参数,bi为偏置参数,σ为激活函数
S54、计算遗忘门的值ft
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
其中,Wxf为LSTM单元当前时刻输入数据xt的权值参数,Whf为上一时刻LSTM单元输出数据ht-1的权值参数,Wcf为上一时刻候选记忆单元值ct-1的权值参数,bf为偏置参数,σ为激活函数,
S55、计算当前时刻记忆单元值ct
Figure GDA0003185028310000041
其中,⊙表示逐点乘积;
S56、计算输出门ot
ot=σ(Wxoxt+Whoht-1+Wcoct-1+bo)
其中,Wxo为LSTM单元当前时刻输入数据xt的权值参数,Who为上一时刻LSTM单元输出数据ht-1的权值参数,Wco为上一时刻候选记忆单元值ct-1的权值参数,bo为偏置参数,σ为激活函数,
S57、LSTM单元的输出为
ht=ot⊙CRF(ct)。
所述的比较关系获取阶段,综合比较句句型、特征-情感本体库以及比较要
素,最终获得比较关系包括如下步骤:
S61、对于语料库中的每个比较句,匹配S21-S23中的句型的极性关系;
S62、如果是等比句,则根据等比句的极性关系结合S41-42和S51-S57的比较要素确定比较关系;
S63、如果是差比句,则根据差比句的极性关系结合S41-42和S51-S57的比较要素、S31-S36的特征-情感本体库确定比较关系;
S64、如果是极比句,则根据极比句的极性关系结合S41-42和S51-S57的比较要素、S31-S36中的特征-情感本体库确定比较关系。
涉及品牌有3种以上,例如分别是小米、华为、荣耀、iPhone;
有益效果:借助于词向量和长短期记忆网络,学习到句子的分布式向量表示,该向量包含了文本的深层语义特征,可作为比较要素抽取模型的输入。克服现有技术的缺点,无需要人工总结大量的特征工程,能利用深层语义特征并形成直观结果。通过本发明方法不仅避免了人工总结特征的不足,还利用了句子的深层语义特征,更高效地对语料进行比较关系抽取。
附图说明
图1为基于长短期记忆网络的比较句关系抽取的方法的流程图;
图2为语料库构建流程图;
图3为比较句句型极性分析构建流程图;
图4为特征-情感本体库构建流程图;
图5为基于长短期记忆网络的比较要素抽取模型;
图6为比较关系获取的流程图。
具体实施方式
为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
图1为实施例中基于长短期记忆网络的比较句关系抽取的方法的流程图,如图所示,该方法主要包括五个阶段,分别是:语料库构建阶段;比较句句型极性分析构建阶段;特征-情感本体库构建阶段;基于长短期记忆网络构建比较要素抽取阶段;比较关系获取阶段。
结合图2所示,实施例中构建语料库的实施步骤如下:
步骤0为构建语料库的起始状态;
步骤1利用爬虫技术爬取京东网站上手机版块下的评论数据,涉及品牌有4种,分别是小米、华为、荣耀、iPhone。实施例中选取京东网站主要考虑该网站数据较易爬取,当然也可以选取其它电商网站。数据除选取手机版块外,当然也可以选取其它商品的数据;
步骤2将爬取数据进行筛选,去掉非观点句。非观点句是指未表达作者观点的句子;
步骤3按标点符号分句,选取的标点符号有4种:。!?,;
步骤4对步骤3中分好的句子进行筛选,得到比较句;
步骤5对步骤4中的比较句进行比较关系标注。比较关系是指比较主体、比较客体、比较属性、比较结果。比较主体和比较客体都属于比较的对象,比较属性是指比较双方的某些特征,比较结果是指比较主体和比较客体在比较属性上的比较观点倾向。如“华为Mate10的价格比小米6高”,比较主体为“华为Mate10”,比较属性为“价格”,对应观点倾向为负向情感;比较主体为“小米6”,比较属性为“价格”,对应观点倾向为正向情感;
步骤6是构建语料库的结束状态。
结合图3所示,比较句句型极性分析构建的实施步骤如下:
步骤0为构建比较句句型极性分析模型的起始状态;
步骤1为将语料库中的比较句进行句式分类:等比、差比、极比,总结各类的比较搭配。其中等比是指两个或者多个事物在某个属性上相同或者相似,评价者并没有表示出明显的偏好信息;差比是指两个或多个事物在某个属性上有差异,可以明显地看出不同事物的优劣;极比是指多个比较对象之间的极值,说明某个事物最好或者最差。比较搭配是指三种句式对应的搭配模板,例如搭配“像...一样”对应等比句式;
步骤2将步骤1中的比较搭配利用哈工大同义词词林进行拓展;
步骤3将步骤2中得到的比较搭配库按照句式分类进行极性展开。例如等比搭配“像...一样”对应极性“比较主体与比较客体极性相同,均为0”(此处用“0”表示中性情感倾向)
步骤4为构建比较句句型极性分析模型的结束状态;
结合图4所示,特征-情感本体库构建的实施步骤如下:
步骤0为特征-情感本体库构建的起始状态;
步骤1为对于每个比较句,利用LTP平台进行句法依存关系,得到XML视图X;
步骤2为对于XML视图中句子的每个词语,寻找是否存在父节点与其为SBV关系的词语,若存在则提取父节点对应的词语存入情感词列表,同时提取当前词语存入特征词列表。其中SBV关系是句法依存关系的一种,表示“主谓关系”。如“我送她一束花”中“我”和“送”属于SBV关系;
步骤3对步骤2中特征词列表中的词语,借助哈工大同义词词林进行拓展,形成最终的特征词列表;
步骤4结合步骤2中情感词列表和知网情感分析用词语集中的评价类词语集,将情感词分成“一般情感词”及“特殊情感词”,形成情感词列表。其中一般情感词是指评价词本身表达的极性就是描述特征的极性;特殊情感词是指评价词在评价不同的特征属性时会表达出不同的极性。例如“性价比高”中的“高”表示正向情感,“价格高”中的“高”表示负向情感;
步骤5结合中关村网站及京东商城对手机的参数描述进行分析,构建手机领域的本体库。其中本体是指一种模型,描述由一套对象类型、属性以及关系类型所构成的整体;
步骤6将步骤3和步骤4中的特征及情感词对应归类到步骤5总结的手机本体库,形成特征-情感本体库;
步骤7为特征-情感本体库构建的结束状态。
结合图5所示,构建基于长短期记忆网络的比较要素抽取模型主要包括训练出句子向量矩阵、参数更新操作以及softmax全连接输出类别概率、CRF预测最终类别,这也对应整个长短期记忆网络的结构,主要分为四层:输出层、隐藏层、输出层、CRF层,输入层由句子向量矩阵构成,隐藏层单元由输入门、遗忘门、输出门进行参数更新,输出层是输出类别的概率分布,CRF层是计算全局概率输出最终类别。
具体实施步骤如下:
步骤1为起始步骤;
步骤2是利用python中gensim的word2vec训练语料库文件,采用Skip-gram模型得到输入句子中每个词的词向量xi,其中word2vec是一个词向量训练的工具,它具有准确高效的特点;
步骤3是一个长度为n的句子可以表示为:
Figure GDA0003185028310000071
Figure GDA0003185028310000072
表示连接操作符,从而构成由词向量构成的句子向量矩阵n*k,k为词向量的维度;
步骤4将步骤3得到的句子向量矩阵作为输入送入长短期记忆网络中;
步骤5根据传统RNN的公式计算当前时刻的候选记忆单元值
Figure GDA0003185028310000073
Figure GDA0003185028310000074
其中,Wxc、Whc分别是LSTM单元当前时刻输入数据xt和上一时刻LSTM单元输出数据ht-1的权值参数,bc为偏置参数,h为激活函数;RNN为循环神经网络;
步骤6计算输入门的值it
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
其中,Wxi为LSTM单元当前时刻输入数据xt的权值参数,Whi为上一时刻LSTM单元输出数据ht-1的权值参数,Wci为上一时刻候选记忆单元值ct-1的权值参数,bi为偏置参数,σ为激活函数;
步骤7计算遗忘门的值ft
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
其中,Wxf为LSTM单元当前时刻输入数据xt的权值参数,Whf为上一时刻LSTM单元输出数据ht-1的权值参数,Wcf为上一时刻候选记忆单元值ct-1的权值参数,bi为偏置参数,σ为激活函数;
步骤8计算当前时刻记忆单元值ct
Figure GDA0003185028310000081
其中,⊙表示逐点乘积;
步骤9计算输出门ot
ot=σ(Wxoxt+Whoht-1+Wcoct-1+bo)
其中,其中,Wxo为LSTM单元当前时刻输入数据xt的权值参数,Who为上一时刻LSTM单元输出数据ht-1的权值参数,Wco为上一时刻候选记忆单元值ct-1的权值参数,bo为偏置参数,σ为激活函数;
步骤10LSTM单元的输出为
ht=ot⊙CRF(ct);
步骤11为构建基于长短期记忆网络的比较要素抽取模型的结束状态。
结合图6所示,比较关系获取的实施步骤如下:
步骤0为特征-情感本体库构建的起始状态;
步骤1为对于语料库中的每个比较句,匹配图3中的句型的极性关系;
步骤2如果是等比句,则根据等比句的极性关系结合图4以及图5确定比较关系;
步骤3如果是差比句,则根据差比句的极性关系结合图4以及图5确定比较关系;
步骤4如果是极比句,则根据极比句的极性关系结合图4以及图5确定比较关系;
步骤5为比较关系获取的结束状态;
综上所述,本发明就是通过一种基于长短期记忆网络的比较句关系抽取的方法,首先构建语料库,接着构建比较句句型极性分析和特征-情感本体库,然后基于长短期记忆网络来构建句子的分布式表示进行比较要素抽取,最后获取比较关系。这样做不但避免过多依赖人工总结特征,还能利用到句子的深层语义特征,并且最终呈现结果直观易懂,具有良好的实用性。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。

Claims (2)

1.一种基于长短期记忆网络的比较句关系抽取的方法,其特征在于,包括语料库构建阶段、比较句句型极性分析构建阶段、特征-情感本体库构建阶段和比较要素抽取阶段、比较关系获取阶段,其中,
语料库构建阶段,爬取互联网电商平台的评论数据,并对数据进行预处理,最终形成语料库;
比较句句型极性分析构建阶段,总结语料库中的比较句句型,并对各句型的极性关系展开;
特征-情感本体库构建阶段,总结语料库中的特征词、情感词,并映射到本体库;
比较要素抽取阶段,利用词向量构建句子的向量矩阵表示作为网络的输入,搭建长短期记忆网络并在loss层加入CRF层得到比较要素抽取模型,对比较句中的比较主体、比较客体、比较属性进行抽取;
比较关系获取阶段,综合比较句句型、特征-情感本体库以及比较要素,最终获得比较关系;
所述的爬取互联网电商平台的评论数据,并对数据进行预处理,最终形成语料库包括如下步骤:
S11、利用爬虫技术爬取京东网站上手机版块下的评论数据,涉及品牌有3种以上;
S12、对数据进行预处理,包括如下过程:去除非观点句、按标点符号对句子分句、筛选出比较句、对比较句比较关系进行标注;
所述的比较句句型极性分析构建阶段,总结语料库中的比较句句型,并对各句型的极性关系展开包括如下步骤:
S21、将语料库中的比较句进行句式分类:等比、差比、极比,总结各类的比较搭配;
S22、将S21中的比较搭配利用哈工大同义词词林进行拓展;
S23、将S22中得到的比较搭配模式库按照句式分类进行极性展开;
所述的特征-情感本体库构建阶段包括如下步骤:
S31、对于每个比较句,利用LTP平台进行句法依存关系,得到XML视图X;
S32、对于句子中的每个词语,寻找是否存在父节点与其为SBV关系的词语,若存在则提取父节点对应的词语存入情感词列表,同时提取当前词语存入特征词列表;其中SBV关系是句法依存关系的一种,表示“主谓关系”;
S33、对S32中特征词列表中的词语,借助哈工大同义词词林进行拓展,形成最终的特征词列表featlist;
S34、结合S32中情感词列表和知网情感分析用词语集中的评价类词语集,将情感词分成“一般情感词”及“特殊情感词”,形成情感词列表sentilist;其中一般情感词是指评价词本身表达的极性就是描述特征的极性;特殊情感词是指评价词在评价不同的特征属性时会表达出不同的极性;
S35、结合中关村网站及京东商城对手机的参数描述进行分析,构建手机领域的本体库,形成特征-情感本体库;
S36、将S33和S34中的特征及情感词对应归类到S35总结的手机本体库,形成特征-情感本体库;
所述的比较要素抽取阶段,利用词向量构建句子的向量矩阵表示作为网络的输入包括如下步骤:
S41、利用word2vec训练语料文件得到每个词的词向量xi
S42、一个长度为n的句子表示为:
Figure FDA0003195129970000021
Figure FDA0003195129970000022
表示连接操作符,从而构成由词向量构成的句子向量矩阵n*k,k为词向量的维度;
所述的搭建长短期记忆网络并在loss层加入CRF层得到比较要素抽取模型,
对比较句中的比较主体、比较客体、比较属性进行抽取包括如下步骤:
S51、将得到的句子向量矩阵作为输入送入长短期记忆网络中;
S52、根据传统RNN的公式计算当前时刻的候选记忆单元值
Figure FDA0003195129970000023
Figure FDA0003195129970000024
其中,Wxc、Whc分别是LSTM单元当前时刻输入数据xt和上一时刻LSTM单元输出数据ht-1的权值参数,bc为偏置参数,tanh为激活函数;RNN为循环神经网络;
S53、计算输入门的值it
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
其中,Wxi为LSTM单元当前时刻输入数据xt的权值参数,Whi为上一时刻LSTM单元输出数据ht-1的权值参数,Wci为上一时刻候选记忆单元值ct-1的权值参数,bi为偏置参数,σ为激活函数;
S54、计算遗忘门的值ft
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
其中,Wxf为LSTM单元当前时刻输入数据xt的权值参数,Whf为上一时刻LSTM单元输出数据ht-1的权值参数,Wcf为上一时刻候选记忆单元值ct-1的权值参数,bf为偏置参数,σ为激活函数,
S55、计算当前时刻记忆单元值ct
Figure FDA0003195129970000031
其中,⊙表示逐点乘积;
S56、计算输出门ot
ot=σ(Wxoxt+Whoht-1+Wcoct-1+bo)
其中,Wxo为LSTM单元当前时刻输入数据xt的权值参数,Who为上一时刻LSTM单元输出数据ht-1的权值参数,Wco为上一时刻候选记忆单元值ct-1的权值参数,bo为偏置参数,σ为激活函数,
S57、LSTM单元的输出为:
ht=ot⊙CRF(ct)。
2.根据权利要求1所述的基于长短期记忆网络的比较句关系抽取的方法,其特征在于,所述的比较关系获取阶段,综合比较句句型、特征-情感本体库以及比较要素,最终获得比较关系包括如下步骤:
S61、对于语料库中的每个比较句,匹配S21-S23中的句型的极性关系;
S62、如果是等比句,则根据等比句的极性关系结合S41-42和S51-S57的比较要素确定比较关系;
S63、如果是差比句,则根据差比句的极性关系结合S41-42和S51-S57的比较要素、S31-S36的特征-情感本体库确定比较关系;
S64、如果是极比句,则根据极比句的极性关系结合S41-42和S51-S57的比较要素、S31-S36中的特征-情感本体库确定比较关系。
CN201810472088.5A 2018-05-17 2018-05-17 一种基于长短期记忆网络的比较关系抽取的方法 Active CN108920448B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810472088.5A CN108920448B (zh) 2018-05-17 2018-05-17 一种基于长短期记忆网络的比较关系抽取的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810472088.5A CN108920448B (zh) 2018-05-17 2018-05-17 一种基于长短期记忆网络的比较关系抽取的方法

Publications (2)

Publication Number Publication Date
CN108920448A CN108920448A (zh) 2018-11-30
CN108920448B true CN108920448B (zh) 2021-09-14

Family

ID=64404232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810472088.5A Active CN108920448B (zh) 2018-05-17 2018-05-17 一种基于长短期记忆网络的比较关系抽取的方法

Country Status (1)

Country Link
CN (1) CN108920448B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027767B (zh) * 2019-12-09 2023-04-07 中国民航大学 一种基于Skip-LSTM网络的机场群延误预测方法
CN112434161B (zh) * 2020-11-24 2023-01-03 哈尔滨工程大学 一种采用双向长短期记忆网络的方面级情感分析方法
CN113420122B (zh) * 2021-06-24 2024-06-04 平安科技(深圳)有限公司 分析文本的方法、装置、设备及存储介质
CN116089225B (zh) * 2023-04-12 2023-07-07 浙江大学 一种基于BiLSTM的公共数据采集动态感知***及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021115A (zh) * 2014-06-13 2014-09-03 北京理工大学 基于神经网络的中文比较句识别方法及装置
CN104199972A (zh) * 2013-09-22 2014-12-10 中科嘉速(北京)并行软件有限公司 一种基于深度学习的命名实体关系抽取与构建方法
CN104731923A (zh) * 2015-03-26 2015-06-24 无锡中科泛在信息技术研发中心有限公司 互联网商品评论挖掘本体词库的构建方法
CN106569998A (zh) * 2016-10-27 2017-04-19 浙江大学 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法
CN106886516A (zh) * 2017-02-27 2017-06-23 竹间智能科技(上海)有限公司 自动识别语句关系和实体的方法及装置
CN107133214A (zh) * 2017-05-05 2017-09-05 中国计量大学 一种基于评论信息的产品需求偏好特征挖掘及其质量评估方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8731995B2 (en) * 2008-05-12 2014-05-20 Microsoft Corporation Ranking products by mining comparison sentiment
US20160189037A1 (en) * 2014-12-24 2016-06-30 Intel Corporation Hybrid technique for sentiment analysis
CN107688821B (zh) * 2017-07-11 2021-08-06 西安电子科技大学 基于视觉显著性与语义属性跨模态图像自然语言描述方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199972A (zh) * 2013-09-22 2014-12-10 中科嘉速(北京)并行软件有限公司 一种基于深度学习的命名实体关系抽取与构建方法
CN104021115A (zh) * 2014-06-13 2014-09-03 北京理工大学 基于神经网络的中文比较句识别方法及装置
CN104731923A (zh) * 2015-03-26 2015-06-24 无锡中科泛在信息技术研发中心有限公司 互联网商品评论挖掘本体词库的构建方法
CN106569998A (zh) * 2016-10-27 2017-04-19 浙江大学 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法
CN106886516A (zh) * 2017-02-27 2017-06-23 竹间智能科技(上海)有限公司 自动识别语句关系和实体的方法及装置
CN107133214A (zh) * 2017-05-05 2017-09-05 中国计量大学 一种基于评论信息的产品需求偏好特征挖掘及其质量评估方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Neural Architectures for Named Entity Recognition;Guillaume Lample等;《https://arxiv.org/pdf/1603.01360.pdf》;20160707;1-11 *
基于LSTM的比较句识别及关系抽取研究;夏丽;《中国优秀硕士学位论文全文数据库 信息科技辑》;20210115;I138-2300 *
面向产品评价的观点挖掘方法研究;王贺;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150315;I138-2847 *

Also Published As

Publication number Publication date
CN108920448A (zh) 2018-11-30

Similar Documents

Publication Publication Date Title
Hasan et al. Sentiment analysis with NLP on Twitter data
CN108920448B (zh) 一种基于长短期记忆网络的比较关系抽取的方法
CN108491377B (zh) 一种基于多维度信息融合的电商产品综合评分方法
TWI612488B (zh) 用於預測商品的市場需求的計算機裝置與方法
Zheng et al. Capturing the essence of word-of-mouth for social commerce: Assessing the quality of online e-commerce reviews by a semi-supervised approach
CN109376222B (zh) 问答匹配度计算方法、问答自动匹配方法及装置
CN111914096A (zh) 基于舆情知识图谱的公共交通乘客满意度评价方法及***
CN112100344A (zh) 一种基于知识图谱的金融领域知识问答方法
CN110502626B (zh) 一种基于卷积神经网络的方面级情感分析方法
CN104933081A (zh) 一种搜索建议提供方法及装置
Paliwal et al. Sentiment analysis and prediction using neural networks
Malik et al. EPR-ML: E-Commerce Product Recommendation Using NLP and Machine Learning Algorithm
Khan et al. Comparative analysis on Facebook post interaction using DNN, ELM and LSTM
Xu et al. [Retracted] Research on the Construction of Crossborder e‐Commerce Logistics Service System Based on Machine Learning Algorithms
CN116821372A (zh) 基于知识图谱的数据处理方法、装置、电子设备及介质
Chung et al. A domain adaptation approach for resume classification using graph attention networks and natural language processing
Wei et al. Online education recommendation model based on user behavior data analysis
CN113761910A (zh) 一种融合情感特征的评论文本细粒度情感分析方法
Anuradha et al. Fuzzy based summarization of product reviews for better analysis
Kafi et al. Feature-based mobile phone rating using sentiment analysis and machine learning approaches
Sandhu et al. Managing E-Reviews: A Performance Enhancement Technique Using Deep Learning
CN114547321A (zh) 一种基于知识图谱的答案生成方法、装置及电子设备
Kanakamedala et al. Sentiment analysis of online customer reviews for handicraft product using machine learning: A case of Flipkart
Gupta et al. Food Review Analysis and Sentiment Prediction using Machine Learning Models
Keshavarz et al. SOMA: Semantic orientation inference using memetic algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant