CN110008467A - 一种基于迁移学习的缅甸语依存句法分析方法 - Google Patents

一种基于迁移学习的缅甸语依存句法分析方法 Download PDF

Info

Publication number
CN110008467A
CN110008467A CN201910158572.5A CN201910158572A CN110008467A CN 110008467 A CN110008467 A CN 110008467A CN 201910158572 A CN201910158572 A CN 201910158572A CN 110008467 A CN110008467 A CN 110008467A
Authority
CN
China
Prior art keywords
burmese
corpus
syntactic analysis
english
interdependent syntactic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910158572.5A
Other languages
English (en)
Inventor
毛存礼
马文举
余正涛
高盛详
王振晗
林颂凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201910158572.5A priority Critical patent/CN110008467A/zh
Publication of CN110008467A publication Critical patent/CN110008467A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种基于迁移学习的缅甸语依存句法分析方法,属于自然语言处理领域。首先利用资源丰富语言英语依存句法分析语料训练英语的依存句法分析模型,其次在训练的英语依存句法分析模型的基础上利用迁移学习的思想共享网络参数到低资源的缅甸语依存句法分析语料上,最后加入缅甸语低质量依存句法分析语料来对模型调优获取缅甸语依存句法分析模型。本方法能有效提升低资源语言依存句法分析的性能。

Description

一种基于迁移学习的缅甸语依存句法分析方法
技术领域
本发明涉及一种基于迁移学习的缅甸语依存句法分析方法,属于自然语言处理领域。
背景技术
句法分析旨在将句子从词语的序列形式按照某种语法体系转化为图结构(通常为树结构),以刻画句子内部的句法关系(主谓宾等),是自然语言处理的核心问题之一。有效支撑了信息抽取、情感分析、机器翻译等多个研究任务。
目前主流依存句法分析方法分为基于图(Graph-based)和基于转移(Transitionbased)两类:基于图的方法将依存句法分析看成从完全有向图中寻找最大生成树的问题,图中的边表示两个词之间存在某种句法关系的可能性;基于转移的方法通过一系列移进、规约等转移动作构建一棵依存句法树,学习的目标是寻找最优动作序列。与基于图的方法相比,基于转移的方法算法复杂度更低,因此具有更高的分析效率,同时由于能采用更丰富的特征,其分析准确率也与基于图的方法相当。
传统的方法通过抽取一系列人工定义的特征来表示状态,即分类的依据,如栈顶的词、词性,缓存中的第一个词、词性,已生成部分依存树的最左或最右词,这些又被称为核心特征。为了提高分类的精度,还需要人工定义各种组合特征。如Zhang and Nivre(2011)曾给出了一套准优化的特征及特征组合模板,共有20种核心特征,72种组合特征。
斯坦福大学的Chen and Manning(2014)最早将深度学习技术成功应用于依存句法分析。深度学习中的非线性激活函数还可以隐含的达到传统方法中特征组合的效果,从而避免了繁琐的组合特征设计,最终取得了与传统方法相当的准确率。与此同时,该方法由于不需要显示地进行特征组合这一极其耗时的操作,附以预计算等深度学习计算技术,最终还极大加快了依存句法分析的速度。
这些方法都是有监督的方法,都需要标注高质量的语料,但缅甸语属于低资源语言,没有可用的标注数据,人工标注成本太高;针对低资源语言的现有一些做法是利用双语映射的方法构造低资源的依存树库,但这样的方法得到的依存树库存在很大的噪声(句法存在差异,词存在无法匹配等);针对低资源自然语言处理,迁移学习取得较好的成效;因此我们提出基于迁移学习的缅甸语依存句法分析方法,利用丰富的英语资源来训练基准的模型,并在此模型的基础上,添加一些低质量缅甸语依存句法分析的语料来训练缅甸语依存句法分析模型。
发明内容
本发明提供了一种基于迁移学习的缅甸语依存句法分析方法,用于提升低资源低质量的缅语依存句法分析的模型的训练效果。
本发明的技术方案是:首先利用英语-缅甸语映射的思路获取缅甸语的依存句法分析语料,将缅甸语语料和英语语料映射到同一语义空间;其次利用双语的词向量来训练英语的依存句法分析模型,并利用迁移学习的思想,加入缅甸语的依存句法分析语料,调节模型的参数得到缅甸依存句法分析的模型。
具体步骤如下:
Step1、利用英语-缅甸语的双语平行语料构建缅甸语依存句法分析语料;
Step1.1、分别对双语平行语料库中的英语语料和缅甸语料进行分词;
Step1.2、建立英语-缅甸语的词对应关系;
Step1.3、利用斯坦福神经网络训练模型对英语语料做依存句法分析得到英语依存句法分析语料;
Step1.4、利用步骤Step1.2中的词对应关系,将英语语料的依存句法分析映射到缅语语料上的到缅甸语依存句法分析语料;
Step2、将缅甸语语料和英语语料映射到同一语义空间;寻找一个线性变换矩阵W实现arg min∑i||XiW-Zi||2,其中Xi和Zi分别表示第i个条目嵌入的缅甸语语料和英语语料的词,借助线性变换矩阵W实现将缅甸语语料和英语语料映射到同一的语义空间,然后使用获取的同一语义空间的词向量作为依存句法分析模型的输入;
Step2.1、利用正交性约束映射矩阵
Mikolov等人在最小化空间距离的过程中,矩阵W会为了拟合数据,去过分拟合其中一部分数据,为了使矩阵W能够学习全局的信息,而不是为了其中一部分,失去其他特征。所需要单语不变性来保留映射后的点积,避免映射后缅语词向量质量下降。在映射中增加正则项其中要求W为正交矩阵,即为(WTW=I)。正交性强化了W矩阵的全局性,因此可以更好的学习双语映射,约束W为正交矩阵,可以有效的约束W的学习,使W学习整个信息,而不是其中的一次对比。
Step2.2、最大余弦的长度归一化
双语词向量映射是将上述的英缅双语的词向量,不能保证向量的每一个维度的大小,当有一个维度特别大或特别小时,在计算的过程中会有异常,该问题的出现是因为没有以同等程度来计算一个向量的各个维度,需要将维度统一到同一个区间中。将两种语言的词嵌入规范化为单位向量可以保证所有训练实例对优化目标的贡献相同。只要W是正交的,这相当于最大化字典条目的余弦相似度之和,这通常用于相似度的计算:
最后正则项的使用可以使双语词典对应过程中,不会为了一些词的对应,而使每次学习转移矩阵的过程中都兼顾全局,学习缅语和英语中的全量信息。
Step2.3、迭代算法更新双语词典
通过迭代的方法扩大字典,迭代求解每次对应关系,通过对应关系矩阵W,找到词典中未对应的词进行扩充,进行下一次计算新W矩阵,更新后获得词典。在对应的过程中,如果汉缅双语的词向量相似度低于80%,就不会对应,只有满足该条件的双语向量才会认为对应,加入到双语词典中,进行下一次训练,直到经过一定次数训练后,双语词典不在增加,认为模型收敛结束训练或者超多一定次数就停止。因为在自学***方和最小化:
Step3、使用Step1中的英语依存句法分析语料在斯坦福神经网络下训练依存句法分析模型;
首先提供斯坦福解析器神经网络训练需要的输入向量以及标注好依存关系的英文依存句法分析语料,输入向量分别为词向量、POS标签向量和特征标签向量,词向量为Step2中得到同一语义空间的词向量,POS标签向量和特征标签向量是随机生成的向量;隐藏层采用来训练 xw,xt,xl分别表示隐藏层的词向量、pos标签向量和特征标签向量,分别表示隐藏层的词向量、pos标签向量和特征标签向量对应的权重矩阵,b1表示偏置;输出层采用的激活函数:p=softmax(W2h),W2表示权重。
Step3.1、[xw,xt,xl]作为模型的输入;其中是一个d维的词向量;xt,xl分别表示的是POS标签向量和特征标签向量;
Step3.2、模型隐藏层的激活函数:
其中作为偏置;dh是隐藏层的结点个数;
Step3.3、输出层的函数:
p=softmax(W2h)
其中的
Step4、利用迁移学习共享参数来优化训练获得缅语依存句法分析模型,具体为利用Step1步骤中获取的缅甸语依存句法分析语料和Step2中获取的相同语义空间的缅甸语的词向量来调节Step3得到的英语依存句法分析模型的参数,进而训练得到缅甸语依存句法分析模型。
本发明的有益效果:
本发明采用映射获得缅甸语依存句法分析语料,并利用迁移学习的思想共享参数优化缅甸语依存句法分析模型的效果,有效提升了缅甸语依存句法分析的性能。
附图说明
图1为本发明中的流程图;
图2为本发明中模型训练图;
图3为本发明中共享网络参数的依存句法分析模型训练图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
实施例1:一种基于迁移学***行树库(英语-缅甸语对齐句对20028条)构建缅甸语的依存句法分析语料,利用成对的英-缅词对将已经构建好的英语的依存句法分析关系映射到缅甸语句子上,映射得到的低质量的缅甸语依存句法分析语料共1799,低质量的17688;总共20028条;
借助线性变换矩阵W实现将缅语和英语映射到同一的语义空间,然后使用获取的同一语义空间的词向量作为依存句法分析的模型的词向量的输入。使用前述的英语依存句法分析语料在斯坦福神经网络下训练依存句法分析模型,具体的训练过程如图2所示。
利用获取的低质量缅语依存句法分析语料,以及获取的相同语义空间的缅甸语的词向量对依存句法分析模型的参数进行调整从而获取缅甸语依存句法分析的模型。
图3表示的是共享参数的神经网络模型图,Source Data和Target Data分别是英语依存句法分析语料(源语料)和缅语依存句法分析语料(目标语料)。
其中在不同维度的词向量对模型训练的影响不同,结果如表1所示。
表1不同维度的词向量对模型训练的影响
由表1可知,实验结果显示通过增加词向量的维度可以提高模型的效果,UAS提升大约两个百分点,LAS提升大约一个百分点;
本实施例中将本方法与另外两种方法进行对比,具体对比以斯坦福神经网络模型为基准嵌入了word2vec词向量训练的缅甸语依存句法分析模型的效果与嵌入了相同语义空间的词向量训练出来的模型效果以及加入迁移学习的思想和相同语义空间的词向量训练出来的模型效果,结果如表2所示,实验结果显示本法获取的效果优于普通的斯坦福神经网络训练模型,UAS提升大约半个百分点,LAS提升大约一个百分点;
表2不同方法结果对比
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (2)

1.一种基于迁移学习的缅甸语依存句法分析方法,其特征在于:首先利用英语-缅甸语映射的思路获取缅甸语的依存句法分析语料,将缅甸语语料和英语语料映射到同一语义空间;其次利用双语的词向量来训练英语的依存句法分析模型,并利用迁移学习的思想,加入缅甸语的依存句法分析语料,调节模型的参数得到缅甸依存句法分析的模型。
2.根据权利要求1所述的基于迁移学习的缅甸语依存句法分析方法,其特征在于:所述基于迁移学习的缅甸语依存句法分析方法的具体步骤如下:
Step1、利用英语-缅甸语的双语平行语料构建缅甸语依存句法分析语料;
Step1.1、分别对双语平行语料库中的英语语料和缅甸语料进行分词;
Step1.2、建立英语-缅甸语的词对应关系;
Step1.3、利用斯坦福神经网络训练模型对英语语料做依存句法分析得到英语依存句法分析语料;
Step1.4、利用步骤Step1.2中的词对应关系,将英语语料的依存句法分析映射到缅语语料上的到缅甸语依存句法分析语料;
Step2、将缅甸语语料和英语语料映射到同一语义空间;寻找一个线性变换矩阵W实现argmini||XiW-Zi||2,其中Xi和Zi分别表示第i个条目嵌入的缅甸语语料和英语语料的词,借助线性变换矩阵W实现将缅甸语语料和英语语料映射到同一的语义空间,然后使用获取的同一语义空间的词向量作为依存句法分析模型的输入;
Step3、使用Step1中的英语依存句法分析语料在斯坦福神经网络下训练依存句法分析模型;
首先提供斯坦福解析器神经网络训练需要的输入向量以及标注好依存关系的英文依存句法分析语料,输入向量分别为词向量、POS标签向量和特征标签向量,词向量为Step2中得到同一语义空间的词向量,POS标签向量和特征标签向量是随机生成的向量;隐藏层采用h=(W1 wxw+W1 txt+W1 lxl+b1)3,来训练[W1 w,W1 t,W1 l],xw,xt,xl分别表示隐藏层的词向量、pos标签向量和特征标签向量,W1 w,W1 t,W1 l分别表示隐藏层的词向量、pos标签向量和特征标签向量对应的权重矩阵,b1表示偏置;输出层采用的激活函数:p=softmax(W2h),W2表示权重。
Step4、利用迁移学习共享参数来优化训练获得缅语依存句法分析模型,具体为利用Step1步骤中获取的缅甸语依存句法分析语料和Step2中获取的相同语义空间的缅甸语的词向量来调节Step3得到的英语依存句法分析模型的参数,进而训练得到缅甸语依存句法分析模型。
CN201910158572.5A 2019-03-04 2019-03-04 一种基于迁移学习的缅甸语依存句法分析方法 Pending CN110008467A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910158572.5A CN110008467A (zh) 2019-03-04 2019-03-04 一种基于迁移学习的缅甸语依存句法分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910158572.5A CN110008467A (zh) 2019-03-04 2019-03-04 一种基于迁移学习的缅甸语依存句法分析方法

Publications (1)

Publication Number Publication Date
CN110008467A true CN110008467A (zh) 2019-07-12

Family

ID=67166340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910158572.5A Pending CN110008467A (zh) 2019-03-04 2019-03-04 一种基于迁移学习的缅甸语依存句法分析方法

Country Status (1)

Country Link
CN (1) CN110008467A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377918A (zh) * 2019-07-15 2019-10-25 昆明理工大学 融合句法解析树的汉-越神经机器翻译方法
CN110489753A (zh) * 2019-08-15 2019-11-22 昆明理工大学 改进特征选择的神经结构对应学习跨领域情感分类方法
CN110705253A (zh) * 2019-08-29 2020-01-17 昆明理工大学 基于迁移学习的缅甸语依存句法分析方法及装置
CN110738057A (zh) * 2019-09-05 2020-01-31 中山大学 一种基于语法约束和语言模型的文本风格迁移方法
CN111046946A (zh) * 2019-12-10 2020-04-21 昆明理工大学 基于crnn的缅甸语图像文本识别方法
CN114757167A (zh) * 2022-05-11 2022-07-15 昆明理工大学 基于参数迁移的越南语依存句法分析方法
CN114925708A (zh) * 2022-05-24 2022-08-19 昆明理工大学 融合无监督依存句法的泰汉神经机器翻译方法
US11741318B2 (en) 2021-03-25 2023-08-29 Nec Corporation Open information extraction from low resource languages

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760121A (zh) * 2012-06-28 2012-10-31 中国科学院计算技术研究所 依存映射方法及***
CN104991890A (zh) * 2015-07-15 2015-10-21 昆明理工大学 一种基于汉越词对齐语料构建越南语依存树库的方法
CN106250367A (zh) * 2016-07-27 2016-12-21 昆明理工大学 基于改进的Nivre算法构建越南语依存树库的方法
CN107894982A (zh) * 2017-10-25 2018-04-10 昆明理工大学 一种基于柬汉词对齐语料构建柬埔寨语依存树库的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760121A (zh) * 2012-06-28 2012-10-31 中国科学院计算技术研究所 依存映射方法及***
CN104991890A (zh) * 2015-07-15 2015-10-21 昆明理工大学 一种基于汉越词对齐语料构建越南语依存树库的方法
CN106250367A (zh) * 2016-07-27 2016-12-21 昆明理工大学 基于改进的Nivre算法构建越南语依存树库的方法
CN107894982A (zh) * 2017-10-25 2018-04-10 昆明理工大学 一种基于柬汉词对齐语料构建柬埔寨语依存树库的方法

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
CHAO XING ET AL: "Normalized word embedding and orthogonal transform for bilingual word translation", 《HUMAN LANGUAGE TECHNOLOGIES: THE 2015 ANNUAL CONFERENCE OF THE NORTH AMERICAN CHAPTER OF THE ACL》 *
GUO J ET AL: "A representation learning framework for multi-source transfer parsing", 《THIRTIETH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE》 *
JIANG GUO ET AL: "Cross-lingual Dependency Parsing Based on Distributed Representations", 《PROCEEDINGS OF THE 53RD ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS AND THE 7TH INTERNATIONAL JOINT CONFERENCE ON NATURAL LANGUAGE PROCESSING》 *
MIKEL ARTETXE ET AL: "Learning principled bilingual mappings of word embeddings while preserving monolingual invariance", 《PROCEEDINGS OF THE 2016 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING》 *
SAMUEL L. SMITH ET AL: "Offline bilingual word vectors, orthogonal transformations and the inverted softmax", 《HTTPS://ARXIV.ORG/ABS/1702.03859》 *
TAL SCHUSTER ET AL: "Cross-Lingual Alignment of Contextual Word Embeddings, with Applications to Zero-shot Dependency Parsing", 《HTTPS://ARXIV.53YU.COM/ABS/1902.09492V1》 *
李发杰 等: "借助汉-越双语词对齐语料构建越南语依存树库", 《中文信息学报》 *
李英 等: "越南语短语树到依存树的转换研究", 《计算机科学与探索》 *
郭江: "基于分布表示的跨语言跨任务自然语言分析", 《中国优秀博硕士学位论文全文数据库(博士)信息科技辑》 *
高国骥: "基于跨语言分布式表示的跨语言文本分类", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377918A (zh) * 2019-07-15 2019-10-25 昆明理工大学 融合句法解析树的汉-越神经机器翻译方法
CN110377918B (zh) * 2019-07-15 2020-08-28 昆明理工大学 融合句法解析树的汉-越神经机器翻译方法
CN110489753A (zh) * 2019-08-15 2019-11-22 昆明理工大学 改进特征选择的神经结构对应学习跨领域情感分类方法
CN110489753B (zh) * 2019-08-15 2022-06-14 昆明理工大学 改进特征选择的神经结构对应学习跨领域情感分类方法
CN110705253A (zh) * 2019-08-29 2020-01-17 昆明理工大学 基于迁移学习的缅甸语依存句法分析方法及装置
CN110738057A (zh) * 2019-09-05 2020-01-31 中山大学 一种基于语法约束和语言模型的文本风格迁移方法
CN110738057B (zh) * 2019-09-05 2023-10-24 中山大学 一种基于语法约束和语言模型的文本风格迁移方法
CN111046946A (zh) * 2019-12-10 2020-04-21 昆明理工大学 基于crnn的缅甸语图像文本识别方法
US11741318B2 (en) 2021-03-25 2023-08-29 Nec Corporation Open information extraction from low resource languages
CN114757167A (zh) * 2022-05-11 2022-07-15 昆明理工大学 基于参数迁移的越南语依存句法分析方法
CN114925708A (zh) * 2022-05-24 2022-08-19 昆明理工大学 融合无监督依存句法的泰汉神经机器翻译方法

Similar Documents

Publication Publication Date Title
CN110008467A (zh) 一种基于迁移学习的缅甸语依存句法分析方法
CN110334219B (zh) 基于注意力机制融入文本语义特征的知识图谱表示学习方法
CN109635280A (zh) 一种基于标注的事件抽取方法
CN106383816B (zh) 基于深度学习的中文少数民族地区地名的识别方法
CN111325029B (zh) 一种基于深度学习集成模型的文本相似度计算方法
CN109753660B (zh) 一种基于lstm的中标网页命名实体抽取方法
CN107562792A (zh) 一种基于深度学习的问答匹配方法
CN107526799A (zh) 一种基于深度学习的知识图谱构建方法
CN108920445A (zh) 一种基于Bi-LSTM-CRF模型的命名实体识别方法和装置
CN110196980A (zh) 一种基于卷积网络在中文分词任务上的领域迁移
CN111222318B (zh) 基于双通道双向lstm-crf网络的触发词识别方法
CN111274790B (zh) 基于句法依存图的篇章级事件嵌入方法及装置
CN108875809A (zh) 联合attention机制与神经网络的生物医学实体关系分类方法
CN107832458A (zh) 一种字符级的基于嵌套深度网络的文本分类方法
Yuan-jie et al. Web service classification based on automatic semantic annotation and ensemble learning
CN113672718B (zh) 基于特征匹配和领域自适应的对话意图识别方法及***
CN108021557A (zh) 基于深度学习的不规则实体识别方法
CN114676255A (zh) 文本处理方法、装置、设备、存储介质及计算机程序产品
CN113220865B (zh) 一种文本相似词汇检索方法、***、介质及电子设备
CN115329088B (zh) 图神经网络事件检测模型的鲁棒性分析方法
US10339223B2 (en) Text processing system, text processing method and storage medium storing computer program
CN112699685A (zh) 基于标签引导的字词融合的命名实体识别方法
CN115687610A (zh) 文本意图分类模型训练方法、识别方法、装置、电子设备及存储介质
CN109033087A (zh) 计算文本语义距离的方法、去重方法、聚类方法以及装置
CN115062109A (zh) 一种基于实体对注意力机制的实体关系联合抽取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190712

RJ01 Rejection of invention patent application after publication