CN111191453A - 一种基于对抗训练的命名实体识别方法 - Google Patents
一种基于对抗训练的命名实体识别方法 Download PDFInfo
- Publication number
- CN111191453A CN111191453A CN201911358738.4A CN201911358738A CN111191453A CN 111191453 A CN111191453 A CN 111191453A CN 201911358738 A CN201911358738 A CN 201911358738A CN 111191453 A CN111191453 A CN 111191453A
- Authority
- CN
- China
- Prior art keywords
- training
- word
- model
- judicial
- word vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012549 training Methods 0.000 title claims abstract description 23
- 239000013598 vector Substances 0.000 claims abstract description 60
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000005457 optimization Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 12
- 238000013135 deep learning Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于对抗训练的命名实体识别方法,分别通过RoBERTa模型训练和Bi‑LSTM的训练获得司法领域文字之间关联性特征;然后将两种关联性特征拼接在一起,利用条件随机场模型对训练样本进行预测获得预测的结果;本发明能够引入不同维度的外部词向量与字向量与不同维度的司法领域文本字词混合向量相结合,并且针对司法领域文本中混合词向量进行对抗扰动,增加模型识别的准确率。
Description
技术领域
本发明属于命名实体识别的技术领域,具体涉及一种基于对抗训练的命名实体识别方法。
背景技术
命名实体识别在各个领域已经有了广泛的应用,各领域也针对命名实体识别进行了不同程度的优化,在传统的命名实体识别中需要耗费大量的人员针对特定的领域进行特征提取,并利用概率图模型进行命名实体识别,随着近几年深度学习的兴起,各领域已经利用深度学习的方法对命名实体识别进行了大量的探索,目前在金融,医疗,法律领域已经有大量的探索与实践,减少了大量的人工成本,并提高了准确率,如何利用这些信息尤为关键,在利用命名实体识别技术,对某些特定领域中具有特定意义的实体,比如在司法文本中(嫌疑人,被告,原告等),通过这些实体的识别可以为之后信息提取、问答***、句法分析、知识推理,构建知识图谱等重要任务打下来重要的基础。
目前,命名实体识别在司法领域中的主要方法分为三大类:
第一类基于概率图模型,该方法主要使用条件随机场(CRF)模型,是给定一组输入序列条件下另一组输出序列的条件概率分布模型,通过输入带标签特定领域数据,人工提取出相应的特征与设定相应的规则,从而对未标注的文本进行识别。
第二类基于深度学习的方法,该方法主要使用双向长短时记忆网络(Bi-LSTM)模型,利用词向量嵌入信息,通过输入带标签特定领域数据到Bi-LSTM中从而大大的减少了人工的工作,并且可以得到更高的准确率。
第三类基于深度学习与传统的方法相结合,该方法利用词向量训练方法(Word2Vec)或者(GloVe)技术给定特定领域文本,特定领域词表,在特定领域文本中我们通过文本来构建语言模型,通过P(w1,w2,…wn)=P(w1)P(w2|w1)P(wn|w1,…,wn-1),把联合概率转化为条件概连乘,并利用马尔科夫假设大大减少了参数,而在词表中的每一个词都对应着一个连续的特征向量,往一个概率模型中,输入一段词向量,输出文本的联合概率,从而去学习词向量权重,构建一个简单的神经网络f(wt-n+1…,wt)f(wt-n+1…,wt)来拟合条件概率P(wt|w1,…,wt-1),模型中输入词向量到线性的嵌入层(Embedding)层,利用可训练的参数矩阵C通过设置不同的滑动窗口贯穿整个特定领域文本,来获取到特定领域文本的词向量,从而得到相应的词向量(word vector),这里有两种方法分别为跳字模型(Skip-gram)或连续词袋子模型(CBOW)两个模型去进行训练,当得到相应的词向量后,通过输入Bi-LSTM层,在Bi-LSTM层中词向量的输入经过每一个时间点的隐藏状态,这样可以得到上下文的表示,最后的特征通过CRF层利用周围的信息从而有效的得到相应的标签,模型如图1。
现有的特定领域的命名实体模型利用Bi-LSTM跟CRF模型相结合的方式,但模型提取特征的能力不够强大,而Bi-LSTM中的建模只是简单的从左到右,或者从右到左进行建模,并把隐状态拼接在一起,但是这样做的缺点是只能利用上文或者下文的信息,不能同时利用上文和下文的信息。并且,在特定领域中文本的数量与个数有限,没有大量的数据进行模型性能的提升。
随着BERT模型的出现,在各领域中已经逐步进行应用,但是在特定领域中却没有得到相应的应用,而BERT及后续的模型RoBERTa所带来单词之间相互独立,微调时会带来模型性能的损失等缺点,数据的规模很大,模型的准确率基本无法提升。
发明内容
有鉴于此,本发明提供了一种基于对抗训练的命名实体识别方法,能够引入不同维度的外部词向量与字向量与不同维度的司法领域文本字词混合向量相结合,并且针对司法领域文本中混合词向量进行对抗扰动,增加模型识别的准确率。
实现本发明的技术方案如下:
一种基于对抗训练的命名实体识别方法,包括以下步骤:
步骤一、将司法领域的裁判文书切分为单个文字作为训练样本,通过RoBERTa模型训练获得司法领域文字之间关联性特征;
将司法领域的裁判文书切分为单个文字和词组,利用Word2Vec方法将词组转换为词向量,利用Fasttext方法将单个文字转换为基于字的词向量;引入司法领域之外的利用Word2Vec方法得到的词向量,引入司法领域之外的利用Fasttext方法得到的基于字的词向量;将所有词向量混合;
步骤二、对混合的词向量矩阵进行扰动,通过损失函数的最大值来找到最坏情况的扰动,利用外部经验风险的最小化来得到模型的最佳鲁棒参数,从而得到对抗扰动优化后的词向量;
步骤三、利用长度为a的滑动窗口将步骤二获得的词向量输入Bi-LSTM,经过Bi-LSTM的训练,获得司法领域字词之间的关联性特征;
步骤四、将步骤一和步骤三得到的两个关联性特征拼接在一起,然后利用条件随机场模型对训练样本进行预测获得预测的结果。
进一步地,1000<a<2000。
有益效果:
1.本发明引入不同维度的外部词向量与字向量与不同维度的司法领域文本字词混合向量相结合,丰富了司法领域命名实体识别的训练样本。
2.本发明利用RoBERTa提取出司法领域文本的特征后与不同维度的词向量融合过后与Bi-LSTM特征相结合得到相应特征在通过CRF得到结果。
3.本发明针对司法领域文本中混合词向量进行对抗扰动,增加模型的泛化能力与鲁棒性。
附图说明
图1为Bi-LSTM架构示意图。
图2为RoBERTa模型架构示意图。
图3为本发明词向量模型示意图。
图4为本发明命名实体识别模型架构图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
本发明提供了一种基于对抗训练的命名实体识别方法,如图4所示,具体过程如下:
步骤一、本发明引入了RoBERTa模型在司法领域,首先对每个司法领域文本进行相应的分词,按照字的形式输入到RoBERTa中,通过自注意力机制(self-attention)对不同的词分配不同的权重,即假设输入矩阵为X,最大的词嵌入向量为512,通过不同的权重矩阵Wq,Wk,Wv,最终经过softmax得到自注意力矩阵Z,经过多头机制,得到注意力层的多个表示子空间,最后拼接不同的矩阵Z,通过动态的对部分词的掩码,提取出相应的特征C,如图2所示:
在司法领域中,相应的司法领域文本规模没那么大,只有有限的数据,而在有限的数据中通常得不到更好的模型效果,本发明引入基于字的Fasttext与基于词的Word2Vec,通过构造Embedding层,把司法领域文本构造成N-1个one-hot词向量,把所有的one-hot向量经过N×V的矩阵,N为自己设定的维度,V是词典的大小,得到向量相加求平均并乘以输出的权重矩阵而得到相应的概率分布,而其中的N×V矩阵即为字与词向量矩阵W1与W2,这里指定了不同的字向量与词向量维度,基于字的词向量矩阵弥补了司法领域中专业词汇较少的特点,而基于词的的词向量矩阵因为是司法领域的词,所以能提供更精确的先验知识,通过引入外部较大的通用字向量矩阵W3,与词向量矩阵W4,来拼接在一起[W1,W2,W3,W4]得到一个信息丰富的特征向量,克服了司法领域中文本数量较少,无法获取更好效果的特点,模型如图3所示:
步骤二、利用对混合词向量矩阵的对抗训练,在词向量上进行扰动,假设混合的词向量矩阵[v1,v2,…vT]为x,对混合的词向量矩阵进行扰动,γadv=∈·g/||g||2,并优化函数 内部的max函数找到扰动,外部的min函数找到最佳鲁棒参数,公式中L为损失函数,通过Fast Gradient Method方法来把内部max的非凸约束优化问题解决,最后得到相应的结果,其中γadv为扰动的值,∈为扰动的系数,g为对x求梯度,是样本的范围,y是预测值,θ为分类器的参数,E为经验风险函数,S为扰动的范围,fθ为语言模型编码器映射的函数。
步骤三、Bi-LSTM模型,可以通过不同的窗口来增加上下文隐藏向量的特征数,把拼接好的词向量输入到Bi-LSTM中,词向量经过遗忘门ft=σ(Wf*[ht-1,xt]+bf)来判断是否遗忘旧的信息,接着通过输入门it=σ(Wi*[ht-1,xt]+bi),利用sigmoid函数来更新值,并构建新的候选值接着通过更新门来决定是否更新的状态,最后我们需要输出门ot=σ(Wo*[ht-1,xt]+bo),ht=ot*tanh(Ct)来得到相应的概率分布,在公式中xt为依次输入的字或词向量矩阵,ft为经过遗忘门得到的值,it为经过输入门得到的值,为通过更新门后的候选值,Ct为通过更新门后的状态值,ot为输出的值,ht为当前隐藏状态,sigmoid函数是将变量映射到0,1之间的函数,σ为sigmoid函数,tanh函数将值压缩在-1和1之间,ht-1为上一时刻的隐藏状态,b为偏置项,W为权重矩阵,Ct-1为上一个记忆状态,为当前记忆状态,当经过从左到右与从右到左的语言模型构建得到隐状态ht1与ht2,拼接两者的隐藏状态为Ht。
步骤四、通过RoBERTa模型提取到的特征C与Bi-LSTM得到的隐藏状态拼接在一起得到特征矩阵[C,Ht],C为提取到字之间的特征,Ht为通过Bi-LSTM模型后拼接的隐状态,解决了RoBERTa模型带来的独立假设检验问题,并对因RoBERTa模型字数限制带来的特征损失进行了补充。CRF可以考虑标签之间的约束关系,利用维特比算法得到命名实体识别结果。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (2)
1.一种基于对抗训练的命名实体识别方法,其特征在于,包括以下步骤:
步骤一、将司法领域的裁判文书切分为单个文字作为训练样本,通过RoBERTa模型训练获得司法领域文字之间关联性特征;
将司法领域的裁判文书切分为单个文字和词组,利用Word2Vec方法将词组转换为词向量,利用Fasttext方法将单个文字转换为基于字的词向量;引入司法领域之外的利用Word2Vec方法得到的词向量,引入司法领域之外的利用Fasttext方法得到的基于字的词向量;将所有词向量混合;
步骤二、对混合的词向量矩阵进行扰动,通过损失函数的最大值来找到最坏情况的扰动,利用外部经验风险的最小化来得到模型的最佳鲁棒参数,从而得到对抗扰动优化后的词向量;
步骤三、利用长度为a的滑动窗口将步骤二获得的词向量输入Bi-LSTM,经过Bi-LSTM的训练,获得司法领域字词之间的关联性特征;
步骤四、将步骤一和步骤三得到的两个关联性特征拼接在一起,然后利用条件随机场模型对训练样本进行预测获得预测的结果。
2.如权利要求1所述的一种基于对抗训练的命名实体识别方法,其特征在于,1000<a<2000。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911358738.4A CN111191453A (zh) | 2019-12-25 | 2019-12-25 | 一种基于对抗训练的命名实体识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911358738.4A CN111191453A (zh) | 2019-12-25 | 2019-12-25 | 一种基于对抗训练的命名实体识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111191453A true CN111191453A (zh) | 2020-05-22 |
Family
ID=70709379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911358738.4A Pending CN111191453A (zh) | 2019-12-25 | 2019-12-25 | 一种基于对抗训练的命名实体识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111191453A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111680145A (zh) * | 2020-06-10 | 2020-09-18 | 北京百度网讯科技有限公司 | 知识表示学习方法、装置、设备以及存储介质 |
CN111737952A (zh) * | 2020-06-24 | 2020-10-02 | 深圳前海微众银行股份有限公司 | 一种序列标注模型的训练方法及装置 |
CN112115721A (zh) * | 2020-09-28 | 2020-12-22 | 青岛海信网络科技股份有限公司 | 一种命名实体识别方法及装置 |
CN112765319A (zh) * | 2021-01-20 | 2021-05-07 | 中国电子信息产业集团有限公司第六研究所 | 一种文本的处理方法、装置、电子设备及存储介质 |
CN112784831A (zh) * | 2021-02-02 | 2021-05-11 | 电子科技大学 | 融合多层特征增强注意力机制的文字识别方法 |
CN112925918A (zh) * | 2021-02-26 | 2021-06-08 | 华南理工大学 | 一种基于疾病领域知识图谱的问答匹配*** |
CN112949291A (zh) * | 2021-03-02 | 2021-06-11 | 赛飞特工程技术集团有限公司 | 报告纠错***和方法 |
CN113380418A (zh) * | 2021-06-22 | 2021-09-10 | 浙江工业大学 | 一种通过对话文本分析识别抑郁症的*** |
CN113987192A (zh) * | 2021-12-28 | 2022-01-28 | 中国电子科技网络信息安全有限公司 | 一种基于RoBERTa-WWM和HDBSCAN算法的热点话题检测方法 |
WO2022078102A1 (zh) * | 2020-10-14 | 2022-04-21 | 腾讯科技(深圳)有限公司 | 一种实体识别方法、装置、设备以及存储介质 |
CN114444506A (zh) * | 2022-01-11 | 2022-05-06 | 四川大学 | 一种融合实体类型的关系三元组抽取方法 |
CN116702787A (zh) * | 2023-08-07 | 2023-09-05 | 四川隧唐科技股份有限公司 | 一种长文本实体识别方法、装置、计算机设备及介质 |
CN117057350A (zh) * | 2023-08-07 | 2023-11-14 | 内蒙古大学 | 中文电子病历命名实体识别方法和*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229582A (zh) * | 2018-02-01 | 2018-06-29 | 浙江大学 | 一种面向医学领域的多任务命名实体识别对抗训练方法 |
CN110083831A (zh) * | 2019-04-16 | 2019-08-02 | 武汉大学 | 一种基于BERT-BiGRU-CRF的中文命名实体识别方法 |
CN110532377A (zh) * | 2019-05-13 | 2019-12-03 | 南京大学 | 一种基于对抗训练和对抗学习网络的半监督文本分类方法 |
-
2019
- 2019-12-25 CN CN201911358738.4A patent/CN111191453A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229582A (zh) * | 2018-02-01 | 2018-06-29 | 浙江大学 | 一种面向医学领域的多任务命名实体识别对抗训练方法 |
CN110083831A (zh) * | 2019-04-16 | 2019-08-02 | 武汉大学 | 一种基于BERT-BiGRU-CRF的中文命名实体识别方法 |
CN110532377A (zh) * | 2019-05-13 | 2019-12-03 | 南京大学 | 一种基于对抗训练和对抗学习网络的半监督文本分类方法 |
Non-Patent Citations (5)
Title |
---|
GEORGY KONOPLICH等: "Named Entity Recognition in Russian with Word Representation Learned by a Bidirectional Language Model", ARTIFICIAL INTELLIGENCE AND NATURAL LANGUAGE * |
ZHENJIN DAI等: "Named Entity Recognition Using BERT BiLSTM CRF for Chinese Electronic Health Records", 12TH INTERNATIONAL CONGRESS ON IMAGE AND SIGNAL PROCESSING, BIOMEDICAL ENGINEERING AND INFORMATICS * |
冯建周等: "关于命名实体识别的生成式对抗网络的研究", 小型微型计算机*** * |
王文广等: "基于混合深度神经网络模型的司法文书智能化处理", 清华大学学报(自然科学版) * |
郭宝震等: "采用词向量注意力机制的双路卷积神经网络句子分类模型", 浙江大学学报(工学版) * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111680145B (zh) * | 2020-06-10 | 2023-08-15 | 北京百度网讯科技有限公司 | 知识表示学习方法、装置、设备以及存储介质 |
CN111680145A (zh) * | 2020-06-10 | 2020-09-18 | 北京百度网讯科技有限公司 | 知识表示学习方法、装置、设备以及存储介质 |
CN111737952A (zh) * | 2020-06-24 | 2020-10-02 | 深圳前海微众银行股份有限公司 | 一种序列标注模型的训练方法及装置 |
CN112115721B (zh) * | 2020-09-28 | 2024-05-17 | 青岛海信网络科技股份有限公司 | 一种命名实体识别方法及装置 |
CN112115721A (zh) * | 2020-09-28 | 2020-12-22 | 青岛海信网络科技股份有限公司 | 一种命名实体识别方法及装置 |
WO2022078102A1 (zh) * | 2020-10-14 | 2022-04-21 | 腾讯科技(深圳)有限公司 | 一种实体识别方法、装置、设备以及存储介质 |
CN112765319A (zh) * | 2021-01-20 | 2021-05-07 | 中国电子信息产业集团有限公司第六研究所 | 一种文本的处理方法、装置、电子设备及存储介质 |
CN112765319B (zh) * | 2021-01-20 | 2021-09-03 | 中国电子信息产业集团有限公司第六研究所 | 一种文本的处理方法、装置、电子设备及存储介质 |
CN112784831A (zh) * | 2021-02-02 | 2021-05-11 | 电子科技大学 | 融合多层特征增强注意力机制的文字识别方法 |
CN112784831B (zh) * | 2021-02-02 | 2022-06-28 | 电子科技大学 | 融合多层特征增强注意力机制的文字识别方法 |
CN112925918A (zh) * | 2021-02-26 | 2021-06-08 | 华南理工大学 | 一种基于疾病领域知识图谱的问答匹配*** |
CN112925918B (zh) * | 2021-02-26 | 2023-03-24 | 华南理工大学 | 一种基于疾病领域知识图谱的问答匹配*** |
CN112949291A (zh) * | 2021-03-02 | 2021-06-11 | 赛飞特工程技术集团有限公司 | 报告纠错***和方法 |
CN113380418A (zh) * | 2021-06-22 | 2021-09-10 | 浙江工业大学 | 一种通过对话文本分析识别抑郁症的*** |
CN113987192B (zh) * | 2021-12-28 | 2022-04-01 | 中国电子科技网络信息安全有限公司 | 一种基于RoBERTa-WWM和HDBSCAN算法的热点话题检测方法 |
CN113987192A (zh) * | 2021-12-28 | 2022-01-28 | 中国电子科技网络信息安全有限公司 | 一种基于RoBERTa-WWM和HDBSCAN算法的热点话题检测方法 |
CN114444506B (zh) * | 2022-01-11 | 2023-05-02 | 四川大学 | 一种融合实体类型的关系三元组抽取方法 |
CN114444506A (zh) * | 2022-01-11 | 2022-05-06 | 四川大学 | 一种融合实体类型的关系三元组抽取方法 |
CN116702787A (zh) * | 2023-08-07 | 2023-09-05 | 四川隧唐科技股份有限公司 | 一种长文本实体识别方法、装置、计算机设备及介质 |
CN117057350A (zh) * | 2023-08-07 | 2023-11-14 | 内蒙古大学 | 中文电子病历命名实体识别方法和*** |
CN117057350B (zh) * | 2023-08-07 | 2024-05-10 | 内蒙古大学 | 中文电子病历命名实体识别方法和*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111191453A (zh) | 一种基于对抗训练的命名实体识别方法 | |
CN110929030B (zh) | 一种文本摘要和情感分类联合训练方法 | |
CN108733792B (zh) | 一种实体关系抽取方法 | |
CN108563653B (zh) | 一种用于知识图谱中知识获取模型的构建方法及*** | |
CN108628823B (zh) | 结合注意力机制和多任务协同训练的命名实体识别方法 | |
CN110532557B (zh) | 一种无监督的文本相似度计算方法 | |
CN110008338B (zh) | 一种融合gan和迁移学习的电商评价情感分析方法 | |
CN110334354B (zh) | 一种中文关系抽取方法 | |
CN106407333B (zh) | 基于人工智能的口语查询识别方法及装置 | |
CN111160467B (zh) | 一种基于条件随机场和内部语义注意力的图像描述方法 | |
CN108062388A (zh) | 人机对话的回复生成方法和装置 | |
CN111666758B (zh) | 中文分词方法、训练设备以及计算机可读存储介质 | |
CN109800437A (zh) | 一种基于特征融合的命名实体识别方法 | |
CN112632972A (zh) | 一种电网设备故障报告内故障信息的快速提取方法 | |
CN109858041A (zh) | 一种半监督学习结合自定义词典的命名实体识别方法 | |
CN110909736A (zh) | 一种基于长短期记忆模型与目标检测算法的图像描述方法 | |
CN109919175B (zh) | 一种结合属性信息的实体多分类方法 | |
CN110162789A (zh) | 一种基于汉语拼音的词表征方法及装置 | |
WO2023137911A1 (zh) | 基于小样本语料的意图分类方法、装置及计算机设备 | |
CN112699685B (zh) | 基于标签引导的字词融合的命名实体识别方法 | |
CN114492441A (zh) | 基于机器阅读理解的BiLSTM-BiDAF命名实体识别方法 | |
CN115062104A (zh) | 融合知识提示的法律文本小样本命名实体识别方法 | |
CN114239612A (zh) | 一种多模态神经机器翻译方法、计算机设备及存储介质 | |
CN110309515B (zh) | 实体识别方法及装置 | |
CN115114409A (zh) | 一种基于软参数共享的民航不安全事件联合抽取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200522 |