CN110083831A - 一种基于BERT-BiGRU-CRF的中文命名实体识别方法 - Google Patents
一种基于BERT-BiGRU-CRF的中文命名实体识别方法 Download PDFInfo
- Publication number
- CN110083831A CN110083831A CN201910302430.1A CN201910302430A CN110083831A CN 110083831 A CN110083831 A CN 110083831A CN 201910302430 A CN201910302430 A CN 201910302430A CN 110083831 A CN110083831 A CN 110083831A
- Authority
- CN
- China
- Prior art keywords
- bert
- crf
- bigru
- entity recognition
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Character Discrimination (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于BERT‑BiGRU‑CRF的中文命名实体识别方法。该方法包括三个阶段,第一阶段预处理海量文本语料,预训练BERT语言模型;第二阶段预处理命名实体识别语料,利用训练好的BERT语言模型对命名实体识别语料进行编码;第三阶段将编码后的语料输入BiGRU+CRF模型中进行训练,利用训练好的模型对待识别语句进行命名实体识别。本发明通过构建基于BERT‑BiGRU‑CRF的中文命名实体识别方法,通过BERT预训练语言模型增强字的语义表示,根据字的上下文动态生成语义向量,有效表征了字的多义性。提高了中文命名实体识别的精度,且与基于语言模型微调的方法相比减少了训练参数,节省了训练时间。
Description
技术领域
本发明属于命名实体识别领域,具体涉及一种基于BERT-BiGRU-CRF模型的中文命名实体识别方法。
背景技术
命名实体识别旨在识别文本中特定实体信息,如人名、地名、机构名等,在信息抽取,信息检索,智能问答,机器翻译中都有广泛应用,是自然语言处理的基础之一。传统的命名实体识别方法可以分为基于词典的命名实体识别方法,基于规则的命名实体识别方法,基于传统机器学习的命名实体识别的方法,基于神经网络的命名实体识别的方法和基于语言模型微调的方法。
基于词典的命名实体识别方法,该方法首先构造大规模实体词典,然后通过匹配语句和词典来进行命名实体识别。
基于规则的命名实体识别方法的原理是根据实体特有的上下文特征来构造规则,将文本与规则进行匹配来识别出命名实体。该方法需要语言学背景知识。
基于传统机器学习的命名实体识别的方法,该方法将命名实体识别任务形式化序列标注任务,通过预测每个字或者词的标签,联合预测实体边界和实体类型。例如基于CRF(条件随机场)的命名实体识别的方法、基于HMM(隐马尔可夫)的命名实体识别的方法等,这类方法的原理是通过人工构建特征模板提取特征,作为输入,学习前后一个词的语义信息,然后预测序列标签。
基于神经网络的命名实体识别的方法,其原理是将字或者词映射为单一向量,然后输入神经网络模型中进行标签预测,经典模型是BiLSTM-CRF模型。
基于预训练语言模型微调的方法,该方法通过海量语料无监督预训练一个语言模型来表征句子语义,然后在有标签的语料之上对语言模型进行微调。
上述现有技术存在下列缺陷:
1、基于词典的命名实体识别方法严重依赖于词典库,无法识别未登录词,且无法识别实体嵌套情形。
2、基于规则的命名实体识别方法在构建规则时需要语言学背景知识,中文表达具有多样性,规则难以枚举且容易冲突,还有一个缺点是不具有迁移性,工作繁琐复杂。
3、基于传统机器学习的命名实体识别的方法。
4、基于神经网络的命名实体识别的方法,该方法无法表征字或者词的多义性。有些字词在不同的上下文语境中具有不同的语义表示,该方法将字或者词映射为单一向量与事实不符。
5、基于语言模型微调的方法有参数量庞大,训练时间长的缺点。
发明内容
本发明的发明目的是:为了解决现有技术中存在的以上问题,本发明提出了一种能够有效的提高命名实体识别精度的基于BERT-BiGRU-CRF的中文命名实体识别方法。
一种基于BERT-BiGRU-CRF的中文命名实体识别方法,其特征在于,包括以下步骤:
步骤A、获取语言模型的训练语料数据并进行预处理,具体包括以下分步骤:
A1、将原始语料进行字符级切分;
A2、构建句子对正负样本,其中正样本表示句子对有上下文关系;负样本表示两个句子没有关系;
A3、对超过max_num_tokens的句子对进行截断;
A4、连接句子对,用[SEP]标签进行连接,句首置[CLS]标签,句末置[SEP]标签;
A5、随机遮住15%的单词;其中80%用masked token来代替,10%用随机的一个词来替换,10%保持这个词不变;
步骤B、根据步骤A预处理后的训练语料数据训练BERT语言模型包括Embedding层、双向Transformer编码器、输出层;
步骤C、获取命名实体识别模型的训练语料数据并进行标注,形成标注语料,
具体是对中文命名实体识别语料进行标注,采用BIO标注模式,其中B表示实体开始,I表示实体非开始部分,O表示不是实体的部分;
步骤D、对步骤C得到的标注语料进行预处理,具体包括以下分步骤:
D1、将原始语料进行字符级切分;
D2、句首置[CLS]标签,句末置[SEP]标签;对应标签也分别置为[CLS],[SEP]
步骤E、根据步骤B得到的基于BERT的语言模型和步骤D预处理后的标注语
料构建基于BERT-BiGRU-CRF的中文命名实体识别模型;
步骤F、利用步骤E得到的基于BERT-BiGRU-CRF的中文命名实体识别模型对
待识别数据进行处理,得到命名实体识别结果。
在上述的基于BERT-BiGRU-CRF的命名实体识别方法,所述步骤B还包括将步骤A5得到的训练语料变为定长,对长度不够的句子用[PAD]进行补齐,将定长语料输入BERT模型进行训练。
在上述的基于BERT-BiGRU-CRF的命名实体识别方法,所述步骤E中BERT-BiGRU-CRF模型包括步骤B中训练好的BERT语言模型,通过BERT编码步骤D中预处理好的命名实体识别语料,输出每个字的上下文表示,然后将字向量序列输入BiGRU-CRF中进行训练。
在上述的基于BERT-BiGRU-CRF的命名实体识别方法,所述步骤F利用步骤E得到的BERT-BiGRU-CRF模型对待识别数据进行处理,得到命名实体识别结果,具体为:
按照步骤D中的方式对待识别数据进行预处理,通过BERT-BiGRU-CRF预测实体标签,最后采用维特比算法求出每句话最大可能的标注序列,将其作为命名实体识别结果。
本发明的有益效果是:本发明构建了BERT-BiGRU-CRF中文命名实体识别模型,通过BERT预训练语言模型增强字的语义表示,根据字的上下文动态生成语义向量,有效表征了字的多义性。提高了中文命名实体识别的精度,且与基于语言模型微调的方法相比减少了训练参数,节省了训练时间。
附图说明
图1是本发明的基于BERT-BiGRU-CRF模型的中文命名实体识别方法的流程图示意图。
图2是本发明实施例的BERT-BiGRU-CRF模型示意图。
图3是本发明实施例的BERT预训练语言模型示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,为本发明的基于BERT-BiGRU-CRF模型的中文命名实体识别方法的流程示意图。包括以下步骤:
A、获取语言模型的训练语料数据并进行预处理;
B、根据步骤A预处理后的训练语料数据训练BERT(Bidirectional EncoderRepresentations from Transformers)语言模型;
C、获取命名实体识别模型的训练语料数据并进行标注,形成标注语料;
D、对步骤C得到的标注语料进行预处理;
E、根据步骤B得到的基于BERT的语言模型和步骤D预处理后的标注语料构建基于BERT-BiGRU-CRF的中文命名实体识别模型;
F、利用步骤E得到的基于BERT-BiGRU-CRF的中文命名实体识别模型对待识别数据进行处理,得到命名实体识别结果。
在本发明的一个可选实施例中,上述步骤A首先获取语言模型的训练语料数据,然后对语言模型的训练语料数据进行预处理,具体包括以下分步骤:
A1、将原始语料进行字符级切分;
A2、构建句子对正负样本,其中正样本表示句子对有上下文关系;负样本表示两个句子没有关系;
A3、对超过max_num_tokens的句子对进行截断;
A4、连接句子对,用[SEP]标签进行连接,句首置[CLS]标签,句末置[SEP]标签;
A5、随机遮住15%的单词;其中80%用masked token来代替,10%用随机的一个词来替换,10%保持这个词不变。
例如“我是在一个夕阳衔山的黄昏走进这座哨所的。失尽暖意的残阳把昆仑雪山抹成一片桔红。”这两句话经过预处理后为“[CLS]我是在一个夕阳衔山的黄[MASK]走进这座哨所的。[SEP]失尽暖意的残阳把昆仑雪山抹成一片桔红。[SEP]”,该例中[MASK]为随机遮住的字,该句子对有上下文关系,所以标签为TRUE。
在本发明的一个可选实施例中,上述步骤B根据步骤A预处理后的训练语料数据构建基于BERT(Bidirectional Encoder Representations from Transformers)的语言模型,如图2所示,为本实例中的BERT语言模型,包括Embedding层、双向Transformer编码器、输出层,其中
Embedding层是词嵌入,位置嵌入,类型嵌入之和,分别表示词信息,位置信息,句子对信息。其中位置编码计算方式如下:
双向Transformer编码器是多层编码单元的堆叠,每个编码单元包括自注意力模块,残差网络,层归一化结构,DropOut层。用于提取语义信息。整体计算过程如下;
MultiHead(Q,K,V)=Concat(head1,...,headh)Wo
headi=Attention(QWi Q,KWi k,VWi V)
FFN=max(0,xW1+b1)W2+b2
其中Attention是自注意力模块计算公式,Q,K,V均是输入字向量矩阵,dk为输入向量维度。其核心思想是去计算一句话中的每个词对于这句话中所有词的相互关系,然后认为这些词与词之间的相互关系在一定程度上反应了这句话中不同词之间的关联性以及重要程度。因此再利用这些相互关系来调整每个词的重要性(权重)就可以获得每个词新的表达。这个新的表征不但蕴含了该词本身,还蕴含了其他词与这个词的关系,因此和单纯的词向量相比是一个更加全局的表达。
其中MultiHead是Transformer编码器的多头机制,为了扩展模型专注于不同位置的能力,增大注意力单元的“表示子空间”。LN和FFN分别为层归一化和残差网络模块计算公式,用来解决深度学习中的退化问题
输出层输出[MASK]原词的概率和句子对之间是否为上下文关系标签
本发明还包括将步骤A5得到的训练语料变为定长,对长度不够的句子用[PAD]进行补齐,然后将定长语料输入BERT模型进行训练。具体训练过程为:
将数据及标签数据,[MASK]部分原字符输入到BERT语言模型中,然后采用SGD(梯度下降法)或其他优化方法训练BERT语言模型的模型参数,当模型产生的损失值满足设定要求或者达到最大迭代次数N时,则终止该模型的训练,保存模型参数。
在本发明的一个可选实施例中,上述步骤C中,对命名实体识别模型的训练语料数据进行标注具体为采用BIO的标记方式对命名实体识别模型的训练语料数据进行标注,形成标注语料。
如果一个字符单元是一个实体词的开始,则标记为(B-...);如果一个字符单元是一个实体词的非开始字符,则标记为(I-...);如果一个字符不属于实体词则标注为(O)。例如“彤彤出生在南通,现在在腾讯工作。”,其标注结果为:“彤B-PER、彤I-PER、出O、生O、在O、南B-LOC、通I-LOC、,O、现O、在O、在O、腾B-ORG、讯I-ORG、工O、作O。O”。
在本发明的一个可选实施例中,上述步骤D对步骤C得到标注语料进行预处理,具体包括以下分步骤:
D1、将原始语料进行字符级切分;
D2、句首置[CLS]标签,句末置[SEP]标签;对应标签也分别置为[CLS],[SEP]
例如“彤彤出生在南通,现在在腾讯工作。”预处理后的结果为:
“[CLS][CLS]、彤B-PER、彤I-PER、出O、生O、在O、南B-LOC、通I-LOC、,O、现O、在O、在O、腾B-ORG、讯I-ORG、工O、作O。[SEP][SEP]”
在本发明的一个可选实施例中,上述步骤E根据步骤B得到的基于BERT的语言模型和步骤D预处理后的标注语料构建基于BERT-BiGRU-CRF的中文命名实体识别模型。模型如图3所示:
其中BERT模块与步骤B中一致,参数为步骤B中预训练所得。GRU(Gated recurrentunits)单元是特殊的循环神经网络单元,循环神经网络计算如下:
zt=σ(Wi*[ht-1,xt])
rt=σ(Wr*[ht-1,xt])
其中σ是sigmoid函数,·是点积。xt为时刻t的输入向量,ht是隐藏状态,也是输出向量,包含前面t时刻所有有效信息。zt是一个更新门,控制信息流入下一个时刻;rt是一个重置门,控制信息丢失;二者共同决定隐藏状态的输出。
CRF层能通过考虑标签之间的相邻关系获得全局最优标签序列,计算过程如下:
Pi=Wsh(t)+bs
其中s表示评估分数,W是转换矩阵,Wyi-1表示标签转移分数,Pi,yi表示该字符的第yi个标签的分数。根据评估分数计算序列x到标签y的概率为:
训练损失函数为:
本发明训练基于BERT-BiGRU-CRF的中文命名实体识别模型的模型参数时,将步骤D2中得到的数据和标签作为模型的输入,然后采用SGD(梯度下降法)或其他优化方法训练该模型的参数,训练中只更新BiGRU层和CRF层的参数,保持BERT参数不变,当模型产生的损失值满足设定要求或者达到最大迭代次数N时,则终止该模型的训练。
在本发明的一个可选实施例中,上述步骤F利用步骤E得到的基于BERT-BiGRU-CRF的中文命名实体识别模型对待识别数据进行处理,得到命名实体识别结果,具体为:
按照步骤D中方式只对原句进行预处理,将预处理输入到基于BERT-BiGRU-CRF的中文命名实体识别模型中,并采用维特比算法求出每句话最大可能的标注序列,将其作为命名实体识别结果。
本发明构建了BERT-BiGRU-CRF中文命名实体识别模型,通过BERT预训练语言模型增强字的语义表示,根据字的上下文动态生成语义向量,有效表征了字的多义性。提高了中文命名实体识别的精度,且与基于语言模型微调的方法相比减少了训练参数,节省了训练时间。
本发明能够更精确的对文本中的命名实体进行标注,为一些下游工作,比如:知识图谱、问答***、信息检索、机器翻译等,提供了一个良好的基础;同时既减少了许多数据标注的人力,又具备了较高的精确度。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (4)
1.一种基于BERT-BiGRU-CRF的中文命名实体识别方法,其特征在于,包括以下步骤:
步骤A、获取语言模型的训练语料数据并进行预处理,具体包括以下分步骤:
A1、将原始语料进行字符级切分;
A2、构建句子对正负样本,其中正样本表示句子对有上下文关系;负样本表示两个句子没有关系;
A3、对超过max_num_tokens的句子对进行截断;
A4、连接句子对,用[SEP]标签进行连接,句首置[CLS]标签,句末置[SEP]标签;
A5、随机遮住15%的单词;其中80%用masked token来代替,10%用随机的一个词来替换,10%保持这个词不变;
步骤B、根据步骤A预处理后的训练语料数据训练BERT语言模型包括Embedding层、双向Transformer编码器、输出层;
步骤C、获取命名实体识别模型的训练语料数据并进行标注,形成标注语料,
具体是对中文命名实体识别语料进行标注,采用BIO标注模式,其中B表示实体开始,I表示实体非开始部分,O表示不是实体的部分;
步骤D、对步骤C得到的标注语料进行预处理,具体包括以下分步骤:
D1、将原始语料进行字符级切分;
D2、句首置[CLS]标签,句末置[SEP]标签;对应标签也分别置为[CLS],[SEP]步骤E、根据步骤B得到的基于BERT的语言模型和步骤D预处理后的标注语料构建基于BERT-BiGRU-CRF的中文命名实体识别模型;
步骤F、利用步骤E得到的基于BERT-BiGRU-CRF的中文命名实体识别模型对待识别数据进行处理,得到命名实体识别结果。
2.如权利要求1所述的基于BERT-BiGRU-CRF的命名实体识别方法,其特征在于,所述步骤B还包括将步骤A5得到的训练语料变为定长,对长度不够的句子用[PAD]进行补齐,将定长语料输入BERT模型进行训练。
3.如权利要求2所述的基于BERT-BiGRU-CRF的命名实体识别方法,其特征在于,所述步骤E中BERT-BiGRU-CRF模型包括步骤B中训练好的BERT语言模型,通过BERT编码步骤D中预处理好的命名实体识别语料,输出每个字的上下文表示,然后将字向量序列输入BiGRU-CRF中进行训练。
4.如权利要求3所述的基于BERT-BiGRU-CRF的命名实体识别方法,其特征在于,所述步骤F利用步骤E得到的BERT-BiGRU-CRF模型对待识别数据进行处理,得到命名实体识别结果,具体为:
按照步骤D中的方式对待识别数据进行预处理,通过BERT-BiGRU-CRF预测实体标签,最后采用维特比算法求出每句话最大可能的标注序列,将其作为命名实体识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910302430.1A CN110083831B (zh) | 2019-04-16 | 2019-04-16 | 一种基于BERT-BiGRU-CRF的中文命名实体识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910302430.1A CN110083831B (zh) | 2019-04-16 | 2019-04-16 | 一种基于BERT-BiGRU-CRF的中文命名实体识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110083831A true CN110083831A (zh) | 2019-08-02 |
CN110083831B CN110083831B (zh) | 2023-04-18 |
Family
ID=67415213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910302430.1A Active CN110083831B (zh) | 2019-04-16 | 2019-04-16 | 一种基于BERT-BiGRU-CRF的中文命名实体识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110083831B (zh) |
Cited By (95)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489555A (zh) * | 2019-08-21 | 2019-11-22 | 创新工场(广州)人工智能研究有限公司 | 一种结合类词信息的语言模型预训练方法 |
CN110516256A (zh) * | 2019-08-30 | 2019-11-29 | 的卢技术有限公司 | 一种中文命名实体提取方法及其*** |
CN110569343A (zh) * | 2019-08-16 | 2019-12-13 | 华东理工大学 | 一种基于问答的临床文本结构化的方法 |
CN110674304A (zh) * | 2019-10-09 | 2020-01-10 | 北京明略软件***有限公司 | 实体消歧方法、装置、可读存储介质及电子设备 |
CN110674639A (zh) * | 2019-09-24 | 2020-01-10 | 拾音智能科技有限公司 | 一种基于预训练模型的自然语言理解方法 |
CN110705272A (zh) * | 2019-08-28 | 2020-01-17 | 昆明理工大学 | 一种面向汽车发动机故障诊断的命名实体识别方法 |
CN110717334A (zh) * | 2019-09-10 | 2020-01-21 | 上海理工大学 | 基于bert模型和双通道注意力的文本情感分析方法 |
CN110717331A (zh) * | 2019-10-21 | 2020-01-21 | 北京爱医博通信息技术有限公司 | 一种基于神经网络的中文命名实体识别方法、装置、设备以及存储介质 |
CN110781254A (zh) * | 2020-01-02 | 2020-02-11 | 四川大学 | 一种案情知识图谱自动构建方法及***及设备及介质 |
CN110825872A (zh) * | 2019-09-11 | 2020-02-21 | 成都数之联科技有限公司 | 一种提取和分类诉讼请求信息的方法及*** |
CN110879831A (zh) * | 2019-10-12 | 2020-03-13 | 杭州师范大学 | 基于实体识别技术的中医药语句分词方法 |
CN110888927A (zh) * | 2019-11-14 | 2020-03-17 | 东莞理工学院 | 简历信息抽取方法及*** |
CN110910243A (zh) * | 2019-09-26 | 2020-03-24 | 山东佳联电子商务有限公司 | 一种基于可重构大数据知识图谱技术的产权交易方法 |
CN110990549A (zh) * | 2019-12-02 | 2020-04-10 | 腾讯科技(深圳)有限公司 | 获取答案的方法、装置、电子设备及存储介质 |
CN111046180A (zh) * | 2019-12-05 | 2020-04-21 | 竹间智能科技(上海)有限公司 | 一种基于文本数据的标签识别方法 |
CN111062217A (zh) * | 2019-12-19 | 2020-04-24 | 江苏满运软件科技有限公司 | 语言信息的处理方法、装置、存储介质及电子设备 |
CN111078978A (zh) * | 2019-11-29 | 2020-04-28 | 上海观安信息技术股份有限公司 | 一种基于网站文本内容的网贷网站实体识别方法及*** |
CN111079447A (zh) * | 2020-03-23 | 2020-04-28 | 深圳智能思创科技有限公司 | 一种面向中文的预训练方法及*** |
CN111125371A (zh) * | 2019-12-13 | 2020-05-08 | 中国地质大学(武汉) | 一种基于深度学习的地质灾害文献知识图谱构建方法 |
CN111126068A (zh) * | 2019-12-25 | 2020-05-08 | 中电云脑(天津)科技有限公司 | 一种中文命名实体识别方法和装置及电子设备 |
CN111125331A (zh) * | 2019-12-20 | 2020-05-08 | 京东方科技集团股份有限公司 | 语义识别方法、装置、电子设备及计算机可读存储介质 |
CN111178047A (zh) * | 2019-12-24 | 2020-05-19 | 浙江大学 | 基于层次序列标注的古代医案处方抽取方法 |
CN111191453A (zh) * | 2019-12-25 | 2020-05-22 | 中国电子科技集团公司第十五研究所 | 一种基于对抗训练的命名实体识别方法 |
CN111191452A (zh) * | 2019-12-24 | 2020-05-22 | 中国铁道科学研究院集团有限公司电子计算技术研究所 | 一种铁路文本命名实体识别方法及装置 |
CN111222335A (zh) * | 2019-11-27 | 2020-06-02 | 上海眼控科技股份有限公司 | 语料修正方法、装置、计算机设备和计算机可读存储介质 |
CN111222337A (zh) * | 2020-01-08 | 2020-06-02 | 山东旗帜信息有限公司 | 一种实体识别模型的训练方法及装置 |
CN111310471A (zh) * | 2020-01-19 | 2020-06-19 | 陕西师范大学 | 一种基于bblc模型的旅游命名实体识别方法 |
CN111312356A (zh) * | 2020-01-17 | 2020-06-19 | 四川大学 | 一种基于bert和融入功效信息的中药处方生成方法 |
CN111325019A (zh) * | 2020-01-21 | 2020-06-23 | 国网北京市电力公司 | 词库的更新方法及装置、电子设备 |
CN111339779A (zh) * | 2020-03-20 | 2020-06-26 | 桂林电子科技大学 | 一种用于越南语的命名实体识别方法 |
CN111368551A (zh) * | 2020-02-14 | 2020-07-03 | 京东数字科技控股有限公司 | 一种确定事件主体的方法和装置 |
CN111401077A (zh) * | 2020-06-02 | 2020-07-10 | 腾讯科技(深圳)有限公司 | 语言模型的处理方法、装置和计算机设备 |
CN111444721A (zh) * | 2020-05-27 | 2020-07-24 | 南京大学 | 一种基于预训练语言模型的中文文本关键信息抽取方法 |
CN111460820A (zh) * | 2020-03-06 | 2020-07-28 | 中国科学院信息工程研究所 | 一种基于预训练模型bert的网络空间安全领域命名实体识别方法和装置 |
CN111489746A (zh) * | 2020-03-05 | 2020-08-04 | 国网浙江省电力有限公司 | 一种基于bert的电网调度语音识别语言模型构建方法 |
CN111523324A (zh) * | 2020-03-18 | 2020-08-11 | 大箴(杭州)科技有限公司 | 命名实体识别模型的训练方法及装置 |
CN111538809A (zh) * | 2020-04-20 | 2020-08-14 | 马上消费金融股份有限公司 | 一种语音服务质量检测方法、模型训练方法及装置 |
CN111597813A (zh) * | 2020-05-21 | 2020-08-28 | 上海创蓝文化传播有限公司 | 一种基于命名实体识别提取短信文本摘要的方法及装置 |
CN111626056A (zh) * | 2020-04-11 | 2020-09-04 | 中国人民解放军战略支援部队信息工程大学 | 基于RoBERTa-BiGRU-LAN模型的中文命名实体识别方法及装置 |
CN111651986A (zh) * | 2020-04-28 | 2020-09-11 | 银江股份有限公司 | 事件关键词提取方法、装置、设备及介质 |
CN111695356A (zh) * | 2020-05-28 | 2020-09-22 | 平安科技(深圳)有限公司 | 同义语料生成方法、装置、计算机***及可读存储介质 |
CN111708882A (zh) * | 2020-05-29 | 2020-09-25 | 西安理工大学 | 基于Transformer的中文文本信息缺失的补全方法 |
CN111709241A (zh) * | 2020-05-27 | 2020-09-25 | 西安交通大学 | 一种面向网络安全领域的命名实体识别方法 |
CN111738004A (zh) * | 2020-06-16 | 2020-10-02 | 中国科学院计算技术研究所 | 一种命名实体识别模型的训练方法及命名实体识别的方法 |
CN111737999A (zh) * | 2020-06-24 | 2020-10-02 | 深圳前海微众银行股份有限公司 | 一种序列标注方法、装置、设备及可读存储介质 |
CN111737383A (zh) * | 2020-05-21 | 2020-10-02 | 百度在线网络技术(北京)有限公司 | 提取地理位置点空间关系的方法、训练提取模型的方法及装置 |
CN111738015A (zh) * | 2020-06-22 | 2020-10-02 | 北京百度网讯科技有限公司 | 文章情感极性分析方法、装置、电子设备及存储介质 |
CN111798986A (zh) * | 2020-07-07 | 2020-10-20 | 云知声智能科技股份有限公司 | 一种数据增强的方法和设备 |
CN111832295A (zh) * | 2020-07-08 | 2020-10-27 | 昆明理工大学 | 基于bert预训练模型的刑事案件要素识别方法 |
CN111985239A (zh) * | 2020-07-31 | 2020-11-24 | 杭州远传新业科技有限公司 | 实体识别方法、装置、电子设备及存储介质 |
CN112036189A (zh) * | 2020-08-10 | 2020-12-04 | 中国人民大学 | 一种金文语义识别方法和*** |
CN112069320A (zh) * | 2020-09-10 | 2020-12-11 | 东北大学秦皇岛分校 | 一种基于跨度的细粒度情感分析方法 |
CN112101028A (zh) * | 2020-08-17 | 2020-12-18 | 淮阴工学院 | 一种多特征双向门控领域专家实体抽取方法及*** |
CN112131393A (zh) * | 2020-08-11 | 2020-12-25 | 淮阴工学院 | 一种基于bert和相似度算法的医疗知识图谱问答***构建方法 |
CN112149421A (zh) * | 2020-09-23 | 2020-12-29 | 云南师范大学 | 一种基于bert嵌入的软件编程领域实体识别方法 |
CN112256828A (zh) * | 2020-10-20 | 2021-01-22 | 平安科技(深圳)有限公司 | 医学实体关系抽取方法、装置、计算机设备及可读存储介质 |
CN112270193A (zh) * | 2020-11-02 | 2021-01-26 | 重庆邮电大学 | 基于bert-flat的中文命名实体识别方法 |
CN112417877A (zh) * | 2020-11-24 | 2021-02-26 | 广州平云信息科技有限公司 | 一种基于改进bert的文本蕴含关系识别方法 |
CN112463961A (zh) * | 2020-11-11 | 2021-03-09 | 上海昌投网络科技有限公司 | 一种基于深度语义算法的社群舆情红线检测方法 |
CN112487786A (zh) * | 2019-08-22 | 2021-03-12 | 创新工场(广州)人工智能研究有限公司 | 一种基于乱序重排的自然语言模型预训练方法及电子设备 |
CN112507102A (zh) * | 2020-12-18 | 2021-03-16 | 北京百度网讯科技有限公司 | 基于预训练范式模型的预测部署***、方法、装置及介质 |
CN112632985A (zh) * | 2020-12-18 | 2021-04-09 | 国网北京市电力公司 | 语料的处理方法、装置、存储介质及处理器 |
CN112686044A (zh) * | 2021-01-18 | 2021-04-20 | 华东理工大学 | 一种基于语言模型的医疗实体零样本分类方法 |
WO2021072852A1 (zh) * | 2019-10-16 | 2021-04-22 | 平安科技(深圳)有限公司 | 序列标注方法、***和计算机设备 |
CN112733541A (zh) * | 2021-01-06 | 2021-04-30 | 重庆邮电大学 | 基于注意力机制的BERT-BiGRU-IDCNN-CRF的命名实体识别方法 |
CN112802570A (zh) * | 2021-02-07 | 2021-05-14 | 成都延华西部健康医疗信息产业研究院有限公司 | 一种针对电子病历命名实体识别***及方法 |
CN112800768A (zh) * | 2021-02-03 | 2021-05-14 | 北京金山数字娱乐科技有限公司 | 一种嵌套命名实体识别模型的训练方法及装置 |
CN112989828A (zh) * | 2019-12-17 | 2021-06-18 | 医渡云(北京)技术有限公司 | 命名实体识别模型的训练方法、装置、介质及电子设备 |
CN113011126A (zh) * | 2021-03-11 | 2021-06-22 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、电子设备及计算机可读存储介质 |
CN113139382A (zh) * | 2020-01-20 | 2021-07-20 | 北京国双科技有限公司 | 命名实体识别方法及装置 |
CN113158671A (zh) * | 2021-03-25 | 2021-07-23 | 胡明昊 | 一种结合命名实体识别的开放域信息抽取方法 |
CN113157883A (zh) * | 2021-04-07 | 2021-07-23 | 浙江工贸职业技术学院 | 一种基于双模型结构的中文意见目标边界预测方法 |
CN113360751A (zh) * | 2020-03-06 | 2021-09-07 | 百度在线网络技术(北京)有限公司 | 意图识别方法、装置、设备和介质 |
CN113392641A (zh) * | 2020-10-26 | 2021-09-14 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、存储介质和设备 |
CN113408291A (zh) * | 2021-07-09 | 2021-09-17 | 平安国际智慧城市科技股份有限公司 | 中文实体识别模型的训练方法、装置、设备及存储介质 |
CN113488035A (zh) * | 2020-04-28 | 2021-10-08 | 海信集团有限公司 | 一种语音信息的处理方法、装置、设备及介质 |
CN113496122A (zh) * | 2020-04-08 | 2021-10-12 | 中移(上海)信息通信科技有限公司 | 命名实体识别方法、装置、设备及介质 |
CN113609861A (zh) * | 2021-08-10 | 2021-11-05 | 北京工商大学 | 基于食品文献数据的多维度特征命名实体识别方法及*** |
CN113642862A (zh) * | 2021-07-29 | 2021-11-12 | 国网江苏省电力有限公司 | 基于bert-mbigru-crf模型的电网调度指令命名实体识别方法及*** |
CN113641809A (zh) * | 2021-08-10 | 2021-11-12 | 中电鸿信信息科技有限公司 | 一种基于XLNet-BiGRU-CRF的智能问答方法 |
CN113688245A (zh) * | 2021-08-31 | 2021-11-23 | 中国平安人寿保险股份有限公司 | 基于人工智能的预训练语言模型的处理方法、装置及设备 |
CN113989810A (zh) * | 2021-10-29 | 2022-01-28 | 深圳前海环融联易信息科技服务有限公司 | 基于深度学习的招标文书项目名称识别方法 |
CN114282539A (zh) * | 2021-12-14 | 2022-04-05 | 重庆邮电大学 | 一种基于生物医学领域预训练模型的命名实体识别方法 |
CN114580422A (zh) * | 2022-03-14 | 2022-06-03 | 昆明理工大学 | 一种结合近邻分析的两阶段分类的命名实体识别方法 |
WO2022142011A1 (zh) * | 2020-12-30 | 2022-07-07 | 平安科技(深圳)有限公司 | 一种地址识别方法、装置、计算机设备及存储介质 |
CN115146630A (zh) * | 2022-06-08 | 2022-10-04 | 平安科技(深圳)有限公司 | 基于专业领域知识的分词方法、装置、设备及存储介质 |
CN115859983A (zh) * | 2022-12-14 | 2023-03-28 | 成都信息工程大学 | 一种细粒度中文命名实体识别方法 |
CN115859984A (zh) * | 2022-12-22 | 2023-03-28 | 北京壹永科技有限公司 | 医疗命名实体识别模型训练方法、装置、设备及介质 |
CN116010583A (zh) * | 2023-03-17 | 2023-04-25 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种级联耦合的知识增强对话生成方法 |
CN116451690A (zh) * | 2023-03-21 | 2023-07-18 | 麦博(上海)健康科技有限公司 | 一种医疗领域命名实体识别的方法 |
CN116682436A (zh) * | 2023-07-27 | 2023-09-01 | 成都大成均图科技有限公司 | 一种应急警情受理信息识别方法及装置 |
CN116720519A (zh) * | 2023-06-08 | 2023-09-08 | 吉首大学 | 一种苗医药命名实体识别方法 |
CN117010390A (zh) * | 2023-07-04 | 2023-11-07 | 北大荒信息有限公司 | 基于招标信息的公司实体识别方法、装置、设备及介质 |
CN118132737A (zh) * | 2024-05-08 | 2024-06-04 | 青岛国创智能家电研究院有限公司 | 基于饮食知识图谱的问答方法与计算机装置 |
CN117010390B (zh) * | 2023-07-04 | 2024-07-05 | 北大荒信息有限公司 | 基于招标信息的公司实体识别方法、装置、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180068661A1 (en) * | 2013-05-30 | 2018-03-08 | Promptu Systems Corporation | Systems and methods for adaptive proper name entity recognition and understanding |
CN109284400A (zh) * | 2018-11-28 | 2019-01-29 | 电子科技大学 | 一种基于Lattice LSTM和语言模型的命名实体识别方法 |
CN109388795A (zh) * | 2017-08-07 | 2019-02-26 | 芋头科技(杭州)有限公司 | 一种命名实体识别方法、语言识别方法及*** |
CN109522546A (zh) * | 2018-10-12 | 2019-03-26 | 浙江大学 | 基于上下文相关的医学命名实体识别方法 |
-
2019
- 2019-04-16 CN CN201910302430.1A patent/CN110083831B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180068661A1 (en) * | 2013-05-30 | 2018-03-08 | Promptu Systems Corporation | Systems and methods for adaptive proper name entity recognition and understanding |
CN109388795A (zh) * | 2017-08-07 | 2019-02-26 | 芋头科技(杭州)有限公司 | 一种命名实体识别方法、语言识别方法及*** |
CN109522546A (zh) * | 2018-10-12 | 2019-03-26 | 浙江大学 | 基于上下文相关的医学命名实体识别方法 |
CN109284400A (zh) * | 2018-11-28 | 2019-01-29 | 电子科技大学 | 一种基于Lattice LSTM和语言模型的命名实体识别方法 |
Non-Patent Citations (2)
Title |
---|
余传明等: "基于深度学习的词汇表示模型对比研究", 《数据分析与知识发现》 * |
李丽双: "基于CNN-BLSTM-CRF模型的生物医学命名实体识别", 《中文信息学报》 * |
Cited By (138)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110569343A (zh) * | 2019-08-16 | 2019-12-13 | 华东理工大学 | 一种基于问答的临床文本结构化的方法 |
CN110569343B (zh) * | 2019-08-16 | 2023-05-09 | 华东理工大学 | 一种基于问答的临床文本结构化方法 |
CN110489555A (zh) * | 2019-08-21 | 2019-11-22 | 创新工场(广州)人工智能研究有限公司 | 一种结合类词信息的语言模型预训练方法 |
CN110489555B (zh) * | 2019-08-21 | 2022-03-08 | 创新工场(广州)人工智能研究有限公司 | 一种结合类词信息的语言模型预训练方法 |
CN112487786A (zh) * | 2019-08-22 | 2021-03-12 | 创新工场(广州)人工智能研究有限公司 | 一种基于乱序重排的自然语言模型预训练方法及电子设备 |
CN110705272A (zh) * | 2019-08-28 | 2020-01-17 | 昆明理工大学 | 一种面向汽车发动机故障诊断的命名实体识别方法 |
CN110516256A (zh) * | 2019-08-30 | 2019-11-29 | 的卢技术有限公司 | 一种中文命名实体提取方法及其*** |
CN110717334A (zh) * | 2019-09-10 | 2020-01-21 | 上海理工大学 | 基于bert模型和双通道注意力的文本情感分析方法 |
CN110717334B (zh) * | 2019-09-10 | 2023-10-10 | 上海理工大学 | 基于bert模型和双通道注意力的文本情感分析方法 |
CN110825872A (zh) * | 2019-09-11 | 2020-02-21 | 成都数之联科技有限公司 | 一种提取和分类诉讼请求信息的方法及*** |
CN110674639A (zh) * | 2019-09-24 | 2020-01-10 | 拾音智能科技有限公司 | 一种基于预训练模型的自然语言理解方法 |
CN110674639B (zh) * | 2019-09-24 | 2022-12-09 | 识因智能科技有限公司 | 一种基于预训练模型的自然语言理解方法 |
CN110910243A (zh) * | 2019-09-26 | 2020-03-24 | 山东佳联电子商务有限公司 | 一种基于可重构大数据知识图谱技术的产权交易方法 |
CN110674304A (zh) * | 2019-10-09 | 2020-01-10 | 北京明略软件***有限公司 | 实体消歧方法、装置、可读存储介质及电子设备 |
CN110879831A (zh) * | 2019-10-12 | 2020-03-13 | 杭州师范大学 | 基于实体识别技术的中医药语句分词方法 |
WO2021072852A1 (zh) * | 2019-10-16 | 2021-04-22 | 平安科技(深圳)有限公司 | 序列标注方法、***和计算机设备 |
CN110717331A (zh) * | 2019-10-21 | 2020-01-21 | 北京爱医博通信息技术有限公司 | 一种基于神经网络的中文命名实体识别方法、装置、设备以及存储介质 |
CN110717331B (zh) * | 2019-10-21 | 2023-10-24 | 北京爱医博通信息技术有限公司 | 一种基于神经网络的中文命名实体识别方法、装置、设备以及存储介质 |
CN110888927B (zh) * | 2019-11-14 | 2023-04-18 | 东莞理工学院 | 简历信息抽取方法及*** |
CN110888927A (zh) * | 2019-11-14 | 2020-03-17 | 东莞理工学院 | 简历信息抽取方法及*** |
CN111222335A (zh) * | 2019-11-27 | 2020-06-02 | 上海眼控科技股份有限公司 | 语料修正方法、装置、计算机设备和计算机可读存储介质 |
CN111078978A (zh) * | 2019-11-29 | 2020-04-28 | 上海观安信息技术股份有限公司 | 一种基于网站文本内容的网贷网站实体识别方法及*** |
CN111078978B (zh) * | 2019-11-29 | 2024-02-27 | 上海观安信息技术股份有限公司 | 一种基于网站文本内容的网贷网站实体识别方法及*** |
CN110990549B (zh) * | 2019-12-02 | 2023-04-28 | 腾讯科技(深圳)有限公司 | 获取答案的方法、装置、电子设备及存储介质 |
CN110990549A (zh) * | 2019-12-02 | 2020-04-10 | 腾讯科技(深圳)有限公司 | 获取答案的方法、装置、电子设备及存储介质 |
CN111046180A (zh) * | 2019-12-05 | 2020-04-21 | 竹间智能科技(上海)有限公司 | 一种基于文本数据的标签识别方法 |
CN111125371A (zh) * | 2019-12-13 | 2020-05-08 | 中国地质大学(武汉) | 一种基于深度学习的地质灾害文献知识图谱构建方法 |
CN111125371B (zh) * | 2019-12-13 | 2023-06-20 | 中国地质大学(武汉) | 一种基于深度学习的地质灾害文献知识图谱构建方法 |
CN112989828A (zh) * | 2019-12-17 | 2021-06-18 | 医渡云(北京)技术有限公司 | 命名实体识别模型的训练方法、装置、介质及电子设备 |
CN111062217A (zh) * | 2019-12-19 | 2020-04-24 | 江苏满运软件科技有限公司 | 语言信息的处理方法、装置、存储介质及电子设备 |
CN111062217B (zh) * | 2019-12-19 | 2024-02-06 | 江苏满运软件科技有限公司 | 语言信息的处理方法、装置、存储介质及电子设备 |
CN111125331B (zh) * | 2019-12-20 | 2023-10-31 | 京东方科技集团股份有限公司 | 语义识别方法、装置、电子设备及计算机可读存储介质 |
CN111125331A (zh) * | 2019-12-20 | 2020-05-08 | 京东方科技集团股份有限公司 | 语义识别方法、装置、电子设备及计算机可读存储介质 |
CN111178047A (zh) * | 2019-12-24 | 2020-05-19 | 浙江大学 | 基于层次序列标注的古代医案处方抽取方法 |
CN111191452A (zh) * | 2019-12-24 | 2020-05-22 | 中国铁道科学研究院集团有限公司电子计算技术研究所 | 一种铁路文本命名实体识别方法及装置 |
CN111178047B (zh) * | 2019-12-24 | 2021-08-27 | 浙江大学 | 基于层次序列标注的古代医案处方抽取方法 |
CN111126068A (zh) * | 2019-12-25 | 2020-05-08 | 中电云脑(天津)科技有限公司 | 一种中文命名实体识别方法和装置及电子设备 |
CN111191453A (zh) * | 2019-12-25 | 2020-05-22 | 中国电子科技集团公司第十五研究所 | 一种基于对抗训练的命名实体识别方法 |
CN110781254A (zh) * | 2020-01-02 | 2020-02-11 | 四川大学 | 一种案情知识图谱自动构建方法及***及设备及介质 |
CN111222337A (zh) * | 2020-01-08 | 2020-06-02 | 山东旗帜信息有限公司 | 一种实体识别模型的训练方法及装置 |
CN111312356A (zh) * | 2020-01-17 | 2020-06-19 | 四川大学 | 一种基于bert和融入功效信息的中药处方生成方法 |
CN111312356B (zh) * | 2020-01-17 | 2022-07-01 | 四川大学 | 一种基于bert和融入功效信息的中药处方生成方法 |
CN111310471A (zh) * | 2020-01-19 | 2020-06-19 | 陕西师范大学 | 一种基于bblc模型的旅游命名实体识别方法 |
CN113139382A (zh) * | 2020-01-20 | 2021-07-20 | 北京国双科技有限公司 | 命名实体识别方法及装置 |
CN111325019A (zh) * | 2020-01-21 | 2020-06-23 | 国网北京市电力公司 | 词库的更新方法及装置、电子设备 |
CN111368551B (zh) * | 2020-02-14 | 2023-12-05 | 京东科技控股股份有限公司 | 一种确定事件主体的方法和装置 |
CN111368551A (zh) * | 2020-02-14 | 2020-07-03 | 京东数字科技控股有限公司 | 一种确定事件主体的方法和装置 |
CN111489746B (zh) * | 2020-03-05 | 2022-07-26 | 国网浙江省电力有限公司 | 一种基于bert的电网调度语音识别语言模型构建方法 |
CN111489746A (zh) * | 2020-03-05 | 2020-08-04 | 国网浙江省电力有限公司 | 一种基于bert的电网调度语音识别语言模型构建方法 |
CN113360751A (zh) * | 2020-03-06 | 2021-09-07 | 百度在线网络技术(北京)有限公司 | 意图识别方法、装置、设备和介质 |
CN111460820A (zh) * | 2020-03-06 | 2020-07-28 | 中国科学院信息工程研究所 | 一种基于预训练模型bert的网络空间安全领域命名实体识别方法和装置 |
CN111523324B (zh) * | 2020-03-18 | 2024-01-26 | 大箴(杭州)科技有限公司 | 命名实体识别模型的训练方法及装置 |
CN111523324A (zh) * | 2020-03-18 | 2020-08-11 | 大箴(杭州)科技有限公司 | 命名实体识别模型的训练方法及装置 |
CN111339779A (zh) * | 2020-03-20 | 2020-06-26 | 桂林电子科技大学 | 一种用于越南语的命名实体识别方法 |
CN111079447A (zh) * | 2020-03-23 | 2020-04-28 | 深圳智能思创科技有限公司 | 一种面向中文的预训练方法及*** |
CN113496122A (zh) * | 2020-04-08 | 2021-10-12 | 中移(上海)信息通信科技有限公司 | 命名实体识别方法、装置、设备及介质 |
CN111626056B (zh) * | 2020-04-11 | 2023-04-07 | 中国人民解放军战略支援部队信息工程大学 | 基于RoBERTa-BiGRU-LAN模型的中文命名实体识别方法及装置 |
CN111626056A (zh) * | 2020-04-11 | 2020-09-04 | 中国人民解放军战略支援部队信息工程大学 | 基于RoBERTa-BiGRU-LAN模型的中文命名实体识别方法及装置 |
CN111538809A (zh) * | 2020-04-20 | 2020-08-14 | 马上消费金融股份有限公司 | 一种语音服务质量检测方法、模型训练方法及装置 |
CN113488035A (zh) * | 2020-04-28 | 2021-10-08 | 海信集团有限公司 | 一种语音信息的处理方法、装置、设备及介质 |
CN111651986B (zh) * | 2020-04-28 | 2024-04-02 | 银江技术股份有限公司 | 事件关键词提取方法、装置、设备及介质 |
CN111651986A (zh) * | 2020-04-28 | 2020-09-11 | 银江股份有限公司 | 事件关键词提取方法、装置、设备及介质 |
CN111737383A (zh) * | 2020-05-21 | 2020-10-02 | 百度在线网络技术(北京)有限公司 | 提取地理位置点空间关系的方法、训练提取模型的方法及装置 |
CN111597813A (zh) * | 2020-05-21 | 2020-08-28 | 上海创蓝文化传播有限公司 | 一种基于命名实体识别提取短信文本摘要的方法及装置 |
CN111737383B (zh) * | 2020-05-21 | 2021-11-23 | 百度在线网络技术(北京)有限公司 | 提取地理位置点空间关系的方法、训练提取模型的方法及装置 |
CN111709241A (zh) * | 2020-05-27 | 2020-09-25 | 西安交通大学 | 一种面向网络安全领域的命名实体识别方法 |
CN111444721B (zh) * | 2020-05-27 | 2022-09-23 | 南京大学 | 一种基于预训练语言模型的中文文本关键信息抽取方法 |
CN111709241B (zh) * | 2020-05-27 | 2023-03-28 | 西安交通大学 | 一种面向网络安全领域的命名实体识别方法 |
CN111444721A (zh) * | 2020-05-27 | 2020-07-24 | 南京大学 | 一种基于预训练语言模型的中文文本关键信息抽取方法 |
CN111695356A (zh) * | 2020-05-28 | 2020-09-22 | 平安科技(深圳)有限公司 | 同义语料生成方法、装置、计算机***及可读存储介质 |
CN111708882A (zh) * | 2020-05-29 | 2020-09-25 | 西安理工大学 | 基于Transformer的中文文本信息缺失的补全方法 |
CN111708882B (zh) * | 2020-05-29 | 2022-09-30 | 西安理工大学 | 基于Transformer的中文文本信息缺失的补全方法 |
CN111401077A (zh) * | 2020-06-02 | 2020-07-10 | 腾讯科技(深圳)有限公司 | 语言模型的处理方法、装置和计算机设备 |
CN111401077B (zh) * | 2020-06-02 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 语言模型的处理方法、装置和计算机设备 |
CN111738004B (zh) * | 2020-06-16 | 2023-10-27 | 中国科学院计算技术研究所 | 一种命名实体识别模型的训练方法及命名实体识别的方法 |
CN111738004A (zh) * | 2020-06-16 | 2020-10-02 | 中国科学院计算技术研究所 | 一种命名实体识别模型的训练方法及命名实体识别的方法 |
CN111738015B (zh) * | 2020-06-22 | 2024-04-12 | 北京百度网讯科技有限公司 | 文章情感极性分析方法、装置、电子设备及存储介质 |
CN111738015A (zh) * | 2020-06-22 | 2020-10-02 | 北京百度网讯科技有限公司 | 文章情感极性分析方法、装置、电子设备及存储介质 |
CN111737999A (zh) * | 2020-06-24 | 2020-10-02 | 深圳前海微众银行股份有限公司 | 一种序列标注方法、装置、设备及可读存储介质 |
CN111798986B (zh) * | 2020-07-07 | 2023-11-03 | 云知声智能科技股份有限公司 | 一种数据增强的方法和设备 |
CN111798986A (zh) * | 2020-07-07 | 2020-10-20 | 云知声智能科技股份有限公司 | 一种数据增强的方法和设备 |
CN111832295A (zh) * | 2020-07-08 | 2020-10-27 | 昆明理工大学 | 基于bert预训练模型的刑事案件要素识别方法 |
CN111985239A (zh) * | 2020-07-31 | 2020-11-24 | 杭州远传新业科技有限公司 | 实体识别方法、装置、电子设备及存储介质 |
CN111985239B (zh) * | 2020-07-31 | 2024-04-26 | 杭州远传新业科技股份有限公司 | 实体识别方法、装置、电子设备及存储介质 |
CN112036189A (zh) * | 2020-08-10 | 2020-12-04 | 中国人民大学 | 一种金文语义识别方法和*** |
CN112131393A (zh) * | 2020-08-11 | 2020-12-25 | 淮阴工学院 | 一种基于bert和相似度算法的医疗知识图谱问答***构建方法 |
CN112131393B (zh) * | 2020-08-11 | 2023-09-22 | 淮阴工学院 | 一种基于bert和相似度算法的医疗知识图谱问答***构建方法 |
CN112101028A (zh) * | 2020-08-17 | 2020-12-18 | 淮阴工学院 | 一种多特征双向门控领域专家实体抽取方法及*** |
CN112101028B (zh) * | 2020-08-17 | 2022-08-26 | 淮阴工学院 | 一种多特征双向门控领域专家实体抽取方法及*** |
CN112069320B (zh) * | 2020-09-10 | 2022-06-28 | 东北大学秦皇岛分校 | 一种基于跨度的细粒度情感分析方法 |
CN112069320A (zh) * | 2020-09-10 | 2020-12-11 | 东北大学秦皇岛分校 | 一种基于跨度的细粒度情感分析方法 |
CN112149421A (zh) * | 2020-09-23 | 2020-12-29 | 云南师范大学 | 一种基于bert嵌入的软件编程领域实体识别方法 |
CN112256828A (zh) * | 2020-10-20 | 2021-01-22 | 平安科技(深圳)有限公司 | 医学实体关系抽取方法、装置、计算机设备及可读存储介质 |
CN112256828B (zh) * | 2020-10-20 | 2023-08-08 | 平安科技(深圳)有限公司 | 医学实体关系抽取方法、装置、计算机设备及可读存储介质 |
CN113392641A (zh) * | 2020-10-26 | 2021-09-14 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、存储介质和设备 |
CN112270193A (zh) * | 2020-11-02 | 2021-01-26 | 重庆邮电大学 | 基于bert-flat的中文命名实体识别方法 |
CN112463961A (zh) * | 2020-11-11 | 2021-03-09 | 上海昌投网络科技有限公司 | 一种基于深度语义算法的社群舆情红线检测方法 |
CN112417877B (zh) * | 2020-11-24 | 2022-09-27 | 广州平云信息科技有限公司 | 一种基于改进bert的文本蕴含关系识别方法 |
CN112417877A (zh) * | 2020-11-24 | 2021-02-26 | 广州平云信息科技有限公司 | 一种基于改进bert的文本蕴含关系识别方法 |
CN112632985A (zh) * | 2020-12-18 | 2021-04-09 | 国网北京市电力公司 | 语料的处理方法、装置、存储介质及处理器 |
CN112507102A (zh) * | 2020-12-18 | 2021-03-16 | 北京百度网讯科技有限公司 | 基于预训练范式模型的预测部署***、方法、装置及介质 |
CN112507102B (zh) * | 2020-12-18 | 2022-04-29 | 北京百度网讯科技有限公司 | 基于预训练范式模型的预测部署***、方法、装置及介质 |
WO2022142011A1 (zh) * | 2020-12-30 | 2022-07-07 | 平安科技(深圳)有限公司 | 一种地址识别方法、装置、计算机设备及存储介质 |
CN112733541A (zh) * | 2021-01-06 | 2021-04-30 | 重庆邮电大学 | 基于注意力机制的BERT-BiGRU-IDCNN-CRF的命名实体识别方法 |
CN112686044A (zh) * | 2021-01-18 | 2021-04-20 | 华东理工大学 | 一种基于语言模型的医疗实体零样本分类方法 |
CN112800768A (zh) * | 2021-02-03 | 2021-05-14 | 北京金山数字娱乐科技有限公司 | 一种嵌套命名实体识别模型的训练方法及装置 |
CN112802570A (zh) * | 2021-02-07 | 2021-05-14 | 成都延华西部健康医疗信息产业研究院有限公司 | 一种针对电子病历命名实体识别***及方法 |
CN113011126B (zh) * | 2021-03-11 | 2023-06-30 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、电子设备及计算机可读存储介质 |
CN113011126A (zh) * | 2021-03-11 | 2021-06-22 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、电子设备及计算机可读存储介质 |
CN113158671A (zh) * | 2021-03-25 | 2021-07-23 | 胡明昊 | 一种结合命名实体识别的开放域信息抽取方法 |
CN113158671B (zh) * | 2021-03-25 | 2023-08-11 | 胡明昊 | 一种结合命名实体识别的开放域信息抽取方法 |
CN113157883A (zh) * | 2021-04-07 | 2021-07-23 | 浙江工贸职业技术学院 | 一种基于双模型结构的中文意见目标边界预测方法 |
CN113408291A (zh) * | 2021-07-09 | 2021-09-17 | 平安国际智慧城市科技股份有限公司 | 中文实体识别模型的训练方法、装置、设备及存储介质 |
CN113642862A (zh) * | 2021-07-29 | 2021-11-12 | 国网江苏省电力有限公司 | 基于bert-mbigru-crf模型的电网调度指令命名实体识别方法及*** |
CN113609861B (zh) * | 2021-08-10 | 2024-02-23 | 北京工商大学 | 基于食品文献数据的多维度特征命名实体识别方法及*** |
CN113641809A (zh) * | 2021-08-10 | 2021-11-12 | 中电鸿信信息科技有限公司 | 一种基于XLNet-BiGRU-CRF的智能问答方法 |
CN113609861A (zh) * | 2021-08-10 | 2021-11-05 | 北京工商大学 | 基于食品文献数据的多维度特征命名实体识别方法及*** |
CN113641809B (zh) * | 2021-08-10 | 2023-12-08 | 中电鸿信信息科技有限公司 | 一种基于XLNet模型与知识图谱的智能问答方法 |
CN113688245B (zh) * | 2021-08-31 | 2023-09-26 | 中国平安人寿保险股份有限公司 | 基于人工智能的预训练语言模型的处理方法、装置及设备 |
CN113688245A (zh) * | 2021-08-31 | 2021-11-23 | 中国平安人寿保险股份有限公司 | 基于人工智能的预训练语言模型的处理方法、装置及设备 |
CN113989810A (zh) * | 2021-10-29 | 2022-01-28 | 深圳前海环融联易信息科技服务有限公司 | 基于深度学习的招标文书项目名称识别方法 |
CN114282539A (zh) * | 2021-12-14 | 2022-04-05 | 重庆邮电大学 | 一种基于生物医学领域预训练模型的命名实体识别方法 |
CN114580422A (zh) * | 2022-03-14 | 2022-06-03 | 昆明理工大学 | 一种结合近邻分析的两阶段分类的命名实体识别方法 |
CN115146630B (zh) * | 2022-06-08 | 2023-05-30 | 平安科技(深圳)有限公司 | 基于专业领域知识的分词方法、装置、设备及存储介质 |
CN115146630A (zh) * | 2022-06-08 | 2022-10-04 | 平安科技(深圳)有限公司 | 基于专业领域知识的分词方法、装置、设备及存储介质 |
CN115859983A (zh) * | 2022-12-14 | 2023-03-28 | 成都信息工程大学 | 一种细粒度中文命名实体识别方法 |
CN115859983B (zh) * | 2022-12-14 | 2023-08-25 | 成都信息工程大学 | 一种细粒度中文命名实体识别方法 |
CN115859984B (zh) * | 2022-12-22 | 2024-01-23 | 北京壹永科技有限公司 | 医疗命名实体识别模型训练方法、装置、设备及介质 |
CN115859984A (zh) * | 2022-12-22 | 2023-03-28 | 北京壹永科技有限公司 | 医疗命名实体识别模型训练方法、装置、设备及介质 |
CN116010583A (zh) * | 2023-03-17 | 2023-04-25 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种级联耦合的知识增强对话生成方法 |
CN116010583B (zh) * | 2023-03-17 | 2023-07-18 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种级联耦合的知识增强对话生成方法 |
CN116451690A (zh) * | 2023-03-21 | 2023-07-18 | 麦博(上海)健康科技有限公司 | 一种医疗领域命名实体识别的方法 |
CN116720519B (zh) * | 2023-06-08 | 2023-12-19 | 吉首大学 | 一种苗医药命名实体识别方法 |
CN116720519A (zh) * | 2023-06-08 | 2023-09-08 | 吉首大学 | 一种苗医药命名实体识别方法 |
CN117010390A (zh) * | 2023-07-04 | 2023-11-07 | 北大荒信息有限公司 | 基于招标信息的公司实体识别方法、装置、设备及介质 |
CN117010390B (zh) * | 2023-07-04 | 2024-07-05 | 北大荒信息有限公司 | 基于招标信息的公司实体识别方法、装置、设备及介质 |
CN116682436A (zh) * | 2023-07-27 | 2023-09-01 | 成都大成均图科技有限公司 | 一种应急警情受理信息识别方法及装置 |
CN118132737A (zh) * | 2024-05-08 | 2024-06-04 | 青岛国创智能家电研究院有限公司 | 基于饮食知识图谱的问答方法与计算机装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110083831B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110083831A (zh) | 一种基于BERT-BiGRU-CRF的中文命名实体识别方法 | |
CN111444726B (zh) | 基于双向格子结构的长短时记忆网络的中文语义信息提取方法和装置 | |
CN112632997A (zh) | 基于BERT和Word2Vec向量融合的中文实体识别方法 | |
CN111931506B (zh) | 一种基于图信息增强的实体关系抽取方法 | |
CN109284400A (zh) | 一种基于Lattice LSTM和语言模型的命名实体识别方法 | |
CN111339750B (zh) | 去除停用语并预测句子边界的口语文本处理方法 | |
CN109918681B (zh) | 一种基于汉字-拼音的融合问题语义匹配方法 | |
CN111709242B (zh) | 一种基于命名实体识别的中文标点符号添加方法 | |
CN110334354A (zh) | 一种中文关系抽取方法 | |
CN107797987B (zh) | 一种基于Bi-LSTM-CNN的混合语料命名实体识别方法 | |
CN115292463B (zh) | 一种基于信息抽取的联合多意图检测和重叠槽填充的方法 | |
CN114153971B (zh) | 一种含错中文文本纠错识别分类设备 | |
CN112784604A (zh) | 一种基于实体边界网络的实体链接方法 | |
CN114492441A (zh) | 基于机器阅读理解的BiLSTM-BiDAF命名实体识别方法 | |
CN114818717A (zh) | 融合词汇和句法信息的中文命名实体识别方法及*** | |
CN114757184B (zh) | 实现航空领域知识问答的方法和*** | |
CN110134950A (zh) | 一种字词结合的文本自动校对方法 | |
CN113377897A (zh) | 基于深度对抗学习的多语言医疗术语规范标准化***及方法 | |
CN116432645A (zh) | 一种基于预训练模型的交通事故命名实体识别方法 | |
CN115600597A (zh) | 基于注意力机制和词内语义融合的命名实体识别方法、装置、***及存储介质 | |
CN115169349A (zh) | 基于albert的中文电子简历命名实体识别方法 | |
CN115238693A (zh) | 一种基于多分词和多层双向长短期记忆的中文命名实体识别方法 | |
CN107992468A (zh) | 一种基于lstm的混合语料命名实体识别方法 | |
CN112307756A (zh) | 基于Bi-LSTM和字词融合的汉语分词方法 | |
CN109117471A (zh) | 一种词语相关度的计算方法及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |