CN116579343B - 一种中文文旅类的命名实体识别方法 - Google Patents

一种中文文旅类的命名实体识别方法 Download PDF

Info

Publication number
CN116579343B
CN116579343B CN202310560194.XA CN202310560194A CN116579343B CN 116579343 B CN116579343 B CN 116579343B CN 202310560194 A CN202310560194 A CN 202310560194A CN 116579343 B CN116579343 B CN 116579343B
Authority
CN
China
Prior art keywords
representation
chinese
inputting
chinese text
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310560194.XA
Other languages
English (en)
Other versions
CN116579343A (zh
Inventor
秦智
杜自豪
刘恩洋
张仕斌
昌燕
胡贵强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu University of Information Technology
Original Assignee
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu University of Information Technology filed Critical Chengdu University of Information Technology
Priority to CN202310560194.XA priority Critical patent/CN116579343B/zh
Publication of CN116579343A publication Critical patent/CN116579343A/zh
Application granted granted Critical
Publication of CN116579343B publication Critical patent/CN116579343B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种中文文旅类的命名实体识别方法,包括以下步骤:S1、获取中文文旅类文本数据,并将其输入至字符嵌入层,得到字符向量表示;S2、将字符向量表示输入至双向长短期记忆网络层,得到上下文表示;S3、将上下文表示输入至CNN层,得到多尺度的局部上下文特征融合表示;S4、将多尺度的局部上下文特征融合表示输入至CRF层,通过CRF层进行序列标注,完成中文文旅类的命名实体识别。本发明考虑到对中文旅游类的命名实体识别研究的关注度较少的问题,针对于中文的文旅类文本数据进行网络搭建,在CNN层利用第二CNN模块学习多尺度的局部上下文特征融合表示,加强语义之间的相关性,提高有利于中文识别的特征表示。

Description

一种中文文旅类的命名实体识别方法
技术领域
本发明属于信息提取技术领域,具体涉及一种中文文旅类的命名实体识别方法。
背景技术
命名实体识别(NER)是一项基本的信息提取任务,在自然语言处理(NLP)中能应用于许多下游任务,如信息抽取、社交媒体分析、搜素引擎、机器翻译、知识图谱。NER的目标是从句子中提取一些预定义的特定实体,并识别它们的正确类型,如人、地点、组织。早期的命名实体识别分为两类:基于规则的方法和基于统计的方法。随着深度学习的日渐强大,NER的研究取得了非常大的进步。涉及的领域多种多样:如医疗领域、金融领域、新闻领域等。但文旅类的命名实体识别的研究非常的稀缺,文旅类的命名实体识别的研究却没有受到关注。
根据语言之间的差异,关于特定语言的NER方法的研究也很多,如英语、***语、印度语和其他语言,许多研究者主要集中于英文NER的研究。但中文身为一个重要的国际通用语言,在与英文相比,中文有它自己本身的特点,但对于中文NER的研究却相对英文NER来说却少很多,而且很多关于中文NER的研究都没有根据中文的特点做出针对性的研究。
发明内容
针对现有技术中的上述不足,本发明提供的一种中文文旅类的命名实体识别方法解决了目前的命名实体识别研究对中文文旅类的关注度较少的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种中文文旅类的命名实体识别方法,包括以下步骤:
S1、获取中文文旅类文本数据,并将其输入至字符嵌入层,得到字符向量表示;
S2、将字符向量表示输入至双向长短期记忆网络层,得到上下文表示;
S3、将上下文表示输入至CNN层,得到多尺度的局部上下文特征融合表示;
S4、将多尺度的局部上下文特征融合表示输入至CRF层,通过CRF层进行序列标注,完成中文文旅类的命名实体识别。
进一步地:所述S1中,字符嵌入层包括并行的ChineseBert模块和第一CNN模块;
所述S1包括以下分步骤:
S11、获取中文文旅类文本数据;
S12、将中文文旅类文本数据输入至ChineseBert模块,得到中文文旅类文本数据中每个字的字嵌入向量表示;
S13、将中文文旅类文本数据输入至第一CNN模块,得到部首级嵌入表示;
S14、将字嵌入向量表示与部首级嵌入表示进行拼接,得到字符向量表示。
进一步地:所述S12具体为:
将中文文旅类文本数据输入至ChineseBert模块,通过ChineseBert模块对输入的中文文旅类文本数据进行编码表示,得到特征向量,根据特征向量生成中文文旅类文本数据中每个字的字嵌入向量表示;
其中,所述特征向量包括标记嵌入、位置嵌入和分段嵌入。
进一步地:所述S13中,得到部首级嵌入表示M2的表达式具体为:
M2=A1(b1+C1(x))
式中,x为汉字部首级特征,C1(·)为第一CNN模块,A1为第一激活函数,b1为第一CNN模块的偏重。
进一步地:所述S14中,得到字符向量表示Zconcat的表达式具体为:
Zconcat=M1+M2
式中,M1为字嵌入向量表示。
上述进一步方案的有益效果为:经过字嵌入向量表示和部首级嵌入表示拼接得到的字符向量表示能够得到更多的语义特征,使得模型更好的识别文本中的中文含义。
进一步地:所述S2中,双向长短期记忆网络层包括第一~第十二LSTM单元,所述第一~第六LSTM单元正向处理输入的字符向量表示,所述第七~第十二LSTM单元反向处理输入的字符向量表示;
得到上下文表示的方法具体为:
根据第一~第十二LSTM单元的输出结果进行拼接,得到上下文表示。进一步地:
进一步地:所述S2中,得到上下文表示H的表达式具体为:
H={h1,...,hti,...,hD}
式中,hti为第一~第十二LSTM单元的输出结果进行拼接,ti为拼接的序号,且ti=1,…,D,D为字符向量表示的维度;
所述第一~第十二LSTM单元均包括输入门it、输出门ot和遗忘门ft,其表达式具体为下式:
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc)
ot=σ(Wxoxt+Whoht-1+Wcoct+bo)
ht=ot⊙tanh(ct)
式中,σ(·)为逐元的sigmoid函数,tanh(·)为双曲切线函数,⊙为逐元相乘函数,Wxi、Whi、Wci、Wxf、Whf、Wcf、Wxc、Whc、Wxo、Who和Wco均为权重参数,bi、bf、bc和bo均为偏重参数,ct为记忆细胞,ht为输出结果。
进一步地:所述S3中,CNN层设置有第二CNN模块,得到多尺度的局部上下文特征融合表示M3的表达式具体为:
M3=A2(b2+C2(H))
式中,H为下文表示,C2(·)为第二CNN模块,A2为第二激活函数,b2为第二CNN模块的偏重。
上述进一步方案的有益效果为:将上下文表示输入至第二CNN模块,能够加强语义之间的相关性,生成多尺度的局部上下文特征融合表示。
本发明的有益效果为:本发明提供的一种中文文旅类的命名实体识别方法解决了对中文旅游类的命名实体识别研究的关注度较少的问题,针对于中文的文旅类文本数据进行网络搭建,在字符嵌入层利用第一CNN模块学习基于中文的部首级嵌入表示,得到有利于中文识别的字符向量表示,在CNN层利用第二CNN模块学习多尺度的局部上下文特征融合表示,加强语义之间的相关性,进一步提高有利于中文识别的特征表示。
附图说明
图1为本发明的一种中文文旅类的命名实体识别方法流程图。
图2为本发明整体的网络结构示意图。
图3为本发明的ChineseBert模块的结构示意图。
图4为本发明的第一CNN模块的结构示意图。
图5为本发明的第二CNN模块的结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,在本发明的一个实施例中,一种中文文旅类的命名实体识别方法,包括以下步骤:
S1、获取中文文旅类文本数据,并将其输入至字符嵌入层,得到字符向量表示;
S2、将字符向量表示输入至双向长短期记忆网络层,得到上下文表示;
S3、将上下文表示输入至CNN层,得到多尺度的局部上下文特征融合表示;
S4、将多尺度的局部上下文特征融合表示输入至CRF层,通过CRF层进行序列标注,完成中文文旅类的命名实体识别。
在本实施例中,本发明提供一种针对中文汉字特点且适用领域为文旅类数据的基于部首级特征和多尺度的局部上下文特征融合表示的中文文旅的命名实体识别方法,网络的具体结构如图2所示。
所述S1中,字符嵌入层包括并行的ChineseBert模块和第一CNN模块;
所述S1包括以下分步骤:
S11、获取中文文旅类文本数据;
S12、将中文文旅类文本数据输入至ChineseBert模块,得到中文文旅类文本数据中每个字的字嵌入向量表示;
S13、将中文文旅类文本数据输入至第一CNN模块,得到部首级嵌入表示;
S14、将字嵌入向量表示与部首级嵌入表示进行拼接,得到字符向量表示。
在本实施例中,ChineseBert模块的结构如图3所示,ChineseBert模块是通过中文语料预训练得到的预训练模型,专门针对于中文的文本数据进行处理。
所述S12具体为:
将中文文旅类文本数据输入至ChineseBert模块,通过ChineseBert模块对输入的中文文旅类文本数据进行编码表示,得到特征向量,根据特征向量生成中文文旅类文本数据中每个字的字嵌入向量表示;
其中,所述特征向量包括标记嵌入、位置嵌入和分段嵌入。
所述S13中,得到部首级嵌入表示M2的表达式具体为:
M2=A1(b1+C1(x))
式中,x为汉字部首级特征,C1(·)为第一CNN模块,A1为第一激活函数,b1为第一CNN模块的偏重。
在本实施例中,利用CNN对输入的中文文旅类文本数据进行部首级嵌入表示Radical-level Representation,得到部首级嵌入表示,其中第一CNN模块对输入数据进行Radical Representaion的结构示意图如图4所示。
所述S14中,得到字符向量表示Zconcat的表达式具体为:
Zconcat=M1+M2
式中,M1为字嵌入向量表示。
经过字嵌入向量表示和部首级嵌入表示拼接得到的字符向量表示能够得到更多的语义特征,使得模型更好的识别文本中的中文含义。
所述S2中,双向长短期记忆网络层包括第一~第十二LSTM单元,所述第一~第六LSTM单元正向处理输入的字符向量表示,所述第七~第十二LSTM单元反向处理输入的字符向量表示;
得到上下文表示的方法具体为:
根据第一~第十二LSTM单元的输出结果进行拼接,得到上下文表示。
在本实施例中,双向长短期记忆网络层得到上下文表示块能够从正反两个方向提升语义表示,能够更好的识别段落中的语义。
所述S2中,得到上下文表示H的表达式具体为:
H={h1,...,hti,...,hD}
式中,hti为第一~第十二LSTM单元的输出结果进行拼接,ti为拼接的序号,且ti=1,…,D,D为字符向量表示的维度;
所述第一~第十二LSTM单元均包括输入门it、输出门ot和遗忘门ft,其表达式具体为下式:
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc)
ot=σ(Wxoxt+Whoht-1+Wcoct+bo)
ht=ot⊙tanh(ct)
式中,σ(·)为逐元的sigmoid函数,tanh(·)为双曲切线函数,⊙为逐元相乘函数,Wxi、Whi、Wci、Wxf、Whf、Wcf、Wxc、Whc、Wxo、Who和Wco均为权重参数,bi、bf、bc和bo均为偏重参数,ct为记忆细胞,ht为输出结果。
所述S3中,CNN层设置有第二CNN模块,得到多尺度的局部上下文特征融合表示M3的表达式具体为:
M3=A2(b2+C2(H))
式中,H为下文表示,C2(·)为第二CNN模块,A2为第二激活函数,b2为第二CNN模块的偏重。
在本实施例中,第二CNN模块的结构如图5所示,将上下文表示输入至第二CNN模块,能够加强语义之间的相关性,生成多尺度的局部上下文特征融合表示。
将多尺度的局部上下文特征融合表示输入至CRF层,完成序列标注的任务进而完成中文文旅类的命名实体识别。
本发明的有益效果为:本发明提供的一种中文文旅类的命名实体识别方法解决了对中文旅游类的命名实体识别研究的关注度较少的问题,针对于中文的文旅类文本数据进行网络搭建,在字符嵌入层利用第一CNN模块学习基于中文的部首级嵌入表示,得到有利于中文识别的字符向量表示,在CNN层利用第二CNN模块学习多尺度的局部上下文特征融合表示,加强语义之间的相关性,进一步提高有利于中文识别的特征表示。
在本发明的描述中,需要理解的是,术语“中心”、“厚度”、“上”、“下”、“水平”、“顶”、“底”、“内”、“外”、“径向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或隐含指明的技术特征的数量。因此,限定由“第一”、“第二”、“第三”的特征可以明示或隐含地包括一个或者更多个该特征。

Claims (3)

1.一种中文文旅类的命名实体识别方法,其特征在于,包括以下步骤:
S1、获取中文文旅类文本数据,并将其输入至字符嵌入层,得到字符向量表示;
S2、将字符向量表示输入至双向长短期记忆网络层,得到上下文表示;
S3、将上下文表示输入至CNN层,得到多尺度的局部上下文特征融合表示;
S4、将多尺度的局部上下文特征融合表示输入至CRF层,通过CRF层进行序列标注,完成中文文旅类的命名实体识别;
所述S1中,字符嵌入层包括并行的ChineseBert模块和第一CNN模块;
所述S1包括以下分步骤:
S11、获取中文文旅类文本数据;
S12、将中文文旅类文本数据输入至ChineseBert模块,得到中文文旅类文本数据中每个字的字嵌入向量表示;
S13、将中文文旅类文本数据输入至第一CNN模块,得到部首级嵌入表示;
S14、将字嵌入向量表示与部首级嵌入表示进行拼接,得到字符向量表示;
所述S2中,双向长短期记忆网络层包括第一~第十二LSTM单元,所述第一~第六LSTM单元正向处理输入的字符向量表示,第七~第十二LSTM单元反向处理输入的字符向量表示;
得到上下文表示的方法具体为:
根据第一~第十二LSTM单元的输出结果进行拼接,得到上下文表示;
所述S13中,得到部首级嵌入表示M2的表达式具体为:
M2=A1(b1+C1(x))
式中,x为汉字部首级特征,C1(·)为第一CNN模块,A1为第一激活函数,b1为第一CNN模块的偏重;
所述S14中,得到字符向量表示Zconcat的表达式具体为:
Zconcat=M1+M2
式中,M1为字嵌入向量表示;
所述S3中,CNN层设置有第二CNN模块,得到多尺度的局部上下文特征融合表示M3的表达式具体为:
M3=A2(b2+C2(H))
式中,H为下文表示,C2(·)为第二CNN模块,A2为第二激活函数,b2为第二CNN模块的偏重。
2.根据权利要求1所述的中文文旅类的命名实体识别方法,其特征在于,所述S12具体为:
将中文文旅类文本数据输入至ChineseBert模块,通过ChineseBert模块对输入的中文文旅类文本数据进行编码表示,得到特征向量,根据特征向量生成中文文旅类文本数据中每个字的字嵌入向量表示;
其中,所述特征向量包括标记嵌入、位置嵌入和分段嵌入。
3.根据权利要求1所述的中文文旅类的命名实体识别方法,其特征在于,所述S2中,得到上下文表示H的表达式具体为:
H={h1,...,hti,...,hD}
式中,hti为第一~第十二LSTM单元的输出结果进行拼接,ti为拼接的序号,且ti=1,…,D,D为字符向量表示的维度;
所述第一~第十二LSTM单元均包括输入门it、输出门ot和遗忘门ft,其表达式具体为下式:
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc)
ot=σ(Wxoxt+Whoht-1+Wcoct+bo)
ht=ot⊙tanh(ct)
式中,σ(·)为逐元的sigmoid函数,tanh(·)为双曲切线函数,⊙为逐元相乘函数,Wxi、Whi、Wci、Wxf、Whf、Wcf、Wxc、Whc、Wxo、Who和Wco均为权重参数,bi、bf、bc和bo均为偏重参数,ct为记忆细胞,ht为输出结果。
CN202310560194.XA 2023-05-17 2023-05-17 一种中文文旅类的命名实体识别方法 Active CN116579343B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310560194.XA CN116579343B (zh) 2023-05-17 2023-05-17 一种中文文旅类的命名实体识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310560194.XA CN116579343B (zh) 2023-05-17 2023-05-17 一种中文文旅类的命名实体识别方法

Publications (2)

Publication Number Publication Date
CN116579343A CN116579343A (zh) 2023-08-11
CN116579343B true CN116579343B (zh) 2024-06-04

Family

ID=87543867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310560194.XA Active CN116579343B (zh) 2023-05-17 2023-05-17 一种中文文旅类的命名实体识别方法

Country Status (1)

Country Link
CN (1) CN116579343B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021114745A1 (zh) * 2019-12-13 2021-06-17 华南理工大学 一种基于词缀感知的社交媒体命名实体识别方法
CN113408289A (zh) * 2021-06-29 2021-09-17 广东工业大学 一种多特征融合的供应链管理实体知识抽取的方法及***
CN114118099A (zh) * 2021-11-10 2022-03-01 浙江工业大学 一种基于部首特征和多层注意力机制的中文自动问答方法
CN114781380A (zh) * 2022-03-21 2022-07-22 哈尔滨工程大学 一种融合多粒度信息的中文命名实体识别方法、设备和介质
CN115455955A (zh) * 2022-10-18 2022-12-09 昆明理工大学 基于局部和全局字符表征增强的中文命名实体识别方法
CN115600597A (zh) * 2022-10-18 2023-01-13 淮阴工学院(Cn) 基于注意力机制和词内语义融合的命名实体识别方法、装置、***及存储介质
CN115688782A (zh) * 2022-10-26 2023-02-03 成都理工大学 一种基于全局指针和对抗训练的命名实体识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11423304B2 (en) * 2020-01-15 2022-08-23 Beijing Jingdong Shangke Information Technology Co., Ltd. System and method for semantic analysis of multimedia data using attention-based fusion network

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021114745A1 (zh) * 2019-12-13 2021-06-17 华南理工大学 一种基于词缀感知的社交媒体命名实体识别方法
CN113408289A (zh) * 2021-06-29 2021-09-17 广东工业大学 一种多特征融合的供应链管理实体知识抽取的方法及***
CN114118099A (zh) * 2021-11-10 2022-03-01 浙江工业大学 一种基于部首特征和多层注意力机制的中文自动问答方法
CN114781380A (zh) * 2022-03-21 2022-07-22 哈尔滨工程大学 一种融合多粒度信息的中文命名实体识别方法、设备和介质
CN115455955A (zh) * 2022-10-18 2022-12-09 昆明理工大学 基于局部和全局字符表征增强的中文命名实体识别方法
CN115600597A (zh) * 2022-10-18 2023-01-13 淮阴工学院(Cn) 基于注意力机制和词内语义融合的命名实体识别方法、装置、***及存储介质
CN115688782A (zh) * 2022-10-26 2023-02-03 成都理工大学 一种基于全局指针和对抗训练的命名实体识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
路径语义和特征提取相结合的负样本推荐方法;昌燕 等;小型微型计算机***;全文 *

Also Published As

Publication number Publication date
CN116579343A (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
Prasad et al. Neural ParsCit: a deep learning-based reference string parser
CN110765775B (zh) 一种融合语义和标签差异的命名实体识别领域自适应的方法
Nguyen et al. Recurrent neural network-based models for recognizing requisite and effectuation parts in legal texts
CN111160031A (zh) 一种基于词缀感知的社交媒体命名实体识别方法
CN106844349B (zh) 基于协同训练的垃圾评论识别方法
Yaghoobzadeh et al. Multi-level representations for fine-grained typing of knowledge base entities
CN112541356B (zh) 一种生物医学命名实体识别的方法和***
Alsaaran et al. Classical Arabic named entity recognition using variant deep neural network architectures and BERT
CN109960728A (zh) 一种开放域会议信息命名实体识别方法及***
Alsaaran et al. Arabic named entity recognition: A BERT-BGRU approach
CN111950283B (zh) 面向大规模医疗文本挖掘的中文分词和命名实体识别***
Wu et al. Research on Named Entity Recognition of Electronic Medical Records Based on RoBERTa and Radical‐Level Feature
Chang et al. Application of Word Embeddings in Biomedical Named Entity Recognition Tasks.
CN112699685A (zh) 基于标签引导的字词融合的命名实体识别方法
Han et al. MAF‐CNER: A Chinese Named Entity Recognition Model Based on Multifeature Adaptive Fusion
Bach et al. Question analysis towards a Vietnamese question answering system in the education domain
Shu et al. Investigating lstm with k-max pooling for text classification
Seeha et al. ThaiLMCut: Unsupervised pretraining for Thai word segmentation
Tarride et al. A comparative study of information extraction strategies using an attention-based neural network
Zhang et al. Sjtu-nlp at semeval-2018 task 9: Neural hypernym discovery with term embeddings
He et al. A Chinese named entity recognition model of maintenance records for power primary equipment based on progressive multitype feature fusion
CN112507717A (zh) 融合实体关键字特征的医疗领域实体分类方法
CN117131932A (zh) 基于主题模型的领域知识图谱本体半自动构建方法及***
Li et al. An improved Chinese named entity recognition method with TB-LSTM-CRF
CN116579343B (zh) 一种中文文旅类的命名实体识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant