CN109753653A

CN109753653A - 实体名称识别方法、装置、计算机设备和存储介质

Info

Publication number: CN109753653A
Application number: CN201811592664.6A
Authority: CN
Inventors: 曾晶; 邓理平; 陈桓; 张良杰
Original assignee: Kingdee Software China Co Ltd
Current assignee: Kingdee Software China Co Ltd
Priority date: 2018-12-25
Filing date: 2018-12-25
Publication date: 2019-05-14
Anticipated expiration: 2038-12-25
Also published as: CN109753653B

Abstract

本申请涉及一种实体名称识别方法、装置、计算机设备和存储介质。所述方法包括：获取待识别文本中各词语分别对应的词向量；将获取的词向量输入第一双向长短记忆神经网络，得到所述第一双向长短记忆神经网络输出的向量特征；通过名词筛选模型，根据所述向量特征从所述待识别文本中筛选候选实体名称,得到名称候选集合；提取所述名称候选集合中各候选实体名称分别对应的词向量；通过第二双向长短记忆神经网络，根据提取的词向量识别所述名称候选集合中的实体名称。本方法先筛选候选实体名称，再从候选实体名称中识别实体名称，通过两次双向长短记忆神经网络的处理，提高了实体名称识别的准确性。

Description

实体名称识别方法、装置、计算机设备和存储介质

技术领域

本申请涉及模式识别领域，特别是涉及一种实体名称识别方法、装置、计算机设备和存储介质。

背景技术

随着模式识别技术的发展，出现了命名实体识别技术(Named EntityRecognition，NER)，旨在识别出自然语言文本中的专有名词，比如人名、地名、公司名称、组织机构名称等命名实体。

然而，传统的命名实体识别技术，通常是采用基于统计的模型，比如隐马尔科夫模型和支持向量机，需要利用人工标注的语料进行训练，对文本上下文的建模能力较弱，没有考虑到词语在文本中前后顺序的影响，对实体名称识别的准确性较低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高识别准确性的实体名称识别方法、装置、计算机设备和存储介质。

一种实体名称识别方法，所述方法包括：

获取待识别文本中各词语分别对应的词向量；

将获取的词向量输入第一双向长短记忆神经网络，得到所述第一双向长短记忆神经网络输出的向量特征；

通过名词筛选模型，根据所述向量特征从所述待识别文本中筛选候选实体名称,得到名称候选集合；

提取所述名称候选集合中各候选实体名称分别对应的词向量；

通过第二双向长短记忆神经网络，根据提取的词向量识别所述名称候选集合中的实体名称。

一种实体名称识别装置，其特征在于，所述装置包括：

向量获取模块，用于获取待识别文本中各词语分别对应的词向量；

特征得到模块，用于将获取的词向量输入第一双向长短记忆神经网络，得到所述第一双向长短记忆神经网络输出的向量特征；

集合得到模块，用于通过名词筛选模型，根据所述向量特征从所述待识别文本中筛选候选实体名称,得到名称候选集合；

向量提取模块，用于提取所述名称候选集合中各候选实体名称分别对应的词向量；

名称识别模块，用于通过第二双向长短记忆神经网络，根据提取的词向量识别所述名称候选集合中的实体名称。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取待识别文本中各词语分别对应的词向量；

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取待识别文本中各词语分别对应的词向量；

上述实体名称识别方法、装置、计算机设备和存储介质，获取待识别文本中各词语分别对应的词向量，将获取的词向量输入第一双向长短记忆神经网络，通过第一双向长短记忆神经网络得到词向量的向量特征，通过名词筛选模型根据向量特征对词语进行标注，从待识别文本中筛选候选实体名称,得到名称候选集合，即待识别文本中所有可能是实体名称的词语的集合；再提取名称候选集合中各候选实体名称分别对应的词向量，将提取到的词向量输入第二双向长短记忆神经网络进行再一次的识别，根据提取的词向量识别名称候选集合中的实体名称，通过两次双向长短记忆神经网络的处理，提高了实体名称识别的准确性。

附图说明

图1为一个实施例中实体名称识别方法的应用环境图；

图2为一个实施例中实体名称识别方法的流程示意图；

图3为一个实施例中获取词向量的步骤的流程示意图；

图4为一个实施例中向量转换模型的结构示意图；

图5为一个实施例中得到向量特征的步骤的流程示意图；

图6为一个实施例中得到名称候选集合的步骤的流程示意图；

图7为一个实施例中识别实体名称的步骤的流程示意图；

图8为一个实施例中实体名称识别的示意图；

图9为一个实施例中实体名称检测模型的结构示意图；

图10为一个实施例中实体名称确定模型的结构示意图；

图11为一个实施例中实体名称识别装置的结构框图；

图12为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的实体名称识别方法，可以应用于如图1所示的应用环境中，应用环境中可以包括终端102和服务器104，终端102通过网络与服务器104进行通信。该方法既可以应用在终端102，也可以应用于服务器104。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种实体名称识别方法，本实施例以该方法应用于图1中的终端为例进行说明，包括以下步骤：

步骤202，获取待识别文本中各词语分别对应的词向量。

其中，待识别文本是输入终端的，需要提取实体名称的文本。词语是词和语的合称，包括单词、词组及整个词汇。词向量是由单词或短语映射到实数的向量。

具体地，终端获取输入的待识别文本，识别待识别文本中的各词语，并分别对识别到的各词语进行转换，得到与各词语对应的词向量。其中，词向量可以是定长的稠密向量。

在一个实施例中，待识别文本是中文文本，待识别文本也可以是任何语种形式的文本。

在一个实施例中，终端预设有词向量的向量维度，当转换得到的词向量的维度未达到预设的向量维度时，通过在转换得到的词向量末尾补0，使词向量的维度达到预设的向量维度。

步骤204，将获取的词向量输入第一双向长短记忆神经网络，得到第一双向长短记忆神经网络输出的向量特征。

其中，第一双向长短记忆神经网络是提取词向量的向量特征的双向长短记忆神经网络模型。长短记忆神经网络是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟非常长的重要事件；双向长短记忆神经网络(Bi-LSTM，Bi-directional Long-Short Term Memory Recurrent Neural Network)是长短记忆神经网络(LSTM)的变体，由两个单向长短记忆神经网络组成的。在每一个时刻t，输入会同时提供给这两个方向相反的长短记忆神经网络，而输出则是由这两个长短记忆神经网络共同决定。向量特征是第一双向长短记忆神经网络输出的特征数据，可以反映词向量的特征。

具体地，终端将待识别文本中的各词语转换为词向量后，将得到的词向量输入训练好的第一双向长短记忆神经网络中。第一双向长短记忆神经网络对输入的各词向量进行处理，提取各词向量的向量特征。

步骤206，通过名词筛选模型，根据向量特征从待识别文本中筛选候选实体名称,得到名称候选集合。

其中，名词筛选模型是根据提取到的向量特征，从待识别文本中筛选可能是组成实体名称的词语的模型。候选实体名称由一定数量的词语组成，是待识别文本中可能的实体名称。名称候选集合是由全部候选实体名称组成的集合。

具体地，词语与通过词语转换得到的词向量一一对应，词向量与从词向量中提取到的向量特征一一对应，故词语与提取到的向量特征一一对应。终端将提取到的向量特征输入名词筛选模型，名词筛选模型通过向量特征，对词语进行分类，并将可能组成实体名称的词语进行组合，得到候选实体名称，待识别文本中所有候选实体名称组成名称候选集合。

步骤208，提取名称候选集合中各候选实体名称分别对应的词向量。

具体地，终端通过名词筛选模型得到名称候选集合后，提取名称候选集合中的各候选实体名称，并触发向量转换指令，根据向量转换指令，将提取到的各候选实体名称中的词语转换为词向量。

步骤210，通过第二双向长短记忆神经网络，根据提取的词向量识别名称候选集合中的实体名称。

其中，第二双向长短记忆神经网络是从各候选实体名称中，筛选实体名称的模型。实体名称是实体的名称。

具体地，终端将名称候选集合中的各候选实体名称转换为词向量后，将候选实体名称分别对应的词向量输入训练好的第二双向长短记忆神经网络。第二双向长短记忆神经网络对词向量进行处理，识别各候选实体名称中的实体名称，并输出识别到的实体名称。

在一个实施例中，实体名称是公司名称，还可以包括但不限于各种人名、地名、组织机构名。

本实施例中，获取待识别文本中各词语分别对应的词向量，将获取的词向量输入第一双向长短记忆神经网络，通过第一双向长短记忆神经网络得到词向量的向量特征，通过名词筛选模型根据向量特征对词语进行标注，从待识别文本中筛选候选实体名称,得到名称候选集合，即待识别文本中所有可能是实体名称的词语的集合；再提取名称候选集合中各候选识别名称候选实体名称分别对应的词向量，将提取到的词向量输入第二双向长短记忆神经网络进行再一次的识别，根据提取的词向量识别名称候选集合中的实体名称，通过两次双向长短记忆神经网络的处理，提高了实体名称识别的准确性。

如图3所示，在一个实施例中，步骤202具体还包括获取词向量的步骤，该步骤具体包括如下步骤：

步骤302，获取待识别文本。

具体地，终端获取用户输入的待识别文本，并接收触发的名称提取指令，名称提取指令用于指示终端从待识别文本中识别实体名称。

在一个实施例中，终端接收触发的文本文件选择指令，从文本文件选择指令中提取文本文件标识，从文件库中查询与文本文件标识对应的文本文件，从文件库中提取文本文件，将文本文件中的文本作为待识别文本。

在一个实施例中，终端接收用户输入的图片，识别图片中的文字，得到待识别文本。比如，终端可以通过OCR(Optical Character Recognition，光学字符识别)来识别图片中的文字。

步骤304，将待识别文本输入向量转换模型，对待识别文件待识别文本进行词语划分，得到多个词语。

其中，向量转换模型是将待识别文本中的词语转换为词向量的模型。

具体地，终端中预存有训练好的向量转换模型。终端获取到待识别文本后，将待识别文本输入向量转换模型，通过向量转换模型识别待识别文本中的各词语，并对待识别文本进行划分，得到多个词语。

步骤306，对于每个词语进行向量转换，得到每个词语对应的词向量。

具体地，终端通过向量转换模型将待识别文本划分为多个词语后，分别对每个词语进行向量转换，得到每个词语对应的词向量。向量转换模型可以是Word2vec(word tovector，用来产生词向量的相关模型，可用来表示词对词之间的关系)中的连续词袋模型(CBOW，Continuous Bag-of-Words)和Skip-gram模型中的至少一种。

在一个实施例中，向量转换模型的结构如图4所示。向量转换模型可以是连续词袋模型，包括输入层、隐藏层和输出层。终端需要通过训练得到连续词袋模型。终端首先将训练文本划分为多个词语，根据建立好的语料库将各词语分别转换为one-hot向量，one-hot向量为稀疏向量，多个维度中只有一个维度为1，其余均为0。终端从训练文本中选取中心词语，将中心词语对应的one-hot向量作为初始连续词袋模型的期望输出，将中心词语的上下文词语即训练文本中除中心词之外的词语，对应的one-hot向量作为模型输入，训练初始连续词袋模型，训练完毕后得到连续词袋模型。图4中的C表示训练文本中上下文词语的数量；V表示one-hot向量的维度，即语料库中词语的总数；N表示隐藏层节点的数量，N的数值即为待识别文本中各词语分别对应的词向量的维度。

举例说明，训练文本为“今天天气晴朗”，终端将训练文本划分为“今天”、“天气”和“晴朗”三个词语，并选取天气作为中心词。终端将“今天”和“晴朗”转换得到的one-hot向量作为初始连续词袋模型的输入，则C的数值为2；终端将“天气”对应的one-hot向量作为初始连续词袋模型的期望输出；假设语料库中有1000个词语，则V的数值为1000；N的数值为100时，待识别文本中各词语分别对应的词向量的维度为100。

本实施例中，获取待识别文本，并输入向量转换模型，通过向量转换模型将待识别文本进行词语划分为多个词语，再将每个词语进行向量转换，得到每个词语对应的词向量，完成了从自然语言到数据的处理，提升了终端对待识别文本的处理速度。

如图5所示，在一个实施例中，步骤204具体还包括得到向量特征的步骤，该步骤具体包括如下步骤：

步骤502，向第一双向长短记忆神经网络中的前向参考层和后向参考层，分别输入获取的词向量。

其中，前向参考层和后向参考层均是双向长短记忆神经网络中的单向长短记忆神经网络。

具体地，双向长短记忆神经网络由前向参考层和后向参考层组成。对于每一个词向量，终端分别输入双向长短记忆神经网络中的前向参考层和后向参考层中。终端将各词向量输入前向参考层的顺序与输入后向参考层的顺序相反。

步骤504，获取前向参考层和后向参考层输出的前向参考特征和后向参考特征。

其中，前向参考特征是前向参考层提取的词向量的特征数据；后向参考特征是后向参考层提取的词向量的特征数据。

具体地，对于每一个输入的词向量，第一双向长短记忆神经网络中的前向参考层对词向量进行处理，提取词向量的特征数据，得到前向参考特征；后向参考层对词向量进行处理得到后向参考特征。终端获取每个词向量分别对应的前向参考特征和后向参考特征。

步骤506，根据前向参考特征和后向参考特征生成向量特征。

具体地，对于每一个词向量，终端获取到与词向量对应的前向参考特征和后向参考特征后，根据前向参考特征和后向参考特征进行计算，得到向量特征，并将计算得到的向量特征作为第一双向长短记忆神经网络对每一个词向量的输出。

本实施例中，向第一双向长短记忆神经网络中的前向参考层和后向参考层，分别输入获取的词向量，并获取前向参考层和后向参考层输出的前向参考特征和后向参考特征，前向参考特征和后向参考特征互为参考，根据前向参考特征和后向参考特征生成向量特征，提高了生成向量特征的准确性。

如图6所示，在一个实施例中，步骤206具体还包括得到名称候选集合的步骤，该步骤具体包括如下步骤：

步骤602，将向量特征输入名词筛选模型，得到各词语的标注结果。

其中，标注结果是名词筛选模型对各词语进行标注得到的结果。

具体地，终端得到第一双向长短记忆神经网络输出的向量特征后，将向量特征输入名词筛选模型。名词筛选模型对输入的向量特征进行分析处理，根据处理结果对向量特征对应的词语进行标注，得到各词语的标注结果。

在一个实施例中，名词筛选模型可以是条件随机场(Conditional RandomFields，简称CRF)。条件随机场是一种判别式概率模型，是随机场的一种，常用于标注或分析序列资料，如自然语言文字或是生物序列。

步骤604，根据标注结果，从待识别文本中筛选标注为名称组成部分的词语。

具体地，名词筛选模型将各词语标注为名称组成部分和非名称组成部分。标注完成后，终端根据标注结果，从待识别文本中筛选标注为名称组成部分的词语。

步骤606，根据筛选到的词语确定多个候选实体名称，得到名称候选集合。

具体地，标注结果中的名称组成部分又可以分为名称头部组成部分和名称中间组成部分。名称头部组成部分表示词语是可能的实体名称中的首个词语，名称中间组成部分表示词语是可能的实体名称中非首个词语的组成部分。名词筛选模型根据筛选到的词语的标注结果，对词语进行组合，得到多个候选实体名称，并根据多个候选实体名称得到名称候选集合。

举例说明，待识别文本“入职XX软件公司”被分为词语“入职”、“XX”、“软件”和“公司”，名词筛选模型将“入职”标注为O(others，其他)即非名称组成部分，将“XX”、“软件”和“公司”标注为名称组成部分，其中名词筛选模型又将“XX”标注为B-ORG即名称头部组成部分，将“软件”和“公司”标注为I-ORG即名称中间组成部分。名词筛选模型从待识别文本中筛选标注为名称组成部分的“XX”、“软件”和“公司”，并根据标注结果进行组合，得到候选实体名称“XX软件公司”，假设待识别文本中同时存在“中国网球协会”，同样得到候选实体名称“中国网球协会”。候选实体名称“XX软件公司”和“中国网球协会”组成名称候选集合。

本实施例中，将向量特征输入名词筛选模型，得到各词语的标注结果，标注结果标识了词语是否是可能的实体名称的组成部分；根据标注结果，可以从待识别文本中准确地筛选标注为名称组成部分的词语，再根据筛选到的词语确定多个候选实体名称，并得到名称候选集合，提高了获取候选实体名称的准确性。

如图7所示，在一个实施例中，步骤210具体还包括识别实体名称的步骤，该步骤具体包括如下步骤：

步骤702，将每个候选实体名称对应的词向量，输入第二双向长短记忆神经网络。

具体地，对于每一个候选实体名称，终端通过向量转换模型得到候选名称实体中各词语分别对应的词向量后，将各词向量输入第二双向长短记忆神经网络。第二双向长短记忆神经网络同样由前向参考层和后向参考层组成，终端分别将词向量输入前向参考层和后向参考层。

步骤704，获取第二双向长短记忆神经网络，输出的每个候选实体名称对应的识别结果。

具体地，第二双向长短记忆神经网络的前向参考层和后向参考层分别对各词向量进行处理，得到对各词向量的向量处理结果。第二双向长短记忆神经网络获取前向参考层对候选实体名称中各词向量的各向量处理结果，以及后向参考层对候选实体名称中各词向量的各向量处理结果，根据得到的向量处理结果，生成与候选实体名称对应的识别结果，并输出识别结果。

在一个实施例中，识别结果是第二双向长短记忆神经网络的隐藏层和输出层之间的激活函数的输出结果。当候选实体名称是实体名称时，激活函数处于激活状态，输出结果为1；当候选实体名称不是实体名称时，激活函数处于未激活状态，输出结果为0。

步骤706，根据识别结果从名称候选集合中筛选识别到的实体名称。

具体地，终端获取到第二双向长短记忆神经网络的识别结果后，根据识别结果，从名称候选集合中，选取识别结果为实体名称的候选实体名称，得到待识别文本中的实体名称。

举例说明，需要识别的实体名称为中文公司名称，名称候选集合包括“XX软件公司”和“中国网球协会”。则第二双向长短记忆神经网络对“XX软件公司”输出的识别结果为1，对“中国网球协会”输出的识别结果为0。终端筛选识别结果为1的“XX软件公司”作为待识别文本中的实体名称。

本实施例中，将每个候选实体名称对应的词向量，输入第二双向长短记忆神经网络，对候选实体名称进行进一步的识别，获取第二双向长短记忆神经网络，输出的每个候选实体名称对应的识别结果，识别结果标识了候选实体名称是否为需要的实体名称，并根据识别结果从名称候选集合中筛选识别到的实体名称，通过第二次识别，提高了识别实体名称的准确性。

图8为一个实施例中实体名称识别的示意图。具体地，参照图8，对实体名称的识别可以由实体名称检测模型和实体名称确定模型完成。其中，实体名称检测模型用于从待识别文本中筛选候选实体名称,得到名称候选集合；实体名称确定模型用于从候选实体名称中识别实体名称。

实体名称检测模型的结构如图9所示，由向量转换模型、第一双向长短记忆神经网络和名词筛选模型组成。向量转换模型将待识别文本“入职XX软件公司”划分为词语“入职”、“XX”、“软件”和“公司”，并将各词语转换为词向量。终端将词向量分别输入第一双向长短记忆神经网络中的前向参考层和后向参考层，第一双向长短记忆神经网络根据前向参考层和后向参考层输出的前向参考特征和后向参考特征，生成各词向量分别对应的向量特征，并将向量特征输入名词筛选模型。名词筛选模型根据向量特征对各词语进行标注并输出标注结果，将“入职”标注为O即非名称组成部分，将“XX”标注为B-ORG即名称头部组成部分，将“软件”和“公司”标注为I-ORG即名称中间组成部分，筛选到候选名称实体为“XX软件公司”。

在一个实施例中，终端经过训练得到实体名称检测模型，终端获取训练文本和人工标注的候选实体名称，以训练文本为输入，人工标注的候选实体名称作为期望输出，训练初始实体名称检测模型，调整初始实体名称检测模型中各模型的参数，得到实体名称检测模型。

实体名称确定模型的结构如图10所示，由向量转换模型和第二双向长短记忆神经网络组成。向量转换模型将候选名称实体“XX软件公司”划分为词语“XX”、“软件”和“公司”，并将各词语转换为词向量。终端将词向量分别输入第二双向长短记忆神经网络中的前向参考层和后向参考层，获取前向参考层对“XX”、“软件”和“公司”对应的词向量的向量处理结果，以及后向参考层对“XX”、“软件”和“公司”对应的词向量的向量处理结果，根据各参考结果输出识别结果1，表示“XX软件公司”是实体名称。

在一个实施例中，终端经过训练得到实体名称确定模型，终端获取名称候选集合和人工标注的实体名称，名称候选集合中包括多个候选实体名称。终端以名称候选集合中的多个候选实体名称为输入，人工标注的实体名称作为期望输出，训练初始实体名称确定模型，调整初始实体名称确定模型中各模型的参数，得到实体名称确定模型。

应该理解的是，虽然图2-3和5-7的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-3和5-7中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图11所示，提供了一种实体名称识别装置1100，包括：向量获取模块1102、特征得到模块1104、集合得到模块1106、向量提取模块1108和名称识别模块1110，其中：

向量获取模块1102，用于获取待识别文本中各词语分别对应的词向量。

特征得到模块1104，用于将获取的词向量输入第一双向长短记忆神经网络，得到第一双向长短记忆神经网络输出的向量特征。

集合得到模块1106，用于通过名词筛选模型，根据向量特征从待识别文本中筛选候选实体名称,得到名称候选集合。

向量提取模块1108，用于提取名称候选集合中各候选实体名称分别对应的词向量。

名称识别模块1110，用于通过第二双向长短记忆神经网络，根据提取的词向量识别名称候选集合中的实体名称。

在一个实施例中，向量获取模块1102具体包括：文本获取模块、词语得到模块和向量得到模块，其中：

文本获取模块，用于获取待识别文本；

词语得到模块，用于将待识别文本输入向量转换模型，对待识别文本进行词语划分，得到多个词语；

向量得到模块，用于对于每个词语进行向量转换，得到每个词语对应的词向量。

在一个实施例中，特征得到模块1104用于向第一双向长短记忆神经网络中的前向参考层和后向参考层，分别输入获取的词向量；获取前向参考层和后向参考层输出的前向参考特征和后向参考特征；根据前向参考特征和后向参考特征生成向量特征。

在一个实施例中，集合得到模块1106用于将向量特征输入名词筛选模型，得到各词语的标注结果；根据标注结果，从待识别文本中筛选标注为名称组成部分的词语；根据筛选到的词语确定多个候选实体名称，得到名称候选集合。

在一个实施例中，名称识别模块1110具体包括：向量输入模块、结果获取模块和名称筛选模块，其中：

向量输入模块，用于将每个候选实体名称对应的词向量，输入第二双向长短记忆神经网络；

结果获取模块，用于获取第二双向长短记忆神经网络，输出的每个候选实体名称对应的识别结果；

名称筛选模块，用于根据识别结果从名称候选集合中筛选识别到的实体名称。

关于实体名称识别装置的具体限定可以参见上文中对于实体名称识别方法的限定，在此不再赘述。上述实体名称识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图12所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种实体名称识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图12中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：获取待识别文本中各词语分别对应的词向量；将获取的词向量输入第一双向长短记忆神经网络，得到第一双向长短记忆神经网络输出的向量特征；通过名词筛选模型，根据向量特征从待识别文本中筛选候选实体名称,得到名称候选集合；提取名称候选集合中各候选实体名称分别对应的词向量；通过第二双向长短记忆神经网络，根据提取的词向量识别名称候选集合中的实体名称。

在一个实施例中，获取待识别文本中各词语分别对应的词向量包括：获取待识别文本；将待识别文本输入向量转换模型，对待识别文本进行词语划分，得到多个词语；对于每个词语进行向量转换，得到每个词语对应的词向量。

在一个实施例中，将获取的词向量输入第一双向长短记忆神经网络，得到第一双向长短记忆神经网络输出的向量特征包括：向第一双向长短记忆神经网络中的前向参考层和后向参考层，分别输入获取的词向量；获取前向参考层和后向参考层输出的前向参考特征和后向参考特征；根据前向参考特征和后向参考特征生成向量特征。

在一个实施例中，通过名词筛选模型，根据向量特征从待识别文本中筛选候选实体名称,得到名称候选集合包括：将向量特征输入名词筛选模型，得到各词语的标注结果；根据标注结果，从待识别文本中筛选标注为名称组成部分的词语；根据筛选到的词语确定多个候选实体名称，得到名称候选集合。

在一个实施例中，通过第二双向长短记忆神经网络，根据提取的词向量识别名称候选集合中的实体名称包括：将每个候选实体名称对应的词向量，输入第二双向长短记忆神经网络；获取第二双向长短记忆神经网络，输出的每个候选实体名称对应的识别结果；根据识别结果从名称候选集合中筛选识别到的实体名称。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取待识别文本中各词语分别对应的词向量；将获取的词向量输入第一双向长短记忆神经网络，得到第一双向长短记忆神经网络输出的向量特征；通过名词筛选模型，根据向量特征从待识别文本中筛选候选实体名称,得到名称候选集合；提取名称候选集合中各候选实体名称分别对应的词向量；通过第二双向长短记忆神经网络，根据提取的词向量识别名称候选集合中的实体名称。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种实体名称识别方法，所述方法包括：

获取待识别文本中各词语分别对应的词向量；

2.根据权利要求1所述的方法，其特征在于，所述获取待识别文本中各词语分别对应的词向量包括：

获取待识别文本；

将所述待识别文本输入向量转换模型，对所述待识别文本进行词语划分，得到多个词语；

对于每个词语进行向量转换，得到每个词语对应的词向量。

3.根据权利要求1所述的方法，其特征在于，所述将获取的词向量输入第一双向长短记忆神经网络，得到所述第一双向长短记忆神经网络输出的向量特征包括：

向所述第一双向长短记忆神经网络中的前向参考层和后向参考层，分别输入获取的词向量；

获取所述前向参考层和所述后向参考层输出的前向参考特征和后向参考特征；

根据所述前向参考特征和所述后向参考特征生成向量特征。

4.根据权利要求1所述的方法，其特征在于，所述通过名词筛选模型，根据所述向量特征从所述待识别文本中筛选候选实体名称,得到名称候选集合包括：

将所述向量特征输入名词筛选模型，得到各词语的标注结果；

根据所述标注结果，从所述待识别文本中筛选标注为名称组成部分的词语；

根据筛选到的词语确定多个候选实体名称，得到名称候选集合。

5.根据权利要求1所述的方法，其特征在于，所述通过第二双向长短记忆神经网络，根据提取的词向量识别所述名称候选集合中的实体名称包括：

将每个候选实体名称对应的词向量，输入第二双向长短记忆神经网络；

获取所述第二双向长短记忆神经网络，输出的每个候选实体名称对应的识别结果；

根据所述识别结果从所述名称候选集合中筛选识别到的实体名称。

6.一种实体名称识别装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述向量获取模块包括：

文本获取模块，用于获取待识别文本；

词语得到模块，用于将所述待识别文本输入向量转换模型，对所述待识别文本进行词语划分，得到多个词语；

8.根据权利要求6所述的装置，其特征在于，所述名称识别模块包括：

结果获取模块，用于获取所述第二双向长短记忆神经网络，输出的每个候选实体名称对应的识别结果；

名称筛选模块，用于根据所述识别结果从所述名称候选集合中筛选识别到的实体名称。

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。